include/asm/delay.h

*4882a593Smuzhiyun/* SPDX-License-Identifier: GPL-2.0-only */
*4882a593Smuzhiyun/*
*4882a593Smuzhiyun * Copyright (C) 2004, 2007-2010, 2011-2012 Synopsys, Inc. (www.synopsys.com)
*4882a593Smuzhiyun *
*4882a593Smuzhiyun * Delay routines using pre computed loops_per_jiffy value.
*4882a593Smuzhiyun *
*4882a593Smuzhiyun * vineetg: Feb 2012
*4882a593Smuzhiyun *  -Rewrote in "C" to avoid dealing with availability of H/w MPY
*4882a593Smuzhiyun *  -Also reduced the num of MPY operations from 3 to 2
*4882a593Smuzhiyun *
*4882a593Smuzhiyun * Amit Bhor: Codito Technologies 2004
*4882a593Smuzhiyun */
*4882a593Smuzhiyun
*4882a593Smuzhiyun#ifndef __ASM_ARC_UDELAY_H
*4882a593Smuzhiyun#define __ASM_ARC_UDELAY_H
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include <asm-generic/types.h>
*4882a593Smuzhiyun#include <asm/param.h>		/* HZ */
*4882a593Smuzhiyun
*4882a593Smuzhiyunextern unsigned long loops_per_jiffy;
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic inline void __delay(unsigned long loops)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	__asm__ __volatile__(
*4882a593Smuzhiyun	"	mov lp_count, %0	\n"
*4882a593Smuzhiyun	"	lp  1f			\n"
*4882a593Smuzhiyun	"	nop			\n"
*4882a593Smuzhiyun	"1:				\n"
*4882a593Smuzhiyun	:
*4882a593Smuzhiyun        : "r"(loops)
*4882a593Smuzhiyun        : "lp_count");
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunextern void __bad_udelay(void);
*4882a593Smuzhiyun
*4882a593Smuzhiyun/*
*4882a593Smuzhiyun * Normal Math for computing loops in "N" usecs
*4882a593Smuzhiyun *  -we have precomputed @loops_per_jiffy
*4882a593Smuzhiyun *  -1 sec has HZ jiffies
*4882a593Smuzhiyun * loops per "N" usecs = ((loops_per_jiffy * HZ / 1000000) * N)
*4882a593Smuzhiyun *
*4882a593Smuzhiyun * Approximate Division by multiplication:
*4882a593Smuzhiyun *  -Mathematically if we multiply and divide a number by same value the
*4882a593Smuzhiyun *   result remains unchanged:  In this case, we use 2^32
*4882a593Smuzhiyun *  -> (loops_per_N_usec * 2^32 ) / 2^32
*4882a593Smuzhiyun *  -> (((loops_per_jiffy * HZ / 1000000) * N) * 2^32) / 2^32
*4882a593Smuzhiyun *  -> (loops_per_jiffy * HZ * N * 4295) / 2^32
*4882a593Smuzhiyun *
*4882a593Smuzhiyun *  -Divide by 2^32 is very simply right shift by 32
*4882a593Smuzhiyun *  -We simply need to ensure that the multiply per above eqn happens in
*4882a593Smuzhiyun *   64-bit precision (if CPU doesn't support it - gcc can emaulate it)
*4882a593Smuzhiyun */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic inline void __udelay(unsigned long usecs)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	unsigned long loops;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* (u64) cast ensures 64 bit MPY - real or emulated
*4882a593Smuzhiyun	 * HZ * 4295 is pre-evaluated by gcc - hence only 2 mpy ops
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	loops = ((u64) usecs * 4295 * HZ * loops_per_jiffy) >> 32;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	__delay(loops);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define udelay(n) (__builtin_constant_p(n) ? ((n) > 20000 ? __bad_udelay() \
*4882a593Smuzhiyun				: __udelay(n)) : __udelay(n))
*4882a593Smuzhiyun
*4882a593Smuzhiyun#endif /* __ASM_ARC_UDELAY_H */