include/asm/sfp-machine.h

*4882a593Smuzhiyun/* SPDX-License-Identifier: GPL-2.0 */
*4882a593Smuzhiyun/* Copyright (C) 2005-2018 Andes Technology Corporation */
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include <asm/bitfield.h>
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define _FP_W_TYPE_SIZE		32
*4882a593Smuzhiyun#define _FP_W_TYPE		unsigned long
*4882a593Smuzhiyun#define _FP_WS_TYPE		signed long
*4882a593Smuzhiyun#define _FP_I_TYPE		long
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define __ll_B ((UWtype) 1 << (W_TYPE_SIZE / 2))
*4882a593Smuzhiyun#define __ll_lowpart(t) ((UWtype) (t) & (__ll_B - 1))
*4882a593Smuzhiyun#define __ll_highpart(t) ((UWtype) (t) >> (W_TYPE_SIZE / 2))
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define _FP_MUL_MEAT_S(R, X, Y)				\
*4882a593Smuzhiyun	_FP_MUL_MEAT_1_wide(_FP_WFRACBITS_S, R, X, Y, umul_ppmm)
*4882a593Smuzhiyun#define _FP_MUL_MEAT_D(R, X, Y)				\
*4882a593Smuzhiyun	_FP_MUL_MEAT_2_wide(_FP_WFRACBITS_D, R, X, Y, umul_ppmm)
*4882a593Smuzhiyun#define _FP_MUL_MEAT_Q(R, X, Y)				\
*4882a593Smuzhiyun	_FP_MUL_MEAT_4_wide(_FP_WFRACBITS_Q, R, X, Y, umul_ppmm)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define _FP_MUL_MEAT_DW_S(R, X, Y)			\
*4882a593Smuzhiyun	_FP_MUL_MEAT_DW_1_wide(_FP_WFRACBITS_S, R, X, Y, umul_ppmm)
*4882a593Smuzhiyun#define _FP_MUL_MEAT_DW_D(R, X, Y)			\
*4882a593Smuzhiyun	_FP_MUL_MEAT_DW_2_wide(_FP_WFRACBITS_D, R, X, Y, umul_ppmm)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define _FP_DIV_MEAT_S(R, X, Y)	_FP_DIV_MEAT_1_udiv_norm(S, R, X, Y)
*4882a593Smuzhiyun#define _FP_DIV_MEAT_D(R, X, Y)	_FP_DIV_MEAT_2_udiv(D, R, X, Y)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define _FP_NANFRAC_S		((_FP_QNANBIT_S << 1) - 1)
*4882a593Smuzhiyun#define _FP_NANFRAC_D		((_FP_QNANBIT_D << 1) - 1), -1
*4882a593Smuzhiyun#define _FP_NANFRAC_Q		((_FP_QNANBIT_Q << 1) - 1), -1, -1, -1
*4882a593Smuzhiyun#define _FP_NANSIGN_S		0
*4882a593Smuzhiyun#define _FP_NANSIGN_D		0
*4882a593Smuzhiyun#define _FP_NANSIGN_Q		0
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define _FP_KEEPNANFRACP 1
*4882a593Smuzhiyun#define _FP_QNANNEGATEDP 0
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define _FP_CHOOSENAN(fs, wc, R, X, Y, OP)			\
*4882a593Smuzhiyundo {								\
*4882a593Smuzhiyun	if ((_FP_FRAC_HIGH_RAW_##fs(X) & _FP_QNANBIT_##fs)	\
*4882a593Smuzhiyun	  && !(_FP_FRAC_HIGH_RAW_##fs(Y) & _FP_QNANBIT_##fs)) { \
*4882a593Smuzhiyun		R##_s = Y##_s;					\
*4882a593Smuzhiyun		_FP_FRAC_COPY_##wc(R, Y);			\
*4882a593Smuzhiyun	} else {						\
*4882a593Smuzhiyun		R##_s = X##_s;					\
*4882a593Smuzhiyun		_FP_FRAC_COPY_##wc(R, X);			\
*4882a593Smuzhiyun	}							\
*4882a593Smuzhiyun	R##_c = FP_CLS_NAN;					\
*4882a593Smuzhiyun} while (0)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define __FPU_FPCSR	(current->thread.fpu.fpcsr)
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* Obtain the current rounding mode. */
*4882a593Smuzhiyun#define FP_ROUNDMODE                    \
*4882a593Smuzhiyun({                                      \
*4882a593Smuzhiyun	__FPU_FPCSR & FPCSR_mskRM;      \
*4882a593Smuzhiyun})
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define FP_RND_NEAREST		0
*4882a593Smuzhiyun#define FP_RND_PINF		1
*4882a593Smuzhiyun#define FP_RND_MINF		2
*4882a593Smuzhiyun#define FP_RND_ZERO		3
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define FP_EX_INVALID		FPCSR_mskIVO
*4882a593Smuzhiyun#define FP_EX_DIVZERO		FPCSR_mskDBZ
*4882a593Smuzhiyun#define FP_EX_OVERFLOW		FPCSR_mskOVF
*4882a593Smuzhiyun#define FP_EX_UNDERFLOW		FPCSR_mskUDF
*4882a593Smuzhiyun#define FP_EX_INEXACT		FPCSR_mskIEX
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define SF_CEQ	2
*4882a593Smuzhiyun#define SF_CLT	1
*4882a593Smuzhiyun#define SF_CGT	3
*4882a593Smuzhiyun#define SF_CUN	4
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include <asm/byteorder.h>
*4882a593Smuzhiyun
*4882a593Smuzhiyun#ifdef __BIG_ENDIAN__
*4882a593Smuzhiyun#define __BYTE_ORDER __BIG_ENDIAN
*4882a593Smuzhiyun#define __LITTLE_ENDIAN 0
*4882a593Smuzhiyun#else
*4882a593Smuzhiyun#define __BYTE_ORDER __LITTLE_ENDIAN
*4882a593Smuzhiyun#define __BIG_ENDIAN 0
*4882a593Smuzhiyun#endif
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define abort() do { } while (0)
*4882a593Smuzhiyun#define umul_ppmm(w1, w0, u, v)						\
*4882a593Smuzhiyundo {									\
*4882a593Smuzhiyun	UWtype __x0, __x1, __x2, __x3;                                  \
*4882a593Smuzhiyun	UHWtype __ul, __vl, __uh, __vh;                                 \
*4882a593Smuzhiyun									\
*4882a593Smuzhiyun	__ul = __ll_lowpart(u);						\
*4882a593Smuzhiyun	__uh = __ll_highpart(u);					\
*4882a593Smuzhiyun	__vl = __ll_lowpart(v);						\
*4882a593Smuzhiyun	__vh = __ll_highpart(v);					\
*4882a593Smuzhiyun									\
*4882a593Smuzhiyun	__x0 = (UWtype) __ul * __vl;                                    \
*4882a593Smuzhiyun	__x1 = (UWtype) __ul * __vh;                                    \
*4882a593Smuzhiyun	__x2 = (UWtype) __uh * __vl;                                    \
*4882a593Smuzhiyun	__x3 = (UWtype) __uh * __vh;                                    \
*4882a593Smuzhiyun									\
*4882a593Smuzhiyun	__x1 += __ll_highpart(__x0);					\
*4882a593Smuzhiyun	__x1 += __x2;							\
*4882a593Smuzhiyun	if (__x1 < __x2)						\
*4882a593Smuzhiyun		__x3 += __ll_B;						\
*4882a593Smuzhiyun									\
*4882a593Smuzhiyun	(w1) = __x3 + __ll_highpart(__x1);				\
*4882a593Smuzhiyun	(w0) = __ll_lowpart(__x1) * __ll_B + __ll_lowpart(__x0);	\
*4882a593Smuzhiyun} while (0)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define add_ssaaaa(sh, sl, ah, al, bh, bl) \
*4882a593Smuzhiyundo { \
*4882a593Smuzhiyun	UWtype __x; \
*4882a593Smuzhiyun	__x = (al) + (bl); \
*4882a593Smuzhiyun	(sh) = (ah) + (bh) + (__x < (al)); \
*4882a593Smuzhiyun	(sl) = __x; \
*4882a593Smuzhiyun} while (0)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define sub_ddmmss(sh, sl, ah, al, bh, bl) \
*4882a593Smuzhiyundo { \
*4882a593Smuzhiyun	UWtype __x; \
*4882a593Smuzhiyun	__x = (al) - (bl); \
*4882a593Smuzhiyun	(sh) = (ah) - (bh) - (__x > (al)); \
*4882a593Smuzhiyun	(sl) = __x; \
*4882a593Smuzhiyun} while (0)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define udiv_qrnnd(q, r, n1, n0, d)				\
*4882a593Smuzhiyundo {								\
*4882a593Smuzhiyun	UWtype __d1, __d0, __q1, __q0, __r1, __r0, __m;		\
*4882a593Smuzhiyun	__d1 = __ll_highpart(d);				\
*4882a593Smuzhiyun	__d0 = __ll_lowpart(d);					\
*4882a593Smuzhiyun								\
*4882a593Smuzhiyun	__r1 = (n1) % __d1;					\
*4882a593Smuzhiyun	__q1 = (n1) / __d1;					\
*4882a593Smuzhiyun	__m = (UWtype) __q1 * __d0;				\
*4882a593Smuzhiyun	__r1 = __r1 * __ll_B | __ll_highpart(n0);		\
*4882a593Smuzhiyun	if (__r1 < __m)	{					\
*4882a593Smuzhiyun		__q1--, __r1 += (d);				\
*4882a593Smuzhiyun		if (__r1 >= (d))				\
*4882a593Smuzhiyun			if (__r1 < __m)				\
*4882a593Smuzhiyun				__q1--, __r1 += (d);		\
*4882a593Smuzhiyun	}							\
*4882a593Smuzhiyun	__r1 -= __m;						\
*4882a593Smuzhiyun	__r0 = __r1 % __d1;					\
*4882a593Smuzhiyun	__q0 = __r1 / __d1;					\
*4882a593Smuzhiyun	__m = (UWtype) __q0 * __d0;				\
*4882a593Smuzhiyun	__r0 = __r0 * __ll_B | __ll_lowpart(n0);		\
*4882a593Smuzhiyun	if (__r0 < __m)	{					\
*4882a593Smuzhiyun		__q0--, __r0 += (d);				\
*4882a593Smuzhiyun		if (__r0 >= (d))				\
*4882a593Smuzhiyun			if (__r0 < __m)				\
*4882a593Smuzhiyun				__q0--, __r0 += (d);		\
*4882a593Smuzhiyun	}							\
*4882a593Smuzhiyun	__r0 -= __m;						\
*4882a593Smuzhiyun	(q) = (UWtype) __q1 * __ll_B | __q0;			\
*4882a593Smuzhiyun	(r) = __r0;						\
*4882a593Smuzhiyun} while (0)