m68k/math-emu/fp_arith.c

*4882a593Smuzhiyun// SPDX-License-Identifier: GPL-2.0-or-later
*4882a593Smuzhiyun/*
*4882a593Smuzhiyun
*4882a593Smuzhiyun   fp_arith.c: floating-point math routines for the Linux-m68k
*4882a593Smuzhiyun   floating point emulator.
*4882a593Smuzhiyun
*4882a593Smuzhiyun   Copyright (c) 1998-1999 David Huggins-Daines.
*4882a593Smuzhiyun
*4882a593Smuzhiyun   Somewhat based on the AlphaLinux floating point emulator, by David
*4882a593Smuzhiyun   Mosberger-Tang.
*4882a593Smuzhiyun
*4882a593Smuzhiyun */
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include "fp_emu.h"
*4882a593Smuzhiyun#include "multi_arith.h"
*4882a593Smuzhiyun#include "fp_arith.h"
*4882a593Smuzhiyun
*4882a593Smuzhiyunconst struct fp_ext fp_QNaN =
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	.exp = 0x7fff,
*4882a593Smuzhiyun	.mant = { .m64 = ~0 }
*4882a593Smuzhiyun};
*4882a593Smuzhiyun
*4882a593Smuzhiyunconst struct fp_ext fp_Inf =
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	.exp = 0x7fff,
*4882a593Smuzhiyun};
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* let's start with the easy ones */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fabs(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "fabs\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_monadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dest->sign = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fneg(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "fneg\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_monadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dest->sign = !dest->sign;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* Now, the slightly harder ones */
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* fp_fadd: Implements the kernel of the FADD, FSADD, FDADD, FSUB,
*4882a593Smuzhiyun   FDSUB, and FCMP instructions. */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fadd(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	int diff;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dprint(PINSTR, "fadd\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_dyadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (IS_INF(dest)) {
*4882a593Smuzhiyun		/* infinity - infinity == NaN */
*4882a593Smuzhiyun		if (IS_INF(src) && (src->sign != dest->sign))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_INF(src)) {
*4882a593Smuzhiyun		fp_copy_ext(dest, src);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (IS_ZERO(dest)) {
*4882a593Smuzhiyun		if (IS_ZERO(src)) {
*4882a593Smuzhiyun			if (src->sign != dest->sign) {
*4882a593Smuzhiyun				if (FPDATA->rnd == FPCR_ROUND_RM)
*4882a593Smuzhiyun					dest->sign = 1;
*4882a593Smuzhiyun				else
*4882a593Smuzhiyun					dest->sign = 0;
*4882a593Smuzhiyun			}
*4882a593Smuzhiyun		} else
*4882a593Smuzhiyun			fp_copy_ext(dest, src);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dest->lowmant = src->lowmant = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if ((diff = dest->exp - src->exp) > 0)
*4882a593Smuzhiyun		fp_denormalize(src, diff);
*4882a593Smuzhiyun	else if ((diff = -diff) > 0)
*4882a593Smuzhiyun		fp_denormalize(dest, diff);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (dest->sign == src->sign) {
*4882a593Smuzhiyun		if (fp_addmant(dest, src))
*4882a593Smuzhiyun			if (!fp_addcarry(dest))
*4882a593Smuzhiyun				return dest;
*4882a593Smuzhiyun	} else {
*4882a593Smuzhiyun		if (dest->mant.m64 < src->mant.m64) {
*4882a593Smuzhiyun			fp_submant(dest, src, dest);
*4882a593Smuzhiyun			dest->sign = !dest->sign;
*4882a593Smuzhiyun		} else
*4882a593Smuzhiyun			fp_submant(dest, dest, src);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* fp_fsub: Implements the kernel of the FSUB, FSSUB, and FDSUB
*4882a593Smuzhiyun   instructions.
*4882a593Smuzhiyun
*4882a593Smuzhiyun   Remember that the arguments are in assembler-syntax order! */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fsub(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "fsub ");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	src->sign = !src->sign;
*4882a593Smuzhiyun	return fp_fadd(dest, src);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fcmp(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "fcmp ");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	FPDATA->temp[1] = *dest;
*4882a593Smuzhiyun	src->sign = !src->sign;
*4882a593Smuzhiyun	return fp_fadd(&FPDATA->temp[1], src);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_ftst(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "ftst\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	(void)dest;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return src;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fmul(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	union fp_mant128 temp;
*4882a593Smuzhiyun	int exp;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dprint(PINSTR, "fmul\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_dyadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* calculate the correct sign now, as it's necessary for infinities */
*4882a593Smuzhiyun	dest->sign = src->sign ^ dest->sign;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Handle infinities */
*4882a593Smuzhiyun	if (IS_INF(dest)) {
*4882a593Smuzhiyun		if (IS_ZERO(src))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_INF(src)) {
*4882a593Smuzhiyun		if (IS_ZERO(dest))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		else
*4882a593Smuzhiyun			fp_copy_ext(dest, src);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Of course, as we all know, zero * anything = zero.  You may
*4882a593Smuzhiyun	   not have known that it might be a positive or negative
*4882a593Smuzhiyun	   zero... */
*4882a593Smuzhiyun	if (IS_ZERO(dest) || IS_ZERO(src)) {
*4882a593Smuzhiyun		dest->exp = 0;
*4882a593Smuzhiyun		dest->mant.m64 = 0;
*4882a593Smuzhiyun		dest->lowmant = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	exp = dest->exp + src->exp - 0x3ffe;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* shift up the mantissa for denormalized numbers,
*4882a593Smuzhiyun	   so that the highest bit is set, this makes the
*4882a593Smuzhiyun	   shift of the result below easier */
*4882a593Smuzhiyun	if ((long)dest->mant.m32[0] >= 0)
*4882a593Smuzhiyun		exp -= fp_overnormalize(dest);
*4882a593Smuzhiyun	if ((long)src->mant.m32[0] >= 0)
*4882a593Smuzhiyun		exp -= fp_overnormalize(src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* now, do a 64-bit multiply with expansion */
*4882a593Smuzhiyun	fp_multiplymant(&temp, dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* normalize it back to 64 bits and stuff it back into the
*4882a593Smuzhiyun	   destination struct */
*4882a593Smuzhiyun	if ((long)temp.m32[0] > 0) {
*4882a593Smuzhiyun		exp--;
*4882a593Smuzhiyun		fp_putmant128(dest, &temp, 1);
*4882a593Smuzhiyun	} else
*4882a593Smuzhiyun		fp_putmant128(dest, &temp, 0);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (exp >= 0x7fff) {
*4882a593Smuzhiyun		fp_set_ovrflw(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	dest->exp = exp;
*4882a593Smuzhiyun	if (exp < 0) {
*4882a593Smuzhiyun		fp_set_sr(FPSR_EXC_UNFL);
*4882a593Smuzhiyun		fp_denormalize(dest, -exp);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* fp_fdiv: Implements the "kernel" of the FDIV, FSDIV, FDDIV and
*4882a593Smuzhiyun   FSGLDIV instructions.
*4882a593Smuzhiyun
*4882a593Smuzhiyun   Note that the order of the operands is counter-intuitive: instead
*4882a593Smuzhiyun   of src / dest, the result is actually dest / src. */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fdiv(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	union fp_mant128 temp;
*4882a593Smuzhiyun	int exp;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dprint(PINSTR, "fdiv\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_dyadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* calculate the correct sign now, as it's necessary for infinities */
*4882a593Smuzhiyun	dest->sign = src->sign ^ dest->sign;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Handle infinities */
*4882a593Smuzhiyun	if (IS_INF(dest)) {
*4882a593Smuzhiyun		/* infinity / infinity = NaN (quiet, as always) */
*4882a593Smuzhiyun		if (IS_INF(src))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		/* infinity / anything else = infinity (with approprate sign) */
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_INF(src)) {
*4882a593Smuzhiyun		/* anything / infinity = zero (with appropriate sign) */
*4882a593Smuzhiyun		dest->exp = 0;
*4882a593Smuzhiyun		dest->mant.m64 = 0;
*4882a593Smuzhiyun		dest->lowmant = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* zeroes */
*4882a593Smuzhiyun	if (IS_ZERO(dest)) {
*4882a593Smuzhiyun		/* zero / zero = NaN */
*4882a593Smuzhiyun		if (IS_ZERO(src))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		/* zero / anything else = zero */
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_ZERO(src)) {
*4882a593Smuzhiyun		/* anything / zero = infinity (with appropriate sign) */
*4882a593Smuzhiyun		fp_set_sr(FPSR_EXC_DZ);
*4882a593Smuzhiyun		dest->exp = 0x7fff;
*4882a593Smuzhiyun		dest->mant.m64 = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	exp = dest->exp - src->exp + 0x3fff;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* shift up the mantissa for denormalized numbers,
*4882a593Smuzhiyun	   so that the highest bit is set, this makes lots
*4882a593Smuzhiyun	   of things below easier */
*4882a593Smuzhiyun	if ((long)dest->mant.m32[0] >= 0)
*4882a593Smuzhiyun		exp -= fp_overnormalize(dest);
*4882a593Smuzhiyun	if ((long)src->mant.m32[0] >= 0)
*4882a593Smuzhiyun		exp -= fp_overnormalize(src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* now, do the 64-bit divide */
*4882a593Smuzhiyun	fp_dividemant(&temp, dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* normalize it back to 64 bits and stuff it back into the
*4882a593Smuzhiyun	   destination struct */
*4882a593Smuzhiyun	if (!temp.m32[0]) {
*4882a593Smuzhiyun		exp--;
*4882a593Smuzhiyun		fp_putmant128(dest, &temp, 32);
*4882a593Smuzhiyun	} else
*4882a593Smuzhiyun		fp_putmant128(dest, &temp, 31);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (exp >= 0x7fff) {
*4882a593Smuzhiyun		fp_set_ovrflw(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	dest->exp = exp;
*4882a593Smuzhiyun	if (exp < 0) {
*4882a593Smuzhiyun		fp_set_sr(FPSR_EXC_UNFL);
*4882a593Smuzhiyun		fp_denormalize(dest, -exp);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fsglmul(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	int exp;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dprint(PINSTR, "fsglmul\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_dyadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* calculate the correct sign now, as it's necessary for infinities */
*4882a593Smuzhiyun	dest->sign = src->sign ^ dest->sign;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Handle infinities */
*4882a593Smuzhiyun	if (IS_INF(dest)) {
*4882a593Smuzhiyun		if (IS_ZERO(src))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_INF(src)) {
*4882a593Smuzhiyun		if (IS_ZERO(dest))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		else
*4882a593Smuzhiyun			fp_copy_ext(dest, src);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Of course, as we all know, zero * anything = zero.  You may
*4882a593Smuzhiyun	   not have known that it might be a positive or negative
*4882a593Smuzhiyun	   zero... */
*4882a593Smuzhiyun	if (IS_ZERO(dest) || IS_ZERO(src)) {
*4882a593Smuzhiyun		dest->exp = 0;
*4882a593Smuzhiyun		dest->mant.m64 = 0;
*4882a593Smuzhiyun		dest->lowmant = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	exp = dest->exp + src->exp - 0x3ffe;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* do a 32-bit multiply */
*4882a593Smuzhiyun	fp_mul64(dest->mant.m32[0], dest->mant.m32[1],
*4882a593Smuzhiyun		 dest->mant.m32[0] & 0xffffff00,
*4882a593Smuzhiyun		 src->mant.m32[0] & 0xffffff00);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (exp >= 0x7fff) {
*4882a593Smuzhiyun		fp_set_ovrflw(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	dest->exp = exp;
*4882a593Smuzhiyun	if (exp < 0) {
*4882a593Smuzhiyun		fp_set_sr(FPSR_EXC_UNFL);
*4882a593Smuzhiyun		fp_denormalize(dest, -exp);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fsgldiv(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	int exp;
*4882a593Smuzhiyun	unsigned long quot, rem;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dprint(PINSTR, "fsgldiv\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_dyadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* calculate the correct sign now, as it's necessary for infinities */
*4882a593Smuzhiyun	dest->sign = src->sign ^ dest->sign;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Handle infinities */
*4882a593Smuzhiyun	if (IS_INF(dest)) {
*4882a593Smuzhiyun		/* infinity / infinity = NaN (quiet, as always) */
*4882a593Smuzhiyun		if (IS_INF(src))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		/* infinity / anything else = infinity (with approprate sign) */
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_INF(src)) {
*4882a593Smuzhiyun		/* anything / infinity = zero (with appropriate sign) */
*4882a593Smuzhiyun		dest->exp = 0;
*4882a593Smuzhiyun		dest->mant.m64 = 0;
*4882a593Smuzhiyun		dest->lowmant = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* zeroes */
*4882a593Smuzhiyun	if (IS_ZERO(dest)) {
*4882a593Smuzhiyun		/* zero / zero = NaN */
*4882a593Smuzhiyun		if (IS_ZERO(src))
*4882a593Smuzhiyun			fp_set_nan(dest);
*4882a593Smuzhiyun		/* zero / anything else = zero */
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_ZERO(src)) {
*4882a593Smuzhiyun		/* anything / zero = infinity (with appropriate sign) */
*4882a593Smuzhiyun		fp_set_sr(FPSR_EXC_DZ);
*4882a593Smuzhiyun		dest->exp = 0x7fff;
*4882a593Smuzhiyun		dest->mant.m64 = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	exp = dest->exp - src->exp + 0x3fff;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dest->mant.m32[0] &= 0xffffff00;
*4882a593Smuzhiyun	src->mant.m32[0] &= 0xffffff00;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* do the 32-bit divide */
*4882a593Smuzhiyun	if (dest->mant.m32[0] >= src->mant.m32[0]) {
*4882a593Smuzhiyun		fp_sub64(dest->mant, src->mant);
*4882a593Smuzhiyun		fp_div64(quot, rem, dest->mant.m32[0], 0, src->mant.m32[0]);
*4882a593Smuzhiyun		dest->mant.m32[0] = 0x80000000 | (quot >> 1);
*4882a593Smuzhiyun		dest->mant.m32[1] = (quot & 1) | rem;	/* only for rounding */
*4882a593Smuzhiyun	} else {
*4882a593Smuzhiyun		fp_div64(quot, rem, dest->mant.m32[0], 0, src->mant.m32[0]);
*4882a593Smuzhiyun		dest->mant.m32[0] = quot;
*4882a593Smuzhiyun		dest->mant.m32[1] = rem;		/* only for rounding */
*4882a593Smuzhiyun		exp--;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (exp >= 0x7fff) {
*4882a593Smuzhiyun		fp_set_ovrflw(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	dest->exp = exp;
*4882a593Smuzhiyun	if (exp < 0) {
*4882a593Smuzhiyun		fp_set_sr(FPSR_EXC_UNFL);
*4882a593Smuzhiyun		fp_denormalize(dest, -exp);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* fp_roundint: Internal rounding function for use by several of these
*4882a593Smuzhiyun   emulated instructions.
*4882a593Smuzhiyun
*4882a593Smuzhiyun   This one rounds off the fractional part using the rounding mode
*4882a593Smuzhiyun   specified. */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic void fp_roundint(struct fp_ext *dest, int mode)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	union fp_mant64 oldmant;
*4882a593Smuzhiyun	unsigned long mask;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (!fp_normalize_ext(dest))
*4882a593Smuzhiyun		return;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* infinities and zeroes */
*4882a593Smuzhiyun	if (IS_INF(dest) || IS_ZERO(dest))
*4882a593Smuzhiyun		return;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* first truncate the lower bits */
*4882a593Smuzhiyun	oldmant = dest->mant;
*4882a593Smuzhiyun	switch (dest->exp) {
*4882a593Smuzhiyun	case 0 ... 0x3ffe:
*4882a593Smuzhiyun		dest->mant.m64 = 0;
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	case 0x3fff ... 0x401e:
*4882a593Smuzhiyun		dest->mant.m32[0] &= 0xffffffffU << (0x401e - dest->exp);
*4882a593Smuzhiyun		dest->mant.m32[1] = 0;
*4882a593Smuzhiyun		if (oldmant.m64 == dest->mant.m64)
*4882a593Smuzhiyun			return;
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	case 0x401f ... 0x403e:
*4882a593Smuzhiyun		dest->mant.m32[1] &= 0xffffffffU << (0x403e - dest->exp);
*4882a593Smuzhiyun		if (oldmant.m32[1] == dest->mant.m32[1])
*4882a593Smuzhiyun			return;
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	default:
*4882a593Smuzhiyun		return;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	fp_set_sr(FPSR_EXC_INEX2);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* We might want to normalize upwards here... however, since
*4882a593Smuzhiyun	   we know that this is only called on the output of fp_fdiv,
*4882a593Smuzhiyun	   or with the input to fp_fint or fp_fintrz, and the inputs
*4882a593Smuzhiyun	   to all these functions are either normal or denormalized
*4882a593Smuzhiyun	   (no subnormals allowed!), there's really no need.
*4882a593Smuzhiyun
*4882a593Smuzhiyun	   In the case of fp_fdiv, observe that 0x80000000 / 0xffff =
*4882a593Smuzhiyun	   0xffff8000, and the same holds for 128-bit / 64-bit. (i.e. the
*4882a593Smuzhiyun	   smallest possible normal dividend and the largest possible normal
*4882a593Smuzhiyun	   divisor will still produce a normal quotient, therefore, (normal
*4882a593Smuzhiyun	   << 64) / normal is normal in all cases) */
*4882a593Smuzhiyun
*4882a593Smuzhiyun	switch (mode) {
*4882a593Smuzhiyun	case FPCR_ROUND_RN:
*4882a593Smuzhiyun		switch (dest->exp) {
*4882a593Smuzhiyun		case 0 ... 0x3ffd:
*4882a593Smuzhiyun			return;
*4882a593Smuzhiyun		case 0x3ffe:
*4882a593Smuzhiyun			/* As noted above, the input is always normal, so the
*4882a593Smuzhiyun			   guard bit (bit 63) is always set.  therefore, the
*4882a593Smuzhiyun			   only case in which we will NOT round to 1.0 is when
*4882a593Smuzhiyun			   the input is exactly 0.5. */
*4882a593Smuzhiyun			if (oldmant.m64 == (1ULL << 63))
*4882a593Smuzhiyun				return;
*4882a593Smuzhiyun			break;
*4882a593Smuzhiyun		case 0x3fff ... 0x401d:
*4882a593Smuzhiyun			mask = 1 << (0x401d - dest->exp);
*4882a593Smuzhiyun			if (!(oldmant.m32[0] & mask))
*4882a593Smuzhiyun				return;
*4882a593Smuzhiyun			if (oldmant.m32[0] & (mask << 1))
*4882a593Smuzhiyun				break;
*4882a593Smuzhiyun			if (!(oldmant.m32[0] << (dest->exp - 0x3ffd)) &&
*4882a593Smuzhiyun					!oldmant.m32[1])
*4882a593Smuzhiyun				return;
*4882a593Smuzhiyun			break;
*4882a593Smuzhiyun		case 0x401e:
*4882a593Smuzhiyun			if (oldmant.m32[1] & 0x80000000)
*4882a593Smuzhiyun				return;
*4882a593Smuzhiyun			if (oldmant.m32[0] & 1)
*4882a593Smuzhiyun				break;
*4882a593Smuzhiyun			if (!(oldmant.m32[1] << 1))
*4882a593Smuzhiyun				return;
*4882a593Smuzhiyun			break;
*4882a593Smuzhiyun		case 0x401f ... 0x403d:
*4882a593Smuzhiyun			mask = 1 << (0x403d - dest->exp);
*4882a593Smuzhiyun			if (!(oldmant.m32[1] & mask))
*4882a593Smuzhiyun				return;
*4882a593Smuzhiyun			if (oldmant.m32[1] & (mask << 1))
*4882a593Smuzhiyun				break;
*4882a593Smuzhiyun			if (!(oldmant.m32[1] << (dest->exp - 0x401d)))
*4882a593Smuzhiyun				return;
*4882a593Smuzhiyun			break;
*4882a593Smuzhiyun		default:
*4882a593Smuzhiyun			return;
*4882a593Smuzhiyun		}
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	case FPCR_ROUND_RZ:
*4882a593Smuzhiyun		return;
*4882a593Smuzhiyun	default:
*4882a593Smuzhiyun		if (dest->sign ^ (mode - FPCR_ROUND_RM))
*4882a593Smuzhiyun			break;
*4882a593Smuzhiyun		return;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	switch (dest->exp) {
*4882a593Smuzhiyun	case 0 ... 0x3ffe:
*4882a593Smuzhiyun		dest->exp = 0x3fff;
*4882a593Smuzhiyun		dest->mant.m64 = 1ULL << 63;
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	case 0x3fff ... 0x401e:
*4882a593Smuzhiyun		mask = 1 << (0x401e - dest->exp);
*4882a593Smuzhiyun		if (dest->mant.m32[0] += mask)
*4882a593Smuzhiyun			break;
*4882a593Smuzhiyun		dest->mant.m32[0] = 0x80000000;
*4882a593Smuzhiyun		dest->exp++;
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	case 0x401f ... 0x403e:
*4882a593Smuzhiyun		mask = 1 << (0x403e - dest->exp);
*4882a593Smuzhiyun		if (dest->mant.m32[1] += mask)
*4882a593Smuzhiyun			break;
*4882a593Smuzhiyun		if (dest->mant.m32[0] += 1)
*4882a593Smuzhiyun                        break;
*4882a593Smuzhiyun		dest->mant.m32[0] = 0x80000000;
*4882a593Smuzhiyun                dest->exp++;
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* modrem_kernel: Implementation of the FREM and FMOD instructions
*4882a593Smuzhiyun   (which are exactly the same, except for the rounding used on the
*4882a593Smuzhiyun   intermediate value) */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic struct fp_ext *
*4882a593Smuzhiyunmodrem_kernel(struct fp_ext *dest, struct fp_ext *src, int mode)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct fp_ext tmp;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_dyadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Infinities and zeros */
*4882a593Smuzhiyun	if (IS_INF(dest) || IS_ZERO(src)) {
*4882a593Smuzhiyun		fp_set_nan(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_ZERO(dest) || IS_INF(src))
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* FIXME: there is almost certainly a smarter way to do this */
*4882a593Smuzhiyun	fp_copy_ext(&tmp, dest);
*4882a593Smuzhiyun	fp_fdiv(&tmp, src);		/* NOTE: src might be modified */
*4882a593Smuzhiyun	fp_roundint(&tmp, mode);
*4882a593Smuzhiyun	fp_fmul(&tmp, src);
*4882a593Smuzhiyun	fp_fsub(dest, &tmp);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* set the quotient byte */
*4882a593Smuzhiyun	fp_set_quotient((dest->mant.m64 & 0x7f) | (dest->sign << 7));
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* fp_fmod: Implements the kernel of the FMOD instruction.
*4882a593Smuzhiyun
*4882a593Smuzhiyun   Again, the argument order is backwards.  The result, as defined in
*4882a593Smuzhiyun   the Motorola manuals, is:
*4882a593Smuzhiyun
*4882a593Smuzhiyun   fmod(src,dest) = (dest - (src * floor(dest / src))) */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fmod(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "fmod\n");
*4882a593Smuzhiyun	return modrem_kernel(dest, src, FPCR_ROUND_RZ);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* fp_frem: Implements the kernel of the FREM instruction.
*4882a593Smuzhiyun
*4882a593Smuzhiyun   frem(src,dest) = (dest - (src * round(dest / src)))
*4882a593Smuzhiyun */
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_frem(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "frem\n");
*4882a593Smuzhiyun	return modrem_kernel(dest, src, FPCR_ROUND_RN);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fint(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "fint\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_copy_ext(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_roundint(dest, FPDATA->rnd);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fintrz(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dprint(PINSTR, "fintrz\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_copy_ext(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_roundint(dest, FPCR_ROUND_RZ);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct fp_ext *
*4882a593Smuzhiyunfp_fscale(struct fp_ext *dest, struct fp_ext *src)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	int scale, oldround;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dprint(PINSTR, "fscale\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fp_dyadic_check(dest, src);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Infinities */
*4882a593Smuzhiyun	if (IS_INF(src)) {
*4882a593Smuzhiyun		fp_set_nan(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	if (IS_INF(dest))
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* zeroes */
*4882a593Smuzhiyun	if (IS_ZERO(src) || IS_ZERO(dest))
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Source exponent out of range */
*4882a593Smuzhiyun	if (src->exp >= 0x400c) {
*4882a593Smuzhiyun		fp_set_ovrflw(dest);
*4882a593Smuzhiyun		return dest;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* src must be rounded with round to zero. */
*4882a593Smuzhiyun	oldround = FPDATA->rnd;
*4882a593Smuzhiyun	FPDATA->rnd = FPCR_ROUND_RZ;
*4882a593Smuzhiyun	scale = fp_conv_ext2long(src);
*4882a593Smuzhiyun	FPDATA->rnd = oldround;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* new exponent */
*4882a593Smuzhiyun	scale += dest->exp;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (scale >= 0x7fff) {
*4882a593Smuzhiyun		fp_set_ovrflw(dest);
*4882a593Smuzhiyun	} else if (scale <= 0) {
*4882a593Smuzhiyun		fp_set_sr(FPSR_EXC_UNFL);
*4882a593Smuzhiyun		fp_denormalize(dest, -scale);
*4882a593Smuzhiyun	} else
*4882a593Smuzhiyun		dest->exp = scale;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return dest;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun