m68k/fpsp040/scosh.S

*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	scosh.sa 3.1 12/10/90
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	The entry point sCosh computes the hyperbolic cosine of
*4882a593Smuzhiyun|	an input argument; sCoshd does the same except for denormalized
*4882a593Smuzhiyun|	input.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	Input: Double-extended number X in location pointed to
*4882a593Smuzhiyun|		by address register a0.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	Output: The value cosh(X) returned in floating-point register Fp0.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	Accuracy and Monotonicity: The returned result is within 3 ulps in
*4882a593Smuzhiyun|		64 significant bit, i.e. within 0.5001 ulp to 53 bits if the
*4882a593Smuzhiyun|		result is subsequently rounded to double precision. The
*4882a593Smuzhiyun|		result is provably monotonic in double precision.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	Speed: The program sCOSH takes approximately 250 cycles.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	Algorithm:
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	COSH
*4882a593Smuzhiyun|	1. If |X| > 16380 log2, go to 3.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	2. (|X| <= 16380 log2) Cosh(X) is obtained by the formulae
*4882a593Smuzhiyun|		y = |X|, z = exp(Y), and
*4882a593Smuzhiyun|		cosh(X) = (1/2)*( z + 1/z ).
*4882a593Smuzhiyun|		Exit.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	3. (|X| > 16380 log2). If |X| > 16480 log2, go to 5.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	4. (16380 log2 < |X| <= 16480 log2)
*4882a593Smuzhiyun|		cosh(X) = sign(X) * exp(|X|)/2.
*4882a593Smuzhiyun|		However, invoking exp(|X|) may cause premature overflow.
*4882a593Smuzhiyun|		Thus, we calculate sinh(X) as follows:
*4882a593Smuzhiyun|		Y	:= |X|
*4882a593Smuzhiyun|		Fact	:=	2**(16380)
*4882a593Smuzhiyun|		Y'	:= Y - 16381 log2
*4882a593Smuzhiyun|		cosh(X) := Fact * exp(Y').
*4882a593Smuzhiyun|		Exit.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|	5. (|X| > 16480 log2) sinh(X) must overflow. Return
*4882a593Smuzhiyun|		Huge*Huge to generate overflow and an infinity with
*4882a593Smuzhiyun|		the appropriate sign. Huge is the largest finite number in
*4882a593Smuzhiyun|		extended format. Exit.
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|
*4882a593Smuzhiyun
*4882a593Smuzhiyun|		Copyright (C) Motorola, Inc. 1990
*4882a593Smuzhiyun|			All Rights Reserved
*4882a593Smuzhiyun|
*4882a593Smuzhiyun|       For details on the license for this file, please see the
*4882a593Smuzhiyun|       file, README, in this same directory.
*4882a593Smuzhiyun
*4882a593Smuzhiyun|SCOSH	idnt	2,1 | Motorola 040 Floating Point Software Package
*4882a593Smuzhiyun
*4882a593Smuzhiyun	|section	8
*4882a593Smuzhiyun
*4882a593Smuzhiyun	|xref	t_ovfl
*4882a593Smuzhiyun	|xref	t_frcinx
*4882a593Smuzhiyun	|xref	setox
*4882a593Smuzhiyun
*4882a593SmuzhiyunT1:	.long 0x40C62D38,0xD3D64634 | ... 16381 LOG2 LEAD
*4882a593SmuzhiyunT2:	.long 0x3D6F90AE,0xB1E75CC7 | ... 16381 LOG2 TRAIL
*4882a593Smuzhiyun
*4882a593SmuzhiyunTWO16380: .long 0x7FFB0000,0x80000000,0x00000000,0x00000000
*4882a593Smuzhiyun
*4882a593Smuzhiyun	.global	scoshd
*4882a593Smuzhiyunscoshd:
*4882a593Smuzhiyun|--COSH(X) = 1 FOR DENORMALIZED X
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fmoves		#0x3F800000,%fp0
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fmovel		%d1,%FPCR
*4882a593Smuzhiyun	fadds		#0x00800000,%fp0
*4882a593Smuzhiyun	bra		t_frcinx
*4882a593Smuzhiyun
*4882a593Smuzhiyun	.global	scosh
*4882a593Smuzhiyunscosh:
*4882a593Smuzhiyun	fmovex		(%a0),%fp0	| ...LOAD INPUT
*4882a593Smuzhiyun
*4882a593Smuzhiyun	movel		(%a0),%d0
*4882a593Smuzhiyun	movew		4(%a0),%d0
*4882a593Smuzhiyun	andil		#0x7FFFFFFF,%d0
*4882a593Smuzhiyun	cmpil		#0x400CB167,%d0
*4882a593Smuzhiyun	bgts		COSHBIG
*4882a593Smuzhiyun
*4882a593Smuzhiyun|--THIS IS THE USUAL CASE, |X| < 16380 LOG2
*4882a593Smuzhiyun|--COSH(X) = (1/2) * ( EXP(X) + 1/EXP(X) )
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fabsx		%fp0		| ...|X|
*4882a593Smuzhiyun
*4882a593Smuzhiyun	movel		%d1,-(%sp)
*4882a593Smuzhiyun	clrl		%d1
*4882a593Smuzhiyun	fmovemx	%fp0-%fp0,(%a0)	|pass parameter to setox
*4882a593Smuzhiyun	bsr		setox		| ...FP0 IS EXP(|X|)
*4882a593Smuzhiyun	fmuls		#0x3F000000,%fp0	| ...(1/2)EXP(|X|)
*4882a593Smuzhiyun	movel		(%sp)+,%d1
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fmoves		#0x3E800000,%fp1	| ...(1/4)
*4882a593Smuzhiyun	fdivx		%fp0,%fp1		| ...1/(2 EXP(|X|))
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fmovel		%d1,%FPCR
*4882a593Smuzhiyun	faddx		%fp1,%fp0
*4882a593Smuzhiyun
*4882a593Smuzhiyun	bra		t_frcinx
*4882a593Smuzhiyun
*4882a593SmuzhiyunCOSHBIG:
*4882a593Smuzhiyun	cmpil		#0x400CB2B3,%d0
*4882a593Smuzhiyun	bgts		COSHHUGE
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fabsx		%fp0
*4882a593Smuzhiyun	fsubd		T1(%pc),%fp0		| ...(|X|-16381LOG2_LEAD)
*4882a593Smuzhiyun	fsubd		T2(%pc),%fp0		| ...|X| - 16381 LOG2, ACCURATE
*4882a593Smuzhiyun
*4882a593Smuzhiyun	movel		%d1,-(%sp)
*4882a593Smuzhiyun	clrl		%d1
*4882a593Smuzhiyun	fmovemx	%fp0-%fp0,(%a0)
*4882a593Smuzhiyun	bsr		setox
*4882a593Smuzhiyun	fmovel		(%sp)+,%fpcr
*4882a593Smuzhiyun
*4882a593Smuzhiyun	fmulx		TWO16380(%pc),%fp0
*4882a593Smuzhiyun	bra		t_frcinx
*4882a593Smuzhiyun
*4882a593SmuzhiyunCOSHHUGE:
*4882a593Smuzhiyun	fmovel		#0,%fpsr		|clr N bit if set by source
*4882a593Smuzhiyun	bclrb		#7,(%a0)		|always return positive value
*4882a593Smuzhiyun	fmovemx	(%a0),%fp0-%fp0
*4882a593Smuzhiyun	bra		t_ovfl
*4882a593Smuzhiyun
*4882a593Smuzhiyun	|end