ia64/lib/flush.S

*4882a593Smuzhiyun/* SPDX-License-Identifier: GPL-2.0-only */
*4882a593Smuzhiyun/*
*4882a593Smuzhiyun * Cache flushing routines.
*4882a593Smuzhiyun *
*4882a593Smuzhiyun * Copyright (C) 1999-2001, 2005 Hewlett-Packard Co
*4882a593Smuzhiyun *	David Mosberger-Tang <davidm@hpl.hp.com>
*4882a593Smuzhiyun *
*4882a593Smuzhiyun * 05/28/05 Zoltan Menyhart	Dynamic stride size
*4882a593Smuzhiyun */
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include <asm/asmmacro.h>
*4882a593Smuzhiyun#include <asm/export.h>
*4882a593Smuzhiyun
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * flush_icache_range(start,end)
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 *	Make i-cache(s) coherent with d-caches.
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 *	Must deal with range from start to end-1 but nothing else (need to
*4882a593Smuzhiyun	 *	be careful not to touch addresses that may be unmapped).
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 *	Note: "in0" and "in1" are preserved for debugging purposes.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	.section .kprobes.text,"ax"
*4882a593SmuzhiyunGLOBAL_ENTRY(flush_icache_range)
*4882a593Smuzhiyun
*4882a593Smuzhiyun	.prologue
*4882a593Smuzhiyun	alloc	r2=ar.pfs,2,0,0,0
*4882a593Smuzhiyun	movl	r3=ia64_i_cache_stride_shift
*4882a593Smuzhiyun 	mov	r21=1
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	ld8	r20=[r3]		// r20: stride shift
*4882a593Smuzhiyun	sub	r22=in1,r0,1		// last byte address
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	shr.u	r23=in0,r20		// start / (stride size)
*4882a593Smuzhiyun	shr.u	r22=r22,r20		// (last byte address) / (stride size)
*4882a593Smuzhiyun	shl	r21=r21,r20		// r21: stride size of the i-cache(s)
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	sub	r8=r22,r23		// number of strides - 1
*4882a593Smuzhiyun	shl	r24=r23,r20		// r24: addresses for "fc.i" =
*4882a593Smuzhiyun					//	"start" rounded down to stride boundary
*4882a593Smuzhiyun	.save	ar.lc,r3
*4882a593Smuzhiyun	mov	r3=ar.lc		// save ar.lc
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	.body
*4882a593Smuzhiyun	mov	ar.lc=r8
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * 32 byte aligned loop, even number of (actually 2) bundles
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun.Loop:	fc.i	r24			// issuable on M0 only
*4882a593Smuzhiyun	add	r24=r21,r24		// we flush "stride size" bytes per iteration
*4882a593Smuzhiyun	nop.i	0
*4882a593Smuzhiyun	br.cloop.sptk.few .Loop
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	sync.i
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	srlz.i
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	mov	ar.lc=r3		// restore ar.lc
*4882a593Smuzhiyun	br.ret.sptk.many rp
*4882a593SmuzhiyunEND(flush_icache_range)
*4882a593SmuzhiyunEXPORT_SYMBOL_GPL(flush_icache_range)
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * clflush_cache_range(start,size)
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 *	Flush cache lines from start to start+size-1.
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 *	Must deal with range from start to start+size-1 but nothing else
*4882a593Smuzhiyun	 *	(need to be careful not to touch addresses that may be
*4882a593Smuzhiyun	 *	unmapped).
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 *	Note: "in0" and "in1" are preserved for debugging purposes.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	.section .kprobes.text,"ax"
*4882a593SmuzhiyunGLOBAL_ENTRY(clflush_cache_range)
*4882a593Smuzhiyun
*4882a593Smuzhiyun	.prologue
*4882a593Smuzhiyun	alloc	r2=ar.pfs,2,0,0,0
*4882a593Smuzhiyun	movl	r3=ia64_cache_stride_shift
*4882a593Smuzhiyun	mov	r21=1
*4882a593Smuzhiyun	add     r22=in1,in0
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	ld8	r20=[r3]		// r20: stride shift
*4882a593Smuzhiyun	sub	r22=r22,r0,1		// last byte address
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	shr.u	r23=in0,r20		// start / (stride size)
*4882a593Smuzhiyun	shr.u	r22=r22,r20		// (last byte address) / (stride size)
*4882a593Smuzhiyun	shl	r21=r21,r20		// r21: stride size of the i-cache(s)
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	sub	r8=r22,r23		// number of strides - 1
*4882a593Smuzhiyun	shl	r24=r23,r20		// r24: addresses for "fc" =
*4882a593Smuzhiyun					//	"start" rounded down to stride
*4882a593Smuzhiyun					//	boundary
*4882a593Smuzhiyun	.save	ar.lc,r3
*4882a593Smuzhiyun	mov	r3=ar.lc		// save ar.lc
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	.body
*4882a593Smuzhiyun	mov	ar.lc=r8
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * 32 byte aligned loop, even number of (actually 2) bundles
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun.Loop_fc:
*4882a593Smuzhiyun	fc	r24		// issuable on M0 only
*4882a593Smuzhiyun	add	r24=r21,r24	// we flush "stride size" bytes per iteration
*4882a593Smuzhiyun	nop.i	0
*4882a593Smuzhiyun	br.cloop.sptk.few .Loop_fc
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	sync.i
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	srlz.i
*4882a593Smuzhiyun	;;
*4882a593Smuzhiyun	mov	ar.lc=r3		// restore ar.lc
*4882a593Smuzhiyun	br.ret.sptk.many rp
*4882a593SmuzhiyunEND(clflush_cache_range)