mips/mm/context.c

*4882a593Smuzhiyun// SPDX-License-Identifier: GPL-2.0
*4882a593Smuzhiyun#include <linux/atomic.h>
*4882a593Smuzhiyun#include <linux/mmu_context.h>
*4882a593Smuzhiyun#include <linux/percpu.h>
*4882a593Smuzhiyun#include <linux/spinlock.h>
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic DEFINE_RAW_SPINLOCK(cpu_mmid_lock);
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic atomic64_t mmid_version;
*4882a593Smuzhiyunstatic unsigned int num_mmids;
*4882a593Smuzhiyunstatic unsigned long *mmid_map;
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic DEFINE_PER_CPU(u64, reserved_mmids);
*4882a593Smuzhiyunstatic cpumask_t tlb_flush_pending;
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic bool asid_versions_eq(int cpu, u64 a, u64 b)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	return ((a ^ b) & asid_version_mask(cpu)) == 0;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunvoid get_new_mmu_context(struct mm_struct *mm)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	unsigned int cpu;
*4882a593Smuzhiyun	u64 asid;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * This function is specific to ASIDs, and should not be called when
*4882a593Smuzhiyun	 * MMIDs are in use.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	if (WARN_ON(IS_ENABLED(CONFIG_DEBUG_VM) && cpu_has_mmid))
*4882a593Smuzhiyun		return;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	cpu = smp_processor_id();
*4882a593Smuzhiyun	asid = asid_cache(cpu);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (!((asid += cpu_asid_inc()) & cpu_asid_mask(&cpu_data[cpu]))) {
*4882a593Smuzhiyun		if (cpu_has_vtag_icache)
*4882a593Smuzhiyun			flush_icache_all();
*4882a593Smuzhiyun		local_flush_tlb_all();	/* start new asid cycle */
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	set_cpu_context(cpu, mm, asid);
*4882a593Smuzhiyun	asid_cache(cpu) = asid;
*4882a593Smuzhiyun}
*4882a593SmuzhiyunEXPORT_SYMBOL_GPL(get_new_mmu_context);
*4882a593Smuzhiyun
*4882a593Smuzhiyunvoid check_mmu_context(struct mm_struct *mm)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	unsigned int cpu = smp_processor_id();
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * This function is specific to ASIDs, and should not be called when
*4882a593Smuzhiyun	 * MMIDs are in use.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	if (WARN_ON(IS_ENABLED(CONFIG_DEBUG_VM) && cpu_has_mmid))
*4882a593Smuzhiyun		return;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Check if our ASID is of an older version and thus invalid */
*4882a593Smuzhiyun	if (!asid_versions_eq(cpu, cpu_context(cpu, mm), asid_cache(cpu)))
*4882a593Smuzhiyun		get_new_mmu_context(mm);
*4882a593Smuzhiyun}
*4882a593SmuzhiyunEXPORT_SYMBOL_GPL(check_mmu_context);
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic void flush_context(void)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	u64 mmid;
*4882a593Smuzhiyun	int cpu;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Update the list of reserved MMIDs and the MMID bitmap */
*4882a593Smuzhiyun	bitmap_clear(mmid_map, 0, num_mmids);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Reserve an MMID for kmap/wired entries */
*4882a593Smuzhiyun	__set_bit(MMID_KERNEL_WIRED, mmid_map);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	for_each_possible_cpu(cpu) {
*4882a593Smuzhiyun		mmid = xchg_relaxed(&cpu_data[cpu].asid_cache, 0);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		/*
*4882a593Smuzhiyun		 * If this CPU has already been through a
*4882a593Smuzhiyun		 * rollover, but hasn't run another task in
*4882a593Smuzhiyun		 * the meantime, we must preserve its reserved
*4882a593Smuzhiyun		 * MMID, as this is the only trace we have of
*4882a593Smuzhiyun		 * the process it is still running.
*4882a593Smuzhiyun		 */
*4882a593Smuzhiyun		if (mmid == 0)
*4882a593Smuzhiyun			mmid = per_cpu(reserved_mmids, cpu);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		__set_bit(mmid & cpu_asid_mask(&cpu_data[cpu]), mmid_map);
*4882a593Smuzhiyun		per_cpu(reserved_mmids, cpu) = mmid;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Queue a TLB invalidation for each CPU to perform on next
*4882a593Smuzhiyun	 * context-switch
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	cpumask_setall(&tlb_flush_pending);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic bool check_update_reserved_mmid(u64 mmid, u64 newmmid)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	bool hit;
*4882a593Smuzhiyun	int cpu;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Iterate over the set of reserved MMIDs looking for a match.
*4882a593Smuzhiyun	 * If we find one, then we can update our mm to use newmmid
*4882a593Smuzhiyun	 * (i.e. the same MMID in the current generation) but we can't
*4882a593Smuzhiyun	 * exit the loop early, since we need to ensure that all copies
*4882a593Smuzhiyun	 * of the old MMID are updated to reflect the mm. Failure to do
*4882a593Smuzhiyun	 * so could result in us missing the reserved MMID in a future
*4882a593Smuzhiyun	 * generation.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	hit = false;
*4882a593Smuzhiyun	for_each_possible_cpu(cpu) {
*4882a593Smuzhiyun		if (per_cpu(reserved_mmids, cpu) == mmid) {
*4882a593Smuzhiyun			hit = true;
*4882a593Smuzhiyun			per_cpu(reserved_mmids, cpu) = newmmid;
*4882a593Smuzhiyun		}
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return hit;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic u64 get_new_mmid(struct mm_struct *mm)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	static u32 cur_idx = MMID_KERNEL_WIRED + 1;
*4882a593Smuzhiyun	u64 mmid, version, mmid_mask;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	mmid = cpu_context(0, mm);
*4882a593Smuzhiyun	version = atomic64_read(&mmid_version);
*4882a593Smuzhiyun	mmid_mask = cpu_asid_mask(&boot_cpu_data);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (!asid_versions_eq(0, mmid, 0)) {
*4882a593Smuzhiyun		u64 newmmid = version | (mmid & mmid_mask);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		/*
*4882a593Smuzhiyun		 * If our current MMID was active during a rollover, we
*4882a593Smuzhiyun		 * can continue to use it and this was just a false alarm.
*4882a593Smuzhiyun		 */
*4882a593Smuzhiyun		if (check_update_reserved_mmid(mmid, newmmid)) {
*4882a593Smuzhiyun			mmid = newmmid;
*4882a593Smuzhiyun			goto set_context;
*4882a593Smuzhiyun		}
*4882a593Smuzhiyun
*4882a593Smuzhiyun		/*
*4882a593Smuzhiyun		 * We had a valid MMID in a previous life, so try to re-use
*4882a593Smuzhiyun		 * it if possible.
*4882a593Smuzhiyun		 */
*4882a593Smuzhiyun		if (!__test_and_set_bit(mmid & mmid_mask, mmid_map)) {
*4882a593Smuzhiyun			mmid = newmmid;
*4882a593Smuzhiyun			goto set_context;
*4882a593Smuzhiyun		}
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Allocate a free MMID */
*4882a593Smuzhiyun	mmid = find_next_zero_bit(mmid_map, num_mmids, cur_idx);
*4882a593Smuzhiyun	if (mmid != num_mmids)
*4882a593Smuzhiyun		goto reserve_mmid;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* We're out of MMIDs, so increment the global version */
*4882a593Smuzhiyun	version = atomic64_add_return_relaxed(asid_first_version(0),
*4882a593Smuzhiyun					      &mmid_version);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Note currently active MMIDs & mark TLBs as requiring flushes */
*4882a593Smuzhiyun	flush_context();
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* We have more MMIDs than CPUs, so this will always succeed */
*4882a593Smuzhiyun	mmid = find_first_zero_bit(mmid_map, num_mmids);
*4882a593Smuzhiyun
*4882a593Smuzhiyunreserve_mmid:
*4882a593Smuzhiyun	__set_bit(mmid, mmid_map);
*4882a593Smuzhiyun	cur_idx = mmid;
*4882a593Smuzhiyun	mmid |= version;
*4882a593Smuzhiyunset_context:
*4882a593Smuzhiyun	set_cpu_context(0, mm, mmid);
*4882a593Smuzhiyun	return mmid;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunvoid check_switch_mmu_context(struct mm_struct *mm)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	unsigned int cpu = smp_processor_id();
*4882a593Smuzhiyun	u64 ctx, old_active_mmid;
*4882a593Smuzhiyun	unsigned long flags;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (!cpu_has_mmid) {
*4882a593Smuzhiyun		check_mmu_context(mm);
*4882a593Smuzhiyun		write_c0_entryhi(cpu_asid(cpu, mm));
*4882a593Smuzhiyun		goto setup_pgd;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * MMID switch fast-path, to avoid acquiring cpu_mmid_lock when it's
*4882a593Smuzhiyun	 * unnecessary.
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 * The memory ordering here is subtle. If our active_mmids is non-zero
*4882a593Smuzhiyun	 * and the MMID matches the current version, then we update the CPU's
*4882a593Smuzhiyun	 * asid_cache with a relaxed cmpxchg. Racing with a concurrent rollover
*4882a593Smuzhiyun	 * means that either:
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 * - We get a zero back from the cmpxchg and end up waiting on
*4882a593Smuzhiyun	 *   cpu_mmid_lock in check_mmu_context(). Taking the lock synchronises
*4882a593Smuzhiyun	 *   with the rollover and so we are forced to see the updated
*4882a593Smuzhiyun	 *   generation.
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 * - We get a valid MMID back from the cmpxchg, which means the
*4882a593Smuzhiyun	 *   relaxed xchg in flush_context will treat us as reserved
*4882a593Smuzhiyun	 *   because atomic RmWs are totally ordered for a given location.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	ctx = cpu_context(cpu, mm);
*4882a593Smuzhiyun	old_active_mmid = READ_ONCE(cpu_data[cpu].asid_cache);
*4882a593Smuzhiyun	if (!old_active_mmid ||
*4882a593Smuzhiyun	    !asid_versions_eq(cpu, ctx, atomic64_read(&mmid_version)) ||
*4882a593Smuzhiyun	    !cmpxchg_relaxed(&cpu_data[cpu].asid_cache, old_active_mmid, ctx)) {
*4882a593Smuzhiyun		raw_spin_lock_irqsave(&cpu_mmid_lock, flags);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		ctx = cpu_context(cpu, mm);
*4882a593Smuzhiyun		if (!asid_versions_eq(cpu, ctx, atomic64_read(&mmid_version)))
*4882a593Smuzhiyun			ctx = get_new_mmid(mm);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		WRITE_ONCE(cpu_data[cpu].asid_cache, ctx);
*4882a593Smuzhiyun		raw_spin_unlock_irqrestore(&cpu_mmid_lock, flags);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Invalidate the local TLB if needed. Note that we must only clear our
*4882a593Smuzhiyun	 * bit in tlb_flush_pending after this is complete, so that the
*4882a593Smuzhiyun	 * cpu_has_shared_ftlb_entries case below isn't misled.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	if (cpumask_test_cpu(cpu, &tlb_flush_pending)) {
*4882a593Smuzhiyun		if (cpu_has_vtag_icache)
*4882a593Smuzhiyun			flush_icache_all();
*4882a593Smuzhiyun		local_flush_tlb_all();
*4882a593Smuzhiyun		cpumask_clear_cpu(cpu, &tlb_flush_pending);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	write_c0_memorymapid(ctx & cpu_asid_mask(&boot_cpu_data));
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * If this CPU shares FTLB entries with its siblings and one or more of
*4882a593Smuzhiyun	 * those siblings hasn't yet invalidated its TLB following a version
*4882a593Smuzhiyun	 * increase then we need to invalidate any TLB entries for our MMID
*4882a593Smuzhiyun	 * that we might otherwise pick up from a sibling.
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 * We ifdef on CONFIG_SMP because cpu_sibling_map isn't defined in
*4882a593Smuzhiyun	 * CONFIG_SMP=n kernels.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun#ifdef CONFIG_SMP
*4882a593Smuzhiyun	if (cpu_has_shared_ftlb_entries &&
*4882a593Smuzhiyun	    cpumask_intersects(&tlb_flush_pending, &cpu_sibling_map[cpu])) {
*4882a593Smuzhiyun		/* Ensure we operate on the new MMID */
*4882a593Smuzhiyun		mtc0_tlbw_hazard();
*4882a593Smuzhiyun
*4882a593Smuzhiyun		/*
*4882a593Smuzhiyun		 * Invalidate all TLB entries associated with the new
*4882a593Smuzhiyun		 * MMID, and wait for the invalidation to complete.
*4882a593Smuzhiyun		 */
*4882a593Smuzhiyun		ginvt_mmid();
*4882a593Smuzhiyun		sync_ginv();
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun#endif
*4882a593Smuzhiyun
*4882a593Smuzhiyunsetup_pgd:
*4882a593Smuzhiyun	TLBMISS_HANDLER_SETUP_PGD(mm->pgd);
*4882a593Smuzhiyun}
*4882a593SmuzhiyunEXPORT_SYMBOL_GPL(check_switch_mmu_context);
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic int mmid_init(void)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	if (!cpu_has_mmid)
*4882a593Smuzhiyun		return 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Expect allocation after rollover to fail if we don't have at least
*4882a593Smuzhiyun	 * one more MMID than CPUs.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	num_mmids = asid_first_version(0);
*4882a593Smuzhiyun	WARN_ON(num_mmids <= num_possible_cpus());
*4882a593Smuzhiyun
*4882a593Smuzhiyun	atomic64_set(&mmid_version, asid_first_version(0));
*4882a593Smuzhiyun	mmid_map = kcalloc(BITS_TO_LONGS(num_mmids), sizeof(*mmid_map),
*4882a593Smuzhiyun			   GFP_KERNEL);
*4882a593Smuzhiyun	if (!mmid_map)
*4882a593Smuzhiyun		panic("Failed to allocate bitmap for %u MMIDs\n", num_mmids);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Reserve an MMID for kmap/wired entries */
*4882a593Smuzhiyun	__set_bit(MMID_KERNEL_WIRED, mmid_map);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	pr_info("MMID allocator initialised with %u entries\n", num_mmids);
*4882a593Smuzhiyun	return 0;
*4882a593Smuzhiyun}
*4882a593Smuzhiyunearly_initcall(mmid_init);