arm/arm-smmu/arm-smmu-impl.c

*4882a593Smuzhiyun// SPDX-License-Identifier: GPL-2.0-only
*4882a593Smuzhiyun// Miscellaneous Arm SMMU implementation and integration quirks
*4882a593Smuzhiyun// Copyright (C) 2019 Arm Limited
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define pr_fmt(fmt) "arm-smmu: " fmt
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include <linux/bitfield.h>
*4882a593Smuzhiyun#include <linux/of.h>
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include "arm-smmu.h"
*4882a593Smuzhiyun
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic int arm_smmu_gr0_ns(int offset)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	switch(offset) {
*4882a593Smuzhiyun	case ARM_SMMU_GR0_sCR0:
*4882a593Smuzhiyun	case ARM_SMMU_GR0_sACR:
*4882a593Smuzhiyun	case ARM_SMMU_GR0_sGFSR:
*4882a593Smuzhiyun	case ARM_SMMU_GR0_sGFSYNR0:
*4882a593Smuzhiyun	case ARM_SMMU_GR0_sGFSYNR1:
*4882a593Smuzhiyun	case ARM_SMMU_GR0_sGFSYNR2:
*4882a593Smuzhiyun		return offset + 0x400;
*4882a593Smuzhiyun	default:
*4882a593Smuzhiyun		return offset;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic u32 arm_smmu_read_ns(struct arm_smmu_device *smmu, int page,
*4882a593Smuzhiyun			    int offset)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	if (page == ARM_SMMU_GR0)
*4882a593Smuzhiyun		offset = arm_smmu_gr0_ns(offset);
*4882a593Smuzhiyun	return readl_relaxed(arm_smmu_page(smmu, page) + offset);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic void arm_smmu_write_ns(struct arm_smmu_device *smmu, int page,
*4882a593Smuzhiyun			      int offset, u32 val)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	if (page == ARM_SMMU_GR0)
*4882a593Smuzhiyun		offset = arm_smmu_gr0_ns(offset);
*4882a593Smuzhiyun	writel_relaxed(val, arm_smmu_page(smmu, page) + offset);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/* Since we don't care for sGFAR, we can do without 64-bit accessors */
*4882a593Smuzhiyunstatic const struct arm_smmu_impl calxeda_impl = {
*4882a593Smuzhiyun	.read_reg = arm_smmu_read_ns,
*4882a593Smuzhiyun	.write_reg = arm_smmu_write_ns,
*4882a593Smuzhiyun};
*4882a593Smuzhiyun
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct cavium_smmu {
*4882a593Smuzhiyun	struct arm_smmu_device smmu;
*4882a593Smuzhiyun	u32 id_base;
*4882a593Smuzhiyun};
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic int cavium_cfg_probe(struct arm_smmu_device *smmu)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	static atomic_t context_count = ATOMIC_INIT(0);
*4882a593Smuzhiyun	struct cavium_smmu *cs = container_of(smmu, struct cavium_smmu, smmu);
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Cavium CN88xx erratum #27704.
*4882a593Smuzhiyun	 * Ensure ASID and VMID allocation is unique across all SMMUs in
*4882a593Smuzhiyun	 * the system.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	cs->id_base = atomic_fetch_add(smmu->num_context_banks, &context_count);
*4882a593Smuzhiyun	dev_notice(smmu->dev, "\tenabling workaround for Cavium erratum 27704\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return 0;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic int cavium_init_context(struct arm_smmu_domain *smmu_domain,
*4882a593Smuzhiyun		struct io_pgtable_cfg *pgtbl_cfg, struct device *dev)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct cavium_smmu *cs = container_of(smmu_domain->smmu,
*4882a593Smuzhiyun					      struct cavium_smmu, smmu);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (smmu_domain->stage == ARM_SMMU_DOMAIN_S2)
*4882a593Smuzhiyun		smmu_domain->cfg.vmid += cs->id_base;
*4882a593Smuzhiyun	else
*4882a593Smuzhiyun		smmu_domain->cfg.asid += cs->id_base;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return 0;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic const struct arm_smmu_impl cavium_impl = {
*4882a593Smuzhiyun	.cfg_probe = cavium_cfg_probe,
*4882a593Smuzhiyun	.init_context = cavium_init_context,
*4882a593Smuzhiyun};
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic struct arm_smmu_device *cavium_smmu_impl_init(struct arm_smmu_device *smmu)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct cavium_smmu *cs;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	cs = devm_kzalloc(smmu->dev, sizeof(*cs), GFP_KERNEL);
*4882a593Smuzhiyun	if (!cs)
*4882a593Smuzhiyun		return ERR_PTR(-ENOMEM);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	cs->smmu = *smmu;
*4882a593Smuzhiyun	cs->smmu.impl = &cavium_impl;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	devm_kfree(smmu->dev, smmu);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return &cs->smmu;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define ARM_MMU500_ACTLR_CPRE		(1 << 1)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define ARM_MMU500_ACR_CACHE_LOCK	(1 << 26)
*4882a593Smuzhiyun#define ARM_MMU500_ACR_S2CRB_TLBEN	(1 << 10)
*4882a593Smuzhiyun#define ARM_MMU500_ACR_SMTNMB_TLBEN	(1 << 8)
*4882a593Smuzhiyun
*4882a593Smuzhiyunint arm_mmu500_reset(struct arm_smmu_device *smmu)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	u32 reg, major;
*4882a593Smuzhiyun	int i;
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * On MMU-500 r2p0 onwards we need to clear ACR.CACHE_LOCK before
*4882a593Smuzhiyun	 * writes to the context bank ACTLRs will stick. And we just hope that
*4882a593Smuzhiyun	 * Secure has also cleared SACR.CACHE_LOCK for this to take effect...
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	reg = arm_smmu_gr0_read(smmu, ARM_SMMU_GR0_ID7);
*4882a593Smuzhiyun	major = FIELD_GET(ARM_SMMU_ID7_MAJOR, reg);
*4882a593Smuzhiyun	reg = arm_smmu_gr0_read(smmu, ARM_SMMU_GR0_sACR);
*4882a593Smuzhiyun	if (major >= 2)
*4882a593Smuzhiyun		reg &= ~ARM_MMU500_ACR_CACHE_LOCK;
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Allow unmatched Stream IDs to allocate bypass
*4882a593Smuzhiyun	 * TLB entries for reduced latency.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	reg |= ARM_MMU500_ACR_SMTNMB_TLBEN | ARM_MMU500_ACR_S2CRB_TLBEN;
*4882a593Smuzhiyun	arm_smmu_gr0_write(smmu, ARM_SMMU_GR0_sACR, reg);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Disable MMU-500's not-particularly-beneficial next-page
*4882a593Smuzhiyun	 * prefetcher for the sake of errata #841119 and #826419.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	for (i = 0; i < smmu->num_context_banks; ++i) {
*4882a593Smuzhiyun		reg = arm_smmu_cb_read(smmu, i, ARM_SMMU_CB_ACTLR);
*4882a593Smuzhiyun		reg &= ~ARM_MMU500_ACTLR_CPRE;
*4882a593Smuzhiyun		arm_smmu_cb_write(smmu, i, ARM_SMMU_CB_ACTLR, reg);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return 0;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic const struct arm_smmu_impl arm_mmu500_impl = {
*4882a593Smuzhiyun	.reset = arm_mmu500_reset,
*4882a593Smuzhiyun};
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic u64 mrvl_mmu500_readq(struct arm_smmu_device *smmu, int page, int off)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Marvell Armada-AP806 erratum #582743.
*4882a593Smuzhiyun	 * Split all the readq to double readl
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	return hi_lo_readq_relaxed(arm_smmu_page(smmu, page) + off);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic void mrvl_mmu500_writeq(struct arm_smmu_device *smmu, int page, int off,
*4882a593Smuzhiyun			       u64 val)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Marvell Armada-AP806 erratum #582743.
*4882a593Smuzhiyun	 * Split all the writeq to double writel
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	hi_lo_writeq_relaxed(val, arm_smmu_page(smmu, page) + off);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic int mrvl_mmu500_cfg_probe(struct arm_smmu_device *smmu)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Armada-AP806 erratum #582743.
*4882a593Smuzhiyun	 * Hide the SMMU_IDR2.PTFSv8 fields to sidestep the AArch64
*4882a593Smuzhiyun	 * formats altogether and allow using 32 bits access on the
*4882a593Smuzhiyun	 * interconnect.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	smmu->features &= ~(ARM_SMMU_FEAT_FMT_AARCH64_4K |
*4882a593Smuzhiyun			    ARM_SMMU_FEAT_FMT_AARCH64_16K |
*4882a593Smuzhiyun			    ARM_SMMU_FEAT_FMT_AARCH64_64K);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return 0;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic const struct arm_smmu_impl mrvl_mmu500_impl = {
*4882a593Smuzhiyun	.read_reg64 = mrvl_mmu500_readq,
*4882a593Smuzhiyun	.write_reg64 = mrvl_mmu500_writeq,
*4882a593Smuzhiyun	.cfg_probe = mrvl_mmu500_cfg_probe,
*4882a593Smuzhiyun	.reset = arm_mmu500_reset,
*4882a593Smuzhiyun};
*4882a593Smuzhiyun
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct arm_smmu_device *arm_smmu_impl_init(struct arm_smmu_device *smmu)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	const struct device_node *np = smmu->dev->of_node;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/*
*4882a593Smuzhiyun	 * Set the impl for model-specific implementation quirks first,
*4882a593Smuzhiyun	 * such that platform integration quirks can pick it up and
*4882a593Smuzhiyun	 * inherit from it if necessary.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	switch (smmu->model) {
*4882a593Smuzhiyun	case ARM_MMU500:
*4882a593Smuzhiyun		smmu->impl = &arm_mmu500_impl;
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	case CAVIUM_SMMUV2:
*4882a593Smuzhiyun		return cavium_smmu_impl_init(smmu);
*4882a593Smuzhiyun	default:
*4882a593Smuzhiyun		break;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* This is implicitly MMU-400 */
*4882a593Smuzhiyun	if (of_property_read_bool(np, "calxeda,smmu-secure-config-access"))
*4882a593Smuzhiyun		smmu->impl = &calxeda_impl;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (of_device_is_compatible(np, "nvidia,tegra194-smmu"))
*4882a593Smuzhiyun		return nvidia_smmu_impl_init(smmu);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (of_device_is_compatible(np, "qcom,sdm845-smmu-500") ||
*4882a593Smuzhiyun	    of_device_is_compatible(np, "qcom,sc7180-smmu-500") ||
*4882a593Smuzhiyun	    of_device_is_compatible(np, "qcom,sm8150-smmu-500") ||
*4882a593Smuzhiyun	    of_device_is_compatible(np, "qcom,sm8250-smmu-500"))
*4882a593Smuzhiyun		return qcom_smmu_impl_init(smmu);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (of_device_is_compatible(smmu->dev->of_node, "qcom,adreno-smmu"))
*4882a593Smuzhiyun		return qcom_adreno_smmu_impl_init(smmu);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (of_device_is_compatible(np, "marvell,ap806-smmu-500"))
*4882a593Smuzhiyun		smmu->impl = &mrvl_mmu500_impl;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return smmu;
*4882a593Smuzhiyun}