drm/msm/msm_gpummu.c

*4882a593Smuzhiyun// SPDX-License-Identifier: GPL-2.0
*4882a593Smuzhiyun/* Copyright (c) 2018 The Linux Foundation. All rights reserved. */
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include <linux/dma-mapping.h>
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include "msm_drv.h"
*4882a593Smuzhiyun#include "msm_mmu.h"
*4882a593Smuzhiyun#include "adreno/adreno_gpu.h"
*4882a593Smuzhiyun#include "adreno/a2xx.xml.h"
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct msm_gpummu {
*4882a593Smuzhiyun	struct msm_mmu base;
*4882a593Smuzhiyun	struct msm_gpu *gpu;
*4882a593Smuzhiyun	dma_addr_t pt_base;
*4882a593Smuzhiyun	uint32_t *table;
*4882a593Smuzhiyun};
*4882a593Smuzhiyun#define to_msm_gpummu(x) container_of(x, struct msm_gpummu, base)
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define GPUMMU_VA_START SZ_16M
*4882a593Smuzhiyun#define GPUMMU_VA_RANGE (0xfff * SZ_64K)
*4882a593Smuzhiyun#define GPUMMU_PAGE_SIZE SZ_4K
*4882a593Smuzhiyun#define TABLE_SIZE (sizeof(uint32_t) * GPUMMU_VA_RANGE / GPUMMU_PAGE_SIZE)
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic void msm_gpummu_detach(struct msm_mmu *mmu)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic int msm_gpummu_map(struct msm_mmu *mmu, uint64_t iova,
*4882a593Smuzhiyun		struct sg_table *sgt, size_t len, int prot)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct msm_gpummu *gpummu = to_msm_gpummu(mmu);
*4882a593Smuzhiyun	unsigned idx = (iova - GPUMMU_VA_START) / GPUMMU_PAGE_SIZE;
*4882a593Smuzhiyun	struct sg_dma_page_iter dma_iter;
*4882a593Smuzhiyun	unsigned prot_bits = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (prot & IOMMU_WRITE)
*4882a593Smuzhiyun		prot_bits |= 1;
*4882a593Smuzhiyun	if (prot & IOMMU_READ)
*4882a593Smuzhiyun		prot_bits |= 2;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	for_each_sgtable_dma_page(sgt, &dma_iter, 0) {
*4882a593Smuzhiyun		dma_addr_t addr = sg_page_iter_dma_address(&dma_iter);
*4882a593Smuzhiyun		int i;
*4882a593Smuzhiyun
*4882a593Smuzhiyun		for (i = 0; i < PAGE_SIZE; i += GPUMMU_PAGE_SIZE)
*4882a593Smuzhiyun			gpummu->table[idx++] = (addr + i) | prot_bits;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* we can improve by deferring flush for multiple map() */
*4882a593Smuzhiyun	gpu_write(gpummu->gpu, REG_A2XX_MH_MMU_INVALIDATE,
*4882a593Smuzhiyun		A2XX_MH_MMU_INVALIDATE_INVALIDATE_ALL |
*4882a593Smuzhiyun		A2XX_MH_MMU_INVALIDATE_INVALIDATE_TC);
*4882a593Smuzhiyun	return 0;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic int msm_gpummu_unmap(struct msm_mmu *mmu, uint64_t iova, size_t len)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct msm_gpummu *gpummu = to_msm_gpummu(mmu);
*4882a593Smuzhiyun	unsigned idx = (iova - GPUMMU_VA_START) / GPUMMU_PAGE_SIZE;
*4882a593Smuzhiyun	unsigned i;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	for (i = 0; i < len / GPUMMU_PAGE_SIZE; i++, idx++)
*4882a593Smuzhiyun                gpummu->table[idx] = 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	gpu_write(gpummu->gpu, REG_A2XX_MH_MMU_INVALIDATE,
*4882a593Smuzhiyun		A2XX_MH_MMU_INVALIDATE_INVALIDATE_ALL |
*4882a593Smuzhiyun		A2XX_MH_MMU_INVALIDATE_INVALIDATE_TC);
*4882a593Smuzhiyun	return 0;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic void msm_gpummu_destroy(struct msm_mmu *mmu)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct msm_gpummu *gpummu = to_msm_gpummu(mmu);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	dma_free_attrs(mmu->dev, TABLE_SIZE, gpummu->table, gpummu->pt_base,
*4882a593Smuzhiyun		DMA_ATTR_FORCE_CONTIGUOUS);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	kfree(gpummu);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic const struct msm_mmu_funcs funcs = {
*4882a593Smuzhiyun		.detach = msm_gpummu_detach,
*4882a593Smuzhiyun		.map = msm_gpummu_map,
*4882a593Smuzhiyun		.unmap = msm_gpummu_unmap,
*4882a593Smuzhiyun		.destroy = msm_gpummu_destroy,
*4882a593Smuzhiyun};
*4882a593Smuzhiyun
*4882a593Smuzhiyunstruct msm_mmu *msm_gpummu_new(struct device *dev, struct msm_gpu *gpu)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct msm_gpummu *gpummu;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	gpummu = kzalloc(sizeof(*gpummu), GFP_KERNEL);
*4882a593Smuzhiyun	if (!gpummu)
*4882a593Smuzhiyun		return ERR_PTR(-ENOMEM);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	gpummu->table = dma_alloc_attrs(dev, TABLE_SIZE + 32, &gpummu->pt_base,
*4882a593Smuzhiyun		GFP_KERNEL | __GFP_ZERO, DMA_ATTR_FORCE_CONTIGUOUS);
*4882a593Smuzhiyun	if (!gpummu->table) {
*4882a593Smuzhiyun		kfree(gpummu);
*4882a593Smuzhiyun		return ERR_PTR(-ENOMEM);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	gpummu->gpu = gpu;
*4882a593Smuzhiyun	msm_mmu_init(&gpummu->base, dev, &funcs, MSM_MMU_GPUMMU);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return &gpummu->base;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunvoid msm_gpummu_params(struct msm_mmu *mmu, dma_addr_t *pt_base,
*4882a593Smuzhiyun		dma_addr_t *tran_error)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	dma_addr_t base = to_msm_gpummu(mmu)->pt_base;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	*pt_base = base;
*4882a593Smuzhiyun	*tran_error = base + TABLE_SIZE; /* 32-byte aligned */
*4882a593Smuzhiyun}