drm/v3d/v3d_irq.c

*4882a593Smuzhiyun// SPDX-License-Identifier: GPL-2.0+
*4882a593Smuzhiyun/* Copyright (C) 2014-2018 Broadcom */
*4882a593Smuzhiyun
*4882a593Smuzhiyun/**
*4882a593Smuzhiyun * DOC: Interrupt management for the V3D engine
*4882a593Smuzhiyun *
*4882a593Smuzhiyun * When we take a bin, render, TFU done, or CSD done interrupt, we
*4882a593Smuzhiyun * need to signal the fence for that job so that the scheduler can
*4882a593Smuzhiyun * queue up the next one and unblock any waiters.
*4882a593Smuzhiyun *
*4882a593Smuzhiyun * When we take the binner out of memory interrupt, we need to
*4882a593Smuzhiyun * allocate some new memory and pass it to the binner so that the
*4882a593Smuzhiyun * current job can make progress.
*4882a593Smuzhiyun */
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include <linux/platform_device.h>
*4882a593Smuzhiyun
*4882a593Smuzhiyun#include "v3d_drv.h"
*4882a593Smuzhiyun#include "v3d_regs.h"
*4882a593Smuzhiyun#include "v3d_trace.h"
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define V3D_CORE_IRQS ((u32)(V3D_INT_OUTOMEM |	\
*4882a593Smuzhiyun			     V3D_INT_FLDONE |	\
*4882a593Smuzhiyun			     V3D_INT_FRDONE |	\
*4882a593Smuzhiyun			     V3D_INT_CSDDONE |	\
*4882a593Smuzhiyun			     V3D_INT_GMPV))
*4882a593Smuzhiyun
*4882a593Smuzhiyun#define V3D_HUB_IRQS ((u32)(V3D_HUB_INT_MMU_WRV |	\
*4882a593Smuzhiyun			    V3D_HUB_INT_MMU_PTI |	\
*4882a593Smuzhiyun			    V3D_HUB_INT_MMU_CAP |	\
*4882a593Smuzhiyun			    V3D_HUB_INT_TFUC))
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic irqreturn_t
*4882a593Smuzhiyunv3d_hub_irq(int irq, void *arg);
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic void
*4882a593Smuzhiyunv3d_overflow_mem_work(struct work_struct *work)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct v3d_dev *v3d =
*4882a593Smuzhiyun		container_of(work, struct v3d_dev, overflow_mem_work);
*4882a593Smuzhiyun	struct drm_device *dev = &v3d->drm;
*4882a593Smuzhiyun	struct v3d_bo *bo = v3d_bo_create(dev, NULL /* XXX: GMP */, 256 * 1024);
*4882a593Smuzhiyun	struct drm_gem_object *obj;
*4882a593Smuzhiyun	unsigned long irqflags;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (IS_ERR(bo)) {
*4882a593Smuzhiyun		DRM_ERROR("Couldn't allocate binner overflow mem\n");
*4882a593Smuzhiyun		return;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun	obj = &bo->base.base;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* We lost a race, and our work task came in after the bin job
*4882a593Smuzhiyun	 * completed and exited.  This can happen because the HW
*4882a593Smuzhiyun	 * signals OOM before it's fully OOM, so the binner might just
*4882a593Smuzhiyun	 * barely complete.
*4882a593Smuzhiyun	 *
*4882a593Smuzhiyun	 * If we lose the race and our work task comes in after a new
*4882a593Smuzhiyun	 * bin job got scheduled, that's fine.  We'll just give them
*4882a593Smuzhiyun	 * some binner pool anyway.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	spin_lock_irqsave(&v3d->job_lock, irqflags);
*4882a593Smuzhiyun	if (!v3d->bin_job) {
*4882a593Smuzhiyun		spin_unlock_irqrestore(&v3d->job_lock, irqflags);
*4882a593Smuzhiyun		goto out;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	drm_gem_object_get(obj);
*4882a593Smuzhiyun	list_add_tail(&bo->unref_head, &v3d->bin_job->render->unref_list);
*4882a593Smuzhiyun	spin_unlock_irqrestore(&v3d->job_lock, irqflags);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	V3D_CORE_WRITE(0, V3D_PTB_BPOA, bo->node.start << PAGE_SHIFT);
*4882a593Smuzhiyun	V3D_CORE_WRITE(0, V3D_PTB_BPOS, obj->size);
*4882a593Smuzhiyun
*4882a593Smuzhiyunout:
*4882a593Smuzhiyun	drm_gem_object_put(obj);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic irqreturn_t
*4882a593Smuzhiyunv3d_irq(int irq, void *arg)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct v3d_dev *v3d = arg;
*4882a593Smuzhiyun	u32 intsts;
*4882a593Smuzhiyun	irqreturn_t status = IRQ_NONE;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	intsts = V3D_CORE_READ(0, V3D_CTL_INT_STS);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Acknowledge the interrupts we're handling here. */
*4882a593Smuzhiyun	V3D_CORE_WRITE(0, V3D_CTL_INT_CLR, intsts);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (intsts & V3D_INT_OUTOMEM) {
*4882a593Smuzhiyun		/* Note that the OOM status is edge signaled, so the
*4882a593Smuzhiyun		 * interrupt won't happen again until the we actually
*4882a593Smuzhiyun		 * add more memory.  Also, as of V3D 4.1, FLDONE won't
*4882a593Smuzhiyun		 * be reported until any OOM state has been cleared.
*4882a593Smuzhiyun		 */
*4882a593Smuzhiyun		schedule_work(&v3d->overflow_mem_work);
*4882a593Smuzhiyun		status = IRQ_HANDLED;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (intsts & V3D_INT_FLDONE) {
*4882a593Smuzhiyun		struct v3d_fence *fence =
*4882a593Smuzhiyun			to_v3d_fence(v3d->bin_job->base.irq_fence);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		trace_v3d_bcl_irq(&v3d->drm, fence->seqno);
*4882a593Smuzhiyun		dma_fence_signal(&fence->base);
*4882a593Smuzhiyun		status = IRQ_HANDLED;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (intsts & V3D_INT_FRDONE) {
*4882a593Smuzhiyun		struct v3d_fence *fence =
*4882a593Smuzhiyun			to_v3d_fence(v3d->render_job->base.irq_fence);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		trace_v3d_rcl_irq(&v3d->drm, fence->seqno);
*4882a593Smuzhiyun		dma_fence_signal(&fence->base);
*4882a593Smuzhiyun		status = IRQ_HANDLED;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (intsts & V3D_INT_CSDDONE) {
*4882a593Smuzhiyun		struct v3d_fence *fence =
*4882a593Smuzhiyun			to_v3d_fence(v3d->csd_job->base.irq_fence);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		trace_v3d_csd_irq(&v3d->drm, fence->seqno);
*4882a593Smuzhiyun		dma_fence_signal(&fence->base);
*4882a593Smuzhiyun		status = IRQ_HANDLED;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* We shouldn't be triggering these if we have GMP in
*4882a593Smuzhiyun	 * always-allowed mode.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	if (intsts & V3D_INT_GMPV)
*4882a593Smuzhiyun		dev_err(v3d->drm.dev, "GMP violation\n");
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* V3D 4.2 wires the hub and core IRQs together, so if we &
*4882a593Smuzhiyun	 * didn't see the common one then check hub for MMU IRQs.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	if (v3d->single_irq_line && status == IRQ_NONE)
*4882a593Smuzhiyun		return v3d_hub_irq(irq, arg);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return status;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunstatic irqreturn_t
*4882a593Smuzhiyunv3d_hub_irq(int irq, void *arg)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	struct v3d_dev *v3d = arg;
*4882a593Smuzhiyun	u32 intsts;
*4882a593Smuzhiyun	irqreturn_t status = IRQ_NONE;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	intsts = V3D_READ(V3D_HUB_INT_STS);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Acknowledge the interrupts we're handling here. */
*4882a593Smuzhiyun	V3D_WRITE(V3D_HUB_INT_CLR, intsts);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (intsts & V3D_HUB_INT_TFUC) {
*4882a593Smuzhiyun		struct v3d_fence *fence =
*4882a593Smuzhiyun			to_v3d_fence(v3d->tfu_job->base.irq_fence);
*4882a593Smuzhiyun
*4882a593Smuzhiyun		trace_v3d_tfu_irq(&v3d->drm, fence->seqno);
*4882a593Smuzhiyun		dma_fence_signal(&fence->base);
*4882a593Smuzhiyun		status = IRQ_HANDLED;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	if (intsts & (V3D_HUB_INT_MMU_WRV |
*4882a593Smuzhiyun		      V3D_HUB_INT_MMU_PTI |
*4882a593Smuzhiyun		      V3D_HUB_INT_MMU_CAP)) {
*4882a593Smuzhiyun		u32 axi_id = V3D_READ(V3D_MMU_VIO_ID);
*4882a593Smuzhiyun		u64 vio_addr = ((u64)V3D_READ(V3D_MMU_VIO_ADDR) <<
*4882a593Smuzhiyun				(v3d->va_width - 32));
*4882a593Smuzhiyun		static const char *const v3d41_axi_ids[] = {
*4882a593Smuzhiyun			"L2T",
*4882a593Smuzhiyun			"PTB",
*4882a593Smuzhiyun			"PSE",
*4882a593Smuzhiyun			"TLB",
*4882a593Smuzhiyun			"CLE",
*4882a593Smuzhiyun			"TFU",
*4882a593Smuzhiyun			"MMU",
*4882a593Smuzhiyun			"GMP",
*4882a593Smuzhiyun		};
*4882a593Smuzhiyun		const char *client = "?";
*4882a593Smuzhiyun
*4882a593Smuzhiyun		V3D_WRITE(V3D_MMU_CTL,
*4882a593Smuzhiyun			  V3D_READ(V3D_MMU_CTL) & (V3D_MMU_CTL_CAP_EXCEEDED |
*4882a593Smuzhiyun						   V3D_MMU_CTL_PT_INVALID |
*4882a593Smuzhiyun						   V3D_MMU_CTL_WRITE_VIOLATION));
*4882a593Smuzhiyun
*4882a593Smuzhiyun		if (v3d->ver >= 41) {
*4882a593Smuzhiyun			axi_id = axi_id >> 5;
*4882a593Smuzhiyun			if (axi_id < ARRAY_SIZE(v3d41_axi_ids))
*4882a593Smuzhiyun				client = v3d41_axi_ids[axi_id];
*4882a593Smuzhiyun		}
*4882a593Smuzhiyun
*4882a593Smuzhiyun		dev_err(v3d->drm.dev, "MMU error from client %s (%d) at 0x%llx%s%s%s\n",
*4882a593Smuzhiyun			client, axi_id, (long long)vio_addr,
*4882a593Smuzhiyun			((intsts & V3D_HUB_INT_MMU_WRV) ?
*4882a593Smuzhiyun			 ", write violation" : ""),
*4882a593Smuzhiyun			((intsts & V3D_HUB_INT_MMU_PTI) ?
*4882a593Smuzhiyun			 ", pte invalid" : ""),
*4882a593Smuzhiyun			((intsts & V3D_HUB_INT_MMU_CAP) ?
*4882a593Smuzhiyun			 ", cap exceeded" : ""));
*4882a593Smuzhiyun		status = IRQ_HANDLED;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	return status;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunint
*4882a593Smuzhiyunv3d_irq_init(struct v3d_dev *v3d)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	int irq1, ret, core;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	INIT_WORK(&v3d->overflow_mem_work, v3d_overflow_mem_work);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Clear any pending interrupts someone might have left around
*4882a593Smuzhiyun	 * for us.
*4882a593Smuzhiyun	 */
*4882a593Smuzhiyun	for (core = 0; core < v3d->cores; core++)
*4882a593Smuzhiyun		V3D_CORE_WRITE(core, V3D_CTL_INT_CLR, V3D_CORE_IRQS);
*4882a593Smuzhiyun	V3D_WRITE(V3D_HUB_INT_CLR, V3D_HUB_IRQS);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	irq1 = platform_get_irq(v3d_to_pdev(v3d), 1);
*4882a593Smuzhiyun	if (irq1 == -EPROBE_DEFER)
*4882a593Smuzhiyun		return irq1;
*4882a593Smuzhiyun	if (irq1 > 0) {
*4882a593Smuzhiyun		ret = devm_request_irq(v3d->drm.dev, irq1,
*4882a593Smuzhiyun				       v3d_irq, IRQF_SHARED,
*4882a593Smuzhiyun				       "v3d_core0", v3d);
*4882a593Smuzhiyun		if (ret)
*4882a593Smuzhiyun			goto fail;
*4882a593Smuzhiyun		ret = devm_request_irq(v3d->drm.dev,
*4882a593Smuzhiyun				       platform_get_irq(v3d_to_pdev(v3d), 0),
*4882a593Smuzhiyun				       v3d_hub_irq, IRQF_SHARED,
*4882a593Smuzhiyun				       "v3d_hub", v3d);
*4882a593Smuzhiyun		if (ret)
*4882a593Smuzhiyun			goto fail;
*4882a593Smuzhiyun	} else {
*4882a593Smuzhiyun		v3d->single_irq_line = true;
*4882a593Smuzhiyun
*4882a593Smuzhiyun		ret = devm_request_irq(v3d->drm.dev,
*4882a593Smuzhiyun				       platform_get_irq(v3d_to_pdev(v3d), 0),
*4882a593Smuzhiyun				       v3d_irq, IRQF_SHARED,
*4882a593Smuzhiyun				       "v3d", v3d);
*4882a593Smuzhiyun		if (ret)
*4882a593Smuzhiyun			goto fail;
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	v3d_irq_enable(v3d);
*4882a593Smuzhiyun	return 0;
*4882a593Smuzhiyun
*4882a593Smuzhiyunfail:
*4882a593Smuzhiyun	if (ret != -EPROBE_DEFER)
*4882a593Smuzhiyun		dev_err(v3d->drm.dev, "IRQ setup failed: %d\n", ret);
*4882a593Smuzhiyun	return ret;
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunvoid
*4882a593Smuzhiyunv3d_irq_enable(struct v3d_dev *v3d)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	int core;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Enable our set of interrupts, masking out any others. */
*4882a593Smuzhiyun	for (core = 0; core < v3d->cores; core++) {
*4882a593Smuzhiyun		V3D_CORE_WRITE(core, V3D_CTL_INT_MSK_SET, ~V3D_CORE_IRQS);
*4882a593Smuzhiyun		V3D_CORE_WRITE(core, V3D_CTL_INT_MSK_CLR, V3D_CORE_IRQS);
*4882a593Smuzhiyun	}
*4882a593Smuzhiyun
*4882a593Smuzhiyun	V3D_WRITE(V3D_HUB_INT_MSK_SET, ~V3D_HUB_IRQS);
*4882a593Smuzhiyun	V3D_WRITE(V3D_HUB_INT_MSK_CLR, V3D_HUB_IRQS);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyunvoid
*4882a593Smuzhiyunv3d_irq_disable(struct v3d_dev *v3d)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	int core;
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Disable all interrupts. */
*4882a593Smuzhiyun	for (core = 0; core < v3d->cores; core++)
*4882a593Smuzhiyun		V3D_CORE_WRITE(core, V3D_CTL_INT_MSK_SET, ~0);
*4882a593Smuzhiyun	V3D_WRITE(V3D_HUB_INT_MSK_SET, ~0);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	/* Clear any pending interrupts we might have left. */
*4882a593Smuzhiyun	for (core = 0; core < v3d->cores; core++)
*4882a593Smuzhiyun		V3D_CORE_WRITE(core, V3D_CTL_INT_CLR, V3D_CORE_IRQS);
*4882a593Smuzhiyun	V3D_WRITE(V3D_HUB_INT_CLR, V3D_HUB_IRQS);
*4882a593Smuzhiyun
*4882a593Smuzhiyun	cancel_work_sync(&v3d->overflow_mem_work);
*4882a593Smuzhiyun}
*4882a593Smuzhiyun
*4882a593Smuzhiyun/** Reinitializes interrupt registers when a GPU reset is performed. */
*4882a593Smuzhiyunvoid v3d_irq_reset(struct v3d_dev *v3d)
*4882a593Smuzhiyun{
*4882a593Smuzhiyun	v3d_irq_enable(v3d);
*4882a593Smuzhiyun}