drm/amdkfd: apply trap workaround for gfx11

author Jonathan Kim <jonathan.kim@amd.com>

Thu, 1 Sep 2022 15:27:15 +0000 (11:27 -0400)

committer Alex Deucher <alexander.deucher@amd.com>

Fri, 9 Jun 2023 16:35:52 +0000 (12:35 -0400)
author Jonathan Kim <jonathan.kim@amd.com>
Thu, 1 Sep 2022 15:27:15 +0000 (11:27 -0400)
committer Alex Deucher <alexander.deucher@amd.com>
Fri, 9 Jun 2023 16:35:52 +0000 (12:35 -0400)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_mes.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_mes.h

index d20df0cf0d88bbea9cf062afb5ee57a3cd10540a..b5f5eed2b5efe663126e187060886fad94a2a003 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_mes.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_mes.h
@@ -219,6 +219,8 @@ struct mes_add_queue_input {
         uint32_t        gws_size;
         uint64_t        tba_addr;
         uint64_t        tma_addr;
+       uint32_t        trap_en;
+       uint32_t        skip_process_ctx_clear;
         uint32_t        is_kfd_process;
         uint32_t        is_aql_queue;
         uint32_t        queue_size;
diff --git a/drivers/gpu/drm/amd/amdgpu/mes_v11_0.c b/drivers/gpu/drm/amd/amdgpu/mes_v11_0.c

index 861910a6662d9cb7c0c25aa1df03466144aaf1da..c4e3cb8d44de3f2950e0457d84d1a45dc3a684de 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/mes_v11_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/mes_v11_0.c
@@ -202,17 +202,14 @@ static int mes_v11_0_add_hw_queue(struct amdgpu_mes *mes,
         mes_add_queue_pkt.gws_size = input->gws_size;
         mes_add_queue_pkt.trap_handler_addr = input->tba_addr;
         mes_add_queue_pkt.tma_addr = input->tma_addr;
+       mes_add_queue_pkt.trap_en = input->trap_en;
+       mes_add_queue_pkt.skip_process_ctx_clear = input->skip_process_ctx_clear;
         mes_add_queue_pkt.is_kfd_process = input->is_kfd_process;
  
         /* For KFD, gds_size is re-used for queue size (needed in MES for AQL queues) */
         mes_add_queue_pkt.is_aql_queue = input->is_aql_queue;
         mes_add_queue_pkt.gds_size = input->queue_size;
  
-       if (!(((adev->mes.sched_version & AMDGPU_MES_VERSION_MASK) >= 4) &&
-                 (adev->ip_versions[GC_HWIP][0] >= IP_VERSION(11, 0, 0)) &&
-                 (adev->ip_versions[GC_HWIP][0] <= IP_VERSION(11, 0, 3))))
-               mes_add_queue_pkt.trap_en = 1;
-
         /* For KFD, gds_size is re-used for queue size (needed in MES for AQL queues) */
         mes_add_queue_pkt.is_aql_queue = input->is_aql_queue;
         mes_add_queue_pkt.gds_size = input->queue_size;
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_chardev.c b/drivers/gpu/drm/amd/amdkfd/kfd_chardev.c

index 826a99acb6fb9c7fd8da996a49ccb9873ebec396..d4df424e45144b6f522fd638a2ba57ef524d01cc 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_chardev.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_chardev.c
@@ -537,8 +537,6 @@ static int kfd_ioctl_set_cu_mask(struct file *filp, struct kfd_process *p,
                 goto out;
         }
  
-       minfo.update_flag = UPDATE_FLAG_CU_MASK;
-
         mutex_lock(&p->mutex);
  
         retval = pqm_update_mqd(&p->pqm, args->queue_id, &minfo);
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_debug.c b/drivers/gpu/drm/amd/amdkfd/kfd_debug.c

index 73b07b5f17f149c4f6d9d21e40f1b91ee39d405c..5e2ee2d1acc48da18de0144ab1c13d2f4ede0dbb 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_debug.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_debug.c
@@ -24,6 +24,57 @@
  #include "kfd_device_queue_manager.h"
  #include <linux/file.h>
  
+static int kfd_dbg_set_queue_workaround(struct queue *q, bool enable)
+{
+       struct mqd_update_info minfo = {0};
+       int err;
+
+       if (!q)
+               return 0;
+
+       if (KFD_GC_VERSION(q->device) < IP_VERSION(11, 0, 0) ||
+           KFD_GC_VERSION(q->device) >= IP_VERSION(12, 0, 0))
+               return 0;
+
+       if (enable && q->properties.is_user_cu_masked)
+               return -EBUSY;
+
+       minfo.update_flag = enable ? UPDATE_FLAG_DBG_WA_ENABLE : UPDATE_FLAG_DBG_WA_DISABLE;
+
+       q->properties.is_dbg_wa = enable;
+       err = q->device->dqm->ops.update_queue(q->device->dqm, q, &minfo);
+       if (err)
+               q->properties.is_dbg_wa = false;
+
+       return err;
+}
+
+static int kfd_dbg_set_workaround(struct kfd_process *target, bool enable)
+{
+       struct process_queue_manager *pqm = &target->pqm;
+       struct process_queue_node *pqn;
+       int r = 0;
+
+       list_for_each_entry(pqn, &pqm->queues, process_queue_list) {
+               r = kfd_dbg_set_queue_workaround(pqn->q, enable);
+               if (enable && r)
+                       goto unwind;
+       }
+
+       return 0;
+
+unwind:
+       list_for_each_entry(pqn, &pqm->queues, process_queue_list)
+               kfd_dbg_set_queue_workaround(pqn->q, false);
+
+       if (enable)
+               target->runtime_info.runtime_state = r == -EBUSY ?
+                               DEBUG_RUNTIME_STATE_ENABLED_BUSY :
+                               DEBUG_RUNTIME_STATE_ENABLED_ERROR;
+
+       return r;
+}
+
  static int kfd_dbg_set_mes_debug_mode(struct kfd_process_device *pdd)
  {
         uint32_t spi_dbg_cntl = pdd->spi_dbg_override | pdd->spi_dbg_launch_mode;
@@ -77,6 +128,8 @@ static void kfd_dbg_trap_deactivate(struct kfd_process *target, bool unwind, int
                 else
                         kfd_dbg_set_mes_debug_mode(pdd);
         }
+
+       kfd_dbg_set_workaround(target, false);
  }
  
  int kfd_dbg_trap_disable(struct kfd_process *target)
@@ -111,6 +164,10 @@ static int kfd_dbg_trap_activate(struct kfd_process *target)
  {
         int i, r = 0;
  
+       r = kfd_dbg_set_workaround(target, true);
+       if (r)
+               return r;
+
         for (i = 0; i < target->n_pdds; i++) {
                 struct kfd_process_device *pdd = target->pdds[i];
  
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_debug.h b/drivers/gpu/drm/amd/amdkfd/kfd_debug.h

index 17481f824647d6170e8122e1da51b1c45a4b2552..3e56225f6ef629c86c2d491f3358e6ee0f21cacb 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_debug.h
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_debug.h
@@ -31,7 +31,8 @@ int kfd_dbg_trap_enable(struct kfd_process *target, uint32_t fd,
                         uint32_t *runtime_info_size);
  static inline bool kfd_dbg_is_per_vmid_supported(struct kfd_node *dev)
  {
-       return KFD_GC_VERSION(dev) == IP_VERSION(9, 4, 2);
+       return KFD_GC_VERSION(dev) == IP_VERSION(9, 4, 2) ||
+              KFD_GC_VERSION(dev) >= IP_VERSION(11, 0, 0);
  }
  
  /*
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_device_queue_manager.c b/drivers/gpu/drm/amd/amdkfd/kfd_device_queue_manager.c

index 495c9238254e731026c0d1b67d71dbd3ca376783..44d87943e40ac64affc69d7f90cc3e66c77c81eb 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_device_queue_manager.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_device_queue_manager.c
@@ -226,6 +226,10 @@ static int add_queue_mes(struct device_queue_manager *dqm, struct queue *q,
         queue_input.paging = false;
         queue_input.tba_addr = qpd->tba_addr;
         queue_input.tma_addr = qpd->tma_addr;
+       queue_input.trap_en = KFD_GC_VERSION(q->device) < IP_VERSION(11, 0, 0) ||
+                             KFD_GC_VERSION(q->device) >= IP_VERSION(12, 0, 0) ||
+                             q->properties.is_dbg_wa;
+       queue_input.skip_process_ctx_clear = qpd->pqm->process->debug_trap_enabled;
  
         queue_type = convert_to_mes_queue_type(q->properties.type);
         if (queue_type < 0) {
@@ -1716,6 +1720,9 @@ static int create_queue_cpsch(struct device_queue_manager *dqm, struct queue *q,
          * updates the is_evicted flag but is a no-op otherwise.
          */
         q->properties.is_evicted = !!qpd->evicted;
+       q->properties.is_dbg_wa = qpd->pqm->process->debug_trap_enabled &&
+                       KFD_GC_VERSION(q->device) >= IP_VERSION(11, 0, 0) &&
+                       KFD_GC_VERSION(q->device) < IP_VERSION(12, 0, 0);
  
         if (qd)
                 mqd_mgr->restore_mqd(mqd_mgr, &q->mqd, q->mqd_mem_obj, &q->gart_mqd_addr,
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_cik.c b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_cik.c

index eb11940bec34c1944e69713ca2d3280b91355a07..65c9f01a1f86c1d60cb30c7a3524ab0e137cd40d 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_cik.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_cik.c
@@ -48,8 +48,7 @@ static void update_cu_mask(struct mqd_manager *mm, void *mqd,
         struct cik_mqd *m;
         uint32_t se_mask[4] = {0}; /* 4 is the max # of SEs */
  
-       if (!minfo || (minfo->update_flag != UPDATE_FLAG_CU_MASK) ||
-           !minfo->cu_mask.ptr)
+       if (!minfo || !minfo->cu_mask.ptr)
                 return;
  
         mqd_symmetrically_map_cu_mask(mm,
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v10.c b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v10.c

index eaaa4f4ddaaaf1a90274fdee8bd611b0a62ffab2..a0ac4f2fe6b58260855f5b8458e4a0830b47c99a 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v10.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v10.c
@@ -48,8 +48,7 @@ static void update_cu_mask(struct mqd_manager *mm, void *mqd,
         struct v10_compute_mqd *m;
         uint32_t se_mask[4] = {0}; /* 4 is the max # of SEs */
  
-       if (!minfo || (minfo->update_flag != UPDATE_FLAG_CU_MASK) ||
-           !minfo->cu_mask.ptr)
+       if (!minfo || !minfo->cu_mask.ptr)
                 return;
  
         mqd_symmetrically_map_cu_mask(mm,
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v11.c b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v11.c

index 3a48bbc589fe2f9166bad1f2d76b5bff10762d63..9a9b4e85351626371be0084e9ae160af85769acb 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v11.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v11.c
@@ -46,15 +46,33 @@ static void update_cu_mask(struct mqd_manager *mm, void *mqd,
  {
         struct v11_compute_mqd *m;
         uint32_t se_mask[KFD_MAX_NUM_SE] = {0};
+       bool has_wa_flag = minfo && (minfo->update_flag & (UPDATE_FLAG_DBG_WA_ENABLE |
+                       UPDATE_FLAG_DBG_WA_DISABLE));
  
-       if (!minfo || (minfo->update_flag != UPDATE_FLAG_CU_MASK) ||
-           !minfo->cu_mask.ptr)
+       if (!minfo || !(has_wa_flag || minfo->cu_mask.ptr))
                 return;
  
+       m = get_mqd(mqd);
+
+       if (has_wa_flag) {
+               uint32_t wa_mask = minfo->update_flag == UPDATE_FLAG_DBG_WA_ENABLE ?
+                                               0xffff : 0xffffffff;
+
+               m->compute_static_thread_mgmt_se0 = wa_mask;
+               m->compute_static_thread_mgmt_se1 = wa_mask;
+               m->compute_static_thread_mgmt_se2 = wa_mask;
+               m->compute_static_thread_mgmt_se3 = wa_mask;
+               m->compute_static_thread_mgmt_se4 = wa_mask;
+               m->compute_static_thread_mgmt_se5 = wa_mask;
+               m->compute_static_thread_mgmt_se6 = wa_mask;
+               m->compute_static_thread_mgmt_se7 = wa_mask;
+
+               return;
+       }
+
         mqd_symmetrically_map_cu_mask(mm,
                 minfo->cu_mask.ptr, minfo->cu_mask.count, se_mask);
  
-       m = get_mqd(mqd);
         m->compute_static_thread_mgmt_se0 = se_mask[0];
         m->compute_static_thread_mgmt_se1 = se_mask[1];
         m->compute_static_thread_mgmt_se2 = se_mask[2];
@@ -109,6 +127,7 @@ static void init_mqd(struct mqd_manager *mm, void **mqd,
         uint64_t addr;
         struct v11_compute_mqd *m;
         int size;
+       uint32_t wa_mask = q->is_dbg_wa ? 0xffff : 0xffffffff;
  
         m = (struct v11_compute_mqd *) mqd_mem_obj->cpu_ptr;
         addr = mqd_mem_obj->gpu_addr;
@@ -122,14 +141,15 @@ static void init_mqd(struct mqd_manager *mm, void **mqd,
  
         m->header = 0xC0310800;
         m->compute_pipelinestat_enable = 1;
-       m->compute_static_thread_mgmt_se0 = 0xFFFFFFFF;
-       m->compute_static_thread_mgmt_se1 = 0xFFFFFFFF;
-       m->compute_static_thread_mgmt_se2 = 0xFFFFFFFF;
-       m->compute_static_thread_mgmt_se3 = 0xFFFFFFFF;
-       m->compute_static_thread_mgmt_se4 = 0xFFFFFFFF;
-       m->compute_static_thread_mgmt_se5 = 0xFFFFFFFF;
-       m->compute_static_thread_mgmt_se6 = 0xFFFFFFFF;
-       m->compute_static_thread_mgmt_se7 = 0xFFFFFFFF;
+
+       m->compute_static_thread_mgmt_se0 = wa_mask;
+       m->compute_static_thread_mgmt_se1 = wa_mask;
+       m->compute_static_thread_mgmt_se2 = wa_mask;
+       m->compute_static_thread_mgmt_se3 = wa_mask;
+       m->compute_static_thread_mgmt_se4 = wa_mask;
+       m->compute_static_thread_mgmt_se5 = wa_mask;
+       m->compute_static_thread_mgmt_se6 = wa_mask;
+       m->compute_static_thread_mgmt_se7 = wa_mask;
  
         m->cp_hqd_persistent_state = CP_HQD_PERSISTENT_STATE__PRELOAD_REQ_MASK |
                         0x55 << CP_HQD_PERSISTENT_STATE__PRELOAD_SIZE__SHIFT;
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v9.c b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v9.c

index b7c95158d4a0ffce2044e80e92482a5b8864039a..5b87c244e909f150bd63a3afc5f2f158c251c2f5 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v9.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v9.c
@@ -65,8 +65,7 @@ static void update_cu_mask(struct mqd_manager *mm, void *mqd,
         struct v9_mqd *m;
         uint32_t se_mask[KFD_MAX_NUM_SE] = {0};
  
-       if (!minfo || (minfo->update_flag != UPDATE_FLAG_CU_MASK) ||
-           !minfo->cu_mask.ptr)
+       if (!minfo || !minfo->cu_mask.ptr)
                 return;
  
         mqd_symmetrically_map_cu_mask(mm,
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_vi.c b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_vi.c

index fe69492b1bb39406a61d942b33544c393caf7678..d1e962da51dd3196155faa2cd6a84bf2feb11684 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_vi.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_vi.c
@@ -51,8 +51,7 @@ static void update_cu_mask(struct mqd_manager *mm, void *mqd,
         struct vi_mqd *m;
         uint32_t se_mask[4] = {0}; /* 4 is the max # of SEs */
  
-       if (!minfo || (minfo->update_flag != UPDATE_FLAG_CU_MASK) ||
-           !minfo->cu_mask.ptr)
+       if (!minfo || !minfo->cu_mask.ptr)
                 return;
  
         mqd_symmetrically_map_cu_mask(mm,
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h

index 8fca7175daabffb7d1e5984f4fb0fedc26e857da..f0a45d184c8fc455fd147596f89e8e61cd74f391 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h
@@ -513,6 +513,8 @@ struct queue_properties {
         bool is_active;
         bool is_gws;
         uint32_t pm4_target_xcc;
+       bool is_dbg_wa;
+       bool is_user_cu_masked;
         /* Not relevant for user mode queues in cp scheduling */
         unsigned int vmid;
         /* Relevant only for sdma queues*/
@@ -535,7 +537,8 @@ struct queue_properties {
                             !(q).is_evicted)
  
  enum mqd_update_flag {
-       UPDATE_FLAG_CU_MASK = 0,
+       UPDATE_FLAG_DBG_WA_ENABLE = 1,
+       UPDATE_FLAG_DBG_WA_DISABLE = 2,
  };
  
  struct mqd_update_info {
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_process_queue_manager.c b/drivers/gpu/drm/amd/amdkfd/kfd_process_queue_manager.c

index b100933340d27bfe87bc0f4a6e790a9e660f34ef..43d432b5c5bcb9ce11a647391f9fc68209cf4974 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_process_queue_manager.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_process_queue_manager.c
@@ -506,8 +506,12 @@ int pqm_update_mqd(struct process_queue_manager *pqm,
                 return -EFAULT;
         }
  
+       /* CUs are masked for debugger requirements so deny user mask  */
+       if (pqn->q->properties.is_dbg_wa && minfo && minfo->cu_mask.ptr)
+               return -EBUSY;
+
         /* ASICs that have WGPs must enforce pairwise enabled mask checks. */
-       if (minfo && minfo->update_flag == UPDATE_FLAG_CU_MASK && minfo->cu_mask.ptr &&
+       if (minfo && minfo->cu_mask.ptr &&
                         KFD_GC_VERSION(pqn->q->device) >= IP_VERSION(10, 0, 0)) {
                 int i;
  
@@ -526,6 +530,9 @@ int pqm_update_mqd(struct process_queue_manager *pqm,
         if (retval != 0)
                 return retval;
  
+       if (minfo && minfo->cu_mask.ptr)
+               pqn->q->properties.is_user_cu_masked = true;
+
         return 0;
  }
  
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_topology.c b/drivers/gpu/drm/amd/amdkfd/kfd_topology.c

index 3def25b2bdbbca81f5efd0ae9ddb5df2f80efb6b..faa7939f35bde5ecf1a651378dbd8ed132fa313a 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_topology.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_topology.c
@@ -1863,10 +1863,13 @@ static void kfd_topology_set_dbg_firmware_support(struct kfd_topology_device *de
  {
         bool firmware_supported = true;
  
+       /*
+        * FIXME: GFX11 FW currently not sufficient to deal with CWSR WA.
+        * Updated FW with API changes coming soon.
+        */
         if (KFD_GC_VERSION(dev->gpu) >= IP_VERSION(11, 0, 0) &&
                         KFD_GC_VERSION(dev->gpu) < IP_VERSION(12, 0, 0)) {
-               firmware_supported =
-                       (dev->gpu->adev->mes.sched_version & AMDGPU_MES_VERSION_MASK) >= 9;
+               firmware_supported = false;
                 goto out;
         }
author	Jonathan Kim <jonathan.kim@amd.com>
	Thu, 1 Sep 2022 15:27:15 +0000 (11:27 -0400)
committer	Alex Deucher <alexander.deucher@amd.com>
	Fri, 9 Jun 2023 16:35:52 +0000 (12:35 -0400)
drivers/gpu/drm/amd/amdgpu/amdgpu_mes.h		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/mes_v11_0.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_chardev.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_debug.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_debug.h		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_device_queue_manager.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_cik.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v10.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v11.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v9.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_vi.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_priv.h		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_process_queue_manager.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_topology.c		patch \| blob \| history