drm/amdkfd: Update interrupt handling for GFX9.4.3

author Mukul Joshi <mukul.joshi@amd.com>

Fri, 30 Sep 2022 13:16:21 +0000 (09:16 -0400)

committer Alex Deucher <alexander.deucher@amd.com>

Fri, 9 Jun 2023 13:46:56 +0000 (09:46 -0400)
author Mukul Joshi <mukul.joshi@amd.com>
Fri, 30 Sep 2022 13:16:21 +0000 (09:16 -0400)
committer Alex Deucher <alexander.deucher@amd.com>
Fri, 9 Jun 2023 13:46:56 +0000 (09:46 -0400)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c

index c390b2856cc93bcf250bd4c2967ac407303d6432..22a900f298f2e1a1ddd0e6649696cae9eb97a253 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c
@@ -2434,6 +2434,9 @@ void amdgpu_vm_set_task_info(struct amdgpu_vm *vm)
   * amdgpu_vm_handle_fault - graceful handling of VM faults.
   * @adev: amdgpu device pointer
   * @pasid: PASID of the VM
+ * @vmid: VMID, only used for GFX 9.4.3.
+ * @node_id: Node_id received in IH cookie. Only applicable for
+ *           GFX 9.4.3.
   * @addr: Address of the fault
   * @write_fault: true is write fault, false is read fault
   *
@@ -2441,7 +2444,7 @@ void amdgpu_vm_set_task_info(struct amdgpu_vm *vm)
   * shouldn't be reported any more.
   */
  bool amdgpu_vm_handle_fault(struct amdgpu_device *adev, u32 pasid,
-                           u32 client_id, u32 node_id, uint64_t addr,
+                           u32 vmid, u32 node_id, uint64_t addr,
                             bool write_fault)
  {
         bool is_compute_context = false;
@@ -2466,7 +2469,7 @@ bool amdgpu_vm_handle_fault(struct amdgpu_device *adev, u32 pasid,
  
         addr /= AMDGPU_GPU_PAGE_SIZE;
  
-       if (is_compute_context && !svm_range_restore_pages(adev, pasid, client_id,
+       if (is_compute_context && !svm_range_restore_pages(adev, pasid, vmid,
             node_id, addr, write_fault)) {
                 amdgpu_bo_unref(&root);
                 return true;
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h

index dbab31647186b0cb83973d2d2c6217f8157c1598..8add5f5eb92a25234ad92bbe5c4938fd8f70685b 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h
@@ -455,7 +455,7 @@ void amdgpu_vm_check_compute_bug(struct amdgpu_device *adev);
  void amdgpu_vm_get_task_info(struct amdgpu_device *adev, u32 pasid,
                              struct amdgpu_task_info *task_info);
  bool amdgpu_vm_handle_fault(struct amdgpu_device *adev, u32 pasid,
-                           u32 client_id, u32 node_id, uint64_t addr,
+                           u32 vmid, u32 node_id, uint64_t addr,
                             bool write_fault);
  
  void amdgpu_vm_set_task_info(struct amdgpu_vm *vm);
diff --git a/drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c b/drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c

index c5752a349f3d9506c24d42882f62a8920d00c9f6..f2814270da4012ade9a45720350670f977d839d0 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c
@@ -587,7 +587,7 @@ static int gmc_v9_0_process_interrupt(struct amdgpu_device *adev,
  
                         cam_index = entry->src_data[2] & 0x3ff;
  
-                       ret = amdgpu_vm_handle_fault(adev, entry->pasid, entry->client_id, node_id,
+                       ret = amdgpu_vm_handle_fault(adev, entry->pasid, entry->vmid, node_id,
                                                      addr, write_fault);
                         WDOORBELL32(adev->irq.retry_cam_doorbell_index, cam_index);
                         if (ret)
@@ -610,7 +610,7 @@ static int gmc_v9_0_process_interrupt(struct amdgpu_device *adev,
                         /* Try to handle the recoverable page faults by filling page
                          * tables
                          */
-                       if (amdgpu_vm_handle_fault(adev, entry->pasid, entry->client_id, node_id,
+                       if (amdgpu_vm_handle_fault(adev, entry->pasid, entry->vmid, node_id,
                                                    addr, write_fault))
                                 return 1;
                 }
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h

index df372de6b056c282bca4f22e47c7dd6901db28a3..fb3cf2c51da80113b2e946b849ee470db7da82e6 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h
@@ -1073,18 +1073,14 @@ struct kfd_topology_device *kfd_topology_device_by_id(uint32_t gpu_id);
  struct kfd_node *kfd_device_by_id(uint32_t gpu_id);
  struct kfd_node *kfd_device_by_pci_dev(const struct pci_dev *pdev);
  struct kfd_node *kfd_device_by_adev(const struct amdgpu_device *adev);
-static inline bool kfd_irq_is_from_node(struct kfd_node *node, uint32_t client_id,
-                                    uint32_t node_id)
+static inline bool kfd_irq_is_from_node(struct kfd_node *node, uint32_t node_id,
+                                       uint32_t vmid)
  {
-       if ((node->interrupt_bitmap & (0x1U << node_id)) ||
-           ((node_id % 4) == 0 &&
-           (node->interrupt_bitmap >> 16) & (0x1U << client_id)))
-               return true;
-
-       return false;
+       return (node->interrupt_bitmap & (1 << node_id)) != 0 &&
+              (node->compute_vmid_bitmap & (1 << vmid)) != 0;
  }
  static inline struct kfd_node *kfd_node_by_irq_ids(struct amdgpu_device *adev,
-                                       uint32_t client_id, uint32_t node_id) {
+                                       uint32_t node_id, uint32_t vmid) {
         struct kfd_dev *dev = adev->kfd.dev;
         uint32_t i;
  
@@ -1092,7 +1088,7 @@ static inline struct kfd_node *kfd_node_by_irq_ids(struct amdgpu_device *adev,
                 return dev->nodes[0];
  
         for (i = 0; i < dev->num_nodes; i++)
-               if (kfd_irq_is_from_node(dev->nodes[i], client_id, node_id))
+               if (kfd_irq_is_from_node(dev->nodes[i], node_id, vmid))
                         return dev->nodes[i];
  
         return NULL;
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_svm.c b/drivers/gpu/drm/amd/amdkfd/kfd_svm.c

index 0dafbbe954ca4a97d6fda7605b0a9fa6903d1f1c..5d6e02559d8ee7189ca835124a9e80b7b84438a0 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_svm.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_svm.c
@@ -2799,7 +2799,7 @@ svm_fault_allowed(struct vm_area_struct *vma, bool write_fault)
  
  int
  svm_range_restore_pages(struct amdgpu_device *adev, unsigned int pasid,
-                       uint32_t client_id, uint32_t node_id,
+                       uint32_t vmid, uint32_t node_id,
                         uint64_t addr, bool write_fault)
  {
         struct mm_struct *mm = NULL;
@@ -2851,10 +2851,10 @@ svm_range_restore_pages(struct amdgpu_device *adev, unsigned int pasid,
                 goto out;
         }
  
-       node = kfd_node_by_irq_ids(adev, node_id, client_id);
+       node = kfd_node_by_irq_ids(adev, node_id, vmid);
         if (!node) {
-               pr_debug("kfd node does not exist node_id: %d, client_id: %d\n", node_id,
-                        client_id);
+               pr_debug("kfd node does not exist node_id: %d, vmid: %d\n", node_id,
+                        vmid);
                 r = -EFAULT;
                 goto out;
         }
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_svm.h b/drivers/gpu/drm/amd/amdkfd/kfd_svm.h

index a165c73b40b2805b0ad4e7596adc294b1ded6f00..5116786718b664d35a6cdef4d843486f2e96049c 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_svm.h
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_svm.h
@@ -173,7 +173,7 @@ int svm_range_split_by_granularity(struct kfd_process *p, struct mm_struct *mm,
                                unsigned long addr, struct svm_range *parent,
                                struct svm_range *prange);
  int svm_range_restore_pages(struct amdgpu_device *adev, unsigned int pasid,
-                           uint32_t client_id, uint32_t node_id, uint64_t addr,
+                           uint32_t vmid, uint32_t node_id, uint64_t addr,
                             bool write_fault);
  int svm_range_schedule_evict_svm_bo(struct amdgpu_amdkfd_fence *fence);
  void svm_range_add_list_work(struct svm_range_list *svms,
author	Mukul Joshi <mukul.joshi@amd.com>
	Fri, 30 Sep 2022 13:16:21 +0000 (09:16 -0400)
committer	Alex Deucher <alexander.deucher@amd.com>
	Fri, 9 Jun 2023 13:46:56 +0000 (09:46 -0400)
drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_priv.h		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_svm.c		patch \| blob \| history
drivers/gpu/drm/amd/amdkfd/kfd_svm.h		patch \| blob \| history