drm/amdgpu: fix concurrent VM flushes on Vega/Navi v2

author Christian König <christian.koenig@amd.com>

Thu, 22 Apr 2021 11:11:39 +0000 (13:11 +0200)

committer Alex Deucher <alexander.deucher@amd.com>

Fri, 23 Apr 2021 21:19:05 +0000 (17:19 -0400)
author Christian König <christian.koenig@amd.com>
Thu, 22 Apr 2021 11:11:39 +0000 (13:11 +0200)
committer Alex Deucher <alexander.deucher@amd.com>
Fri, 23 Apr 2021 21:19:05 +0000 (17:19 -0400)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_ids.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_ids.c

index 94b069630db3652009f7003700be3f668e33c5d5..b4971e90b98cfc613506e4729d02f6d3cf8f30cd 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ids.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ids.c
@@ -215,7 +215,11 @@ static int amdgpu_vmid_grab_idle(struct amdgpu_vm *vm,
         /* Check if we have an idle VMID */
         i = 0;
         list_for_each_entry((*idle), &id_mgr->ids_lru, list) {
-               fences[i] = amdgpu_sync_peek_fence(&(*idle)->active, ring);
+               /* Don't use per engine and per process VMID at the same time */
+               struct amdgpu_ring *r = adev->vm_manager.concurrent_flush ?
+                       NULL : ring;
+
+               fences[i] = amdgpu_sync_peek_fence(&(*idle)->active, r);
                 if (!fences[i])
                         break;
                 ++i;
@@ -281,7 +285,7 @@ static int amdgpu_vmid_grab_reserved(struct amdgpu_vm *vm,
         if (updates && (*id)->flushed_updates &&
             updates->context == (*id)->flushed_updates->context &&
             !dma_fence_is_later(updates, (*id)->flushed_updates))
-           updates = NULL;
+               updates = NULL;
  
         if ((*id)->owner != vm->immediate.fence_context ||
             job->vm_pd_addr != (*id)->pd_gpu_addr ||
@@ -290,6 +294,10 @@ static int amdgpu_vmid_grab_reserved(struct amdgpu_vm *vm,
              !dma_fence_is_signaled((*id)->last_flush))) {
                 struct dma_fence *tmp;
  
+               /* Don't use per engine and per process VMID at the same time */
+               if (adev->vm_manager.concurrent_flush)
+                       ring = NULL;
+
                 /* to prevent one context starved by another context */
                 (*id)->pd_gpu_addr = 0;
                 tmp = amdgpu_sync_peek_fence(&(*id)->active, ring);
@@ -365,12 +373,7 @@ static int amdgpu_vmid_grab_used(struct amdgpu_vm *vm,
                 if (updates && (!flushed || dma_fence_is_later(updates, flushed)))
                         needs_flush = true;
  
-               /* Concurrent flushes are only possible starting with Vega10 and
-                * are broken on Navi10 and Navi14.
-                */
-               if (needs_flush && (adev->asic_type < CHIP_VEGA10 ||
-                                   adev->asic_type == CHIP_NAVI10 ||
-                                   adev->asic_type == CHIP_NAVI14))
+               if (needs_flush && !adev->vm_manager.concurrent_flush)
                         continue;
  
                 /* Good, we can use this VMID. Remember this submission as
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c

index 116b75413a3511d72a1603458b121269e673faf5..16252d48e5a4c509e9c9b454efac0f967d801f31 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c
@@ -3160,6 +3160,12 @@ void amdgpu_vm_manager_init(struct amdgpu_device *adev)
  {
         unsigned i;
  
+       /* Concurrent flushes are only possible starting with Vega10 and
+        * are broken on Navi10 and Navi14.
+        */
+       adev->vm_manager.concurrent_flush = !(adev->asic_type < CHIP_VEGA10 ||
+                                             adev->asic_type == CHIP_NAVI10 ||
+                                             adev->asic_type == CHIP_NAVI14);
         amdgpu_vmid_mgr_init(adev);
  
         adev->vm_manager.fence_context =
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h

index 6a9dcedfcf89626755ed58197dfc289b3cba0377..e5a3f18be2b78a176653ffaea217fc69714973fa 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h
@@ -328,6 +328,7 @@ struct amdgpu_vm_manager {
         /* Handling of VMIDs */
         struct amdgpu_vmid_mgr                  id_mgr[AMDGPU_MAX_VMHUBS];
         unsigned int                            first_kfd_vmid;
+       bool                                    concurrent_flush;
  
         /* Handling of VM fences */
         u64                                     fence_context;
author	Christian König <christian.koenig@amd.com>
	Thu, 22 Apr 2021 11:11:39 +0000 (13:11 +0200)
committer	Alex Deucher <alexander.deucher@amd.com>
	Fri, 23 Apr 2021 21:19:05 +0000 (17:19 -0400)
drivers/gpu/drm/amd/amdgpu/amdgpu_ids.c		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h		patch \| blob \| history