accel/ivpu: Fix locking in ivpu_bo_remove_all_bos_from_context()
authorJacek Lawrynowicz <jacek.lawrynowicz@linux.intel.com>
Tue, 31 Oct 2023 07:31:54 +0000 (08:31 +0100)
committerJacek Lawrynowicz <jacek.lawrynowicz@linux.intel.com>
Wed, 8 Nov 2023 15:27:35 +0000 (16:27 +0100)
ivpu_bo_remove_all_bos_from_context() could race with ivpu_bo_free()
when prime buffer was closed after vpu device was closed.

Move the bo_list from context to vdev and use a dedicated lock to
sync it. This list is not modified when BO is added/removed from
a context.

Also rename ivpu_bo_free_vpu_addr() to ivpu_bo_unbind() because this
function does more then just free vpu_addr.

Signed-off-by: Jacek Lawrynowicz <jacek.lawrynowicz@linux.intel.com>
Reviewed-by: Jeffrey Hugo <quic_jhugo@quicinc.com>
Link: https://patchwork.freedesktop.org/patch/msgid/20231031073156.1301669-3-stanislaw.gruszka@linux.intel.com
drivers/accel/ivpu/ivpu_drv.c
drivers/accel/ivpu/ivpu_drv.h
drivers/accel/ivpu/ivpu_gem.c
drivers/accel/ivpu/ivpu_gem.h
drivers/accel/ivpu/ivpu_mmu.c
drivers/accel/ivpu/ivpu_mmu_context.c
drivers/accel/ivpu/ivpu_mmu_context.h

index 60277ff6af69cb15207cd870c0c500f4465f701c..cc6a4dca2aaa45625817ece6f8951ddace2c4683 100644 (file)
@@ -91,8 +91,8 @@ static void file_priv_release(struct kref *ref)
        ivpu_dbg(vdev, FILE, "file_priv release: ctx %u\n", file_priv->ctx.id);
 
        ivpu_cmdq_release_all(file_priv);
-       ivpu_bo_remove_all_bos_from_context(&file_priv->ctx);
        ivpu_jsm_context_release(vdev, file_priv->ctx.id);
+       ivpu_bo_remove_all_bos_from_context(vdev, &file_priv->ctx);
        ivpu_mmu_user_context_fini(vdev, &file_priv->ctx);
        drm_WARN_ON(&vdev->drm, xa_erase_irq(&vdev->context_xa, file_priv->ctx.id) != file_priv);
        mutex_destroy(&file_priv->lock);
@@ -528,6 +528,11 @@ static int ivpu_dev_init(struct ivpu_device *vdev)
        xa_init_flags(&vdev->context_xa, XA_FLAGS_ALLOC);
        xa_init_flags(&vdev->submitted_jobs_xa, XA_FLAGS_ALLOC1);
        lockdep_set_class(&vdev->submitted_jobs_xa.xa_lock, &submitted_jobs_xa_lock_class_key);
+       INIT_LIST_HEAD(&vdev->bo_list);
+
+       ret = drmm_mutex_init(&vdev->drm, &vdev->bo_list_lock);
+       if (ret)
+               goto err_xa_destroy;
 
        ret = ivpu_pci_init(vdev);
        if (ret)
index 79b193ffbc26449d61b888d868976a35efb252ea..e0517ec4133d485fa1ce57085a9870fb5e2c7c5f 100644 (file)
@@ -115,6 +115,9 @@ struct ivpu_device {
        struct xarray context_xa;
        struct xa_limit context_xa_limit;
 
+       struct mutex bo_list_lock; /* Protects bo_list */
+       struct list_head bo_list;
+
        struct xarray submitted_jobs_xa;
        struct task_struct *job_done_thread;
 
index d1077cf90b6590c8807909f33dde822d6398ba19..915c53d7bb97b791bff154936e7ac54193b1c4aa 100644 (file)
@@ -26,6 +26,17 @@ static const struct drm_gem_object_funcs ivpu_gem_funcs;
 
 static struct lock_class_key prime_bo_lock_class_key;
 
+static inline void ivpu_dbg_bo(struct ivpu_device *vdev, struct ivpu_bo *bo, const char *action)
+{
+       if (bo->ctx)
+               ivpu_dbg(vdev, BO, "%6s: size %zu has_pages %d dma_mapped %d handle %u ctx %d vpu_addr 0x%llx mmu_mapped %d\n",
+                        action, bo->base.size, (bool)bo->pages, (bool)bo->sgt, bo->handle,
+                        bo->ctx->id, bo->vpu_addr, bo->mmu_mapped);
+       else
+               ivpu_dbg(vdev, BO, "%6s: size %zu has_pages %d dma_mapped %d handle %u (not added to context)\n",
+                        action, bo->base.size, (bool)bo->pages, (bool)bo->sgt, bo->handle);
+}
+
 static int __must_check prime_alloc_pages_locked(struct ivpu_bo *bo)
 {
        /* Pages are managed by the underlying dma-buf */
@@ -245,9 +256,8 @@ int __must_check ivpu_bo_pin(struct ivpu_bo *bo)
 
        mutex_lock(&bo->lock);
 
-       if (!bo->vpu_addr) {
-               ivpu_err(vdev, "vpu_addr not set for BO ctx_id: %d handle: %d\n",
-                        bo->ctx->id, bo->handle);
+       if (!bo->ctx) {
+               ivpu_err(vdev, "vpu_addr not allocated for BO %d\n", bo->handle);
                ret = -EINVAL;
                goto unlock;
        }
@@ -281,53 +291,68 @@ ivpu_bo_alloc_vpu_addr(struct ivpu_bo *bo, struct ivpu_mmu_context *ctx,
        struct ivpu_device *vdev = ivpu_bo_to_vdev(bo);
        int ret;
 
-       mutex_lock(&ctx->lock);
-       ret = ivpu_mmu_context_insert_node_locked(ctx, range, ivpu_bo_size(bo), &bo->mm_node);
+       mutex_lock(&bo->lock);
+
+       ret = ivpu_mmu_context_insert_node(ctx, range, bo->base.size, &bo->mm_node);
        if (!ret) {
                bo->ctx = ctx;
                bo->vpu_addr = bo->mm_node.start;
-               list_add_tail(&bo->ctx_node, &ctx->bo_list);
+       } else {
+               ivpu_err(vdev, "Failed to add BO to context %u: %d\n", ctx->id, ret);
        }
-       mutex_unlock(&ctx->lock);
+       ivpu_dbg_bo(vdev, bo, "alloc");
 
-       if (ret)
-               ivpu_err(vdev, "Failed to add BO to context %u: %d\n", ctx->id, ret);
+       mutex_unlock(&bo->lock);
 
        return ret;
 }
 
-static void ivpu_bo_free_vpu_addr(struct ivpu_bo *bo)
+static void ivpu_bo_unbind_locked(struct ivpu_bo *bo)
 {
        struct ivpu_device *vdev = ivpu_bo_to_vdev(bo);
-       struct ivpu_mmu_context *ctx = bo->ctx;
 
-       ivpu_dbg(vdev, BO, "remove from ctx: ctx %d vpu_addr 0x%llx allocated %d mmu_mapped %d\n",
-                ctx->id, bo->vpu_addr, (bool)bo->sgt, bo->mmu_mapped);
+       lockdep_assert_held(&bo->lock);
 
-       mutex_lock(&bo->lock);
+       ivpu_dbg_bo(vdev, bo, "unbind");
 
+       /* TODO: dma_unmap */
        if (bo->mmu_mapped) {
+               drm_WARN_ON(&vdev->drm, !bo->ctx);
+               drm_WARN_ON(&vdev->drm, !bo->vpu_addr);
                drm_WARN_ON(&vdev->drm, !bo->sgt);
-               ivpu_mmu_context_unmap_sgt(vdev, ctx, bo->vpu_addr, bo->sgt);
+               ivpu_mmu_context_unmap_sgt(vdev, bo->ctx, bo->vpu_addr, bo->sgt);
                bo->mmu_mapped = false;
        }
 
-       mutex_lock(&ctx->lock);
-       list_del(&bo->ctx_node);
-       bo->vpu_addr = 0;
-       bo->ctx = NULL;
-       ivpu_mmu_context_remove_node_locked(ctx, &bo->mm_node);
-       mutex_unlock(&ctx->lock);
+       if (bo->ctx) {
+               ivpu_mmu_context_remove_node(bo->ctx, &bo->mm_node);
+               bo->vpu_addr = 0;
+               bo->ctx = NULL;
+       }
+}
 
+static void ivpu_bo_unbind(struct ivpu_bo *bo)
+{
+       mutex_lock(&bo->lock);
+       ivpu_bo_unbind_locked(bo);
        mutex_unlock(&bo->lock);
 }
 
-void ivpu_bo_remove_all_bos_from_context(struct ivpu_mmu_context *ctx)
+void ivpu_bo_remove_all_bos_from_context(struct ivpu_device *vdev, struct ivpu_mmu_context *ctx)
 {
-       struct ivpu_bo *bo, *tmp;
+       struct ivpu_bo *bo;
+
+       if (drm_WARN_ON(&vdev->drm, !ctx))
+               return;
 
-       list_for_each_entry_safe(bo, tmp, &ctx->bo_list, ctx_node)
-               ivpu_bo_free_vpu_addr(bo);
+       mutex_lock(&vdev->bo_list_lock);
+       list_for_each_entry(bo, &vdev->bo_list, bo_list_node) {
+               mutex_lock(&bo->lock);
+               if (bo->ctx == ctx)
+                       ivpu_bo_unbind_locked(bo);
+               mutex_unlock(&bo->lock);
+       }
+       mutex_unlock(&vdev->bo_list_lock);
 }
 
 static struct ivpu_bo *
@@ -375,6 +400,10 @@ ivpu_bo_alloc(struct ivpu_device *vdev, u64 size, u32 flags, const struct ivpu_b
                }
        }
 
+       mutex_lock(&vdev->bo_list_lock);
+       list_add_tail(&bo->bo_list_node, &vdev->bo_list);
+       mutex_unlock(&vdev->bo_list_lock);
+
        return bo;
 
 err_release:
@@ -406,19 +435,16 @@ static void ivpu_bo_free(struct drm_gem_object *obj)
        struct ivpu_bo *bo = to_ivpu_bo(obj);
        struct ivpu_device *vdev = ivpu_bo_to_vdev(bo);
 
-       if (bo->ctx)
-               ivpu_dbg(vdev, BO, "free: ctx %d vpu_addr 0x%llx allocated %d mmu_mapped %d\n",
-                        bo->ctx->id, bo->vpu_addr, (bool)bo->sgt, bo->mmu_mapped);
-       else
-               ivpu_dbg(vdev, BO, "free: ctx (released) allocated %d mmu_mapped %d\n",
-                        (bool)bo->sgt, bo->mmu_mapped);
+       mutex_lock(&vdev->bo_list_lock);
+       list_del(&bo->bo_list_node);
+       mutex_unlock(&vdev->bo_list_lock);
 
        drm_WARN_ON(&vdev->drm, !dma_resv_test_signaled(obj->resv, DMA_RESV_USAGE_READ));
 
-       vunmap(bo->kvaddr);
+       ivpu_dbg_bo(vdev, bo, "free");
 
-       if (bo->ctx)
-               ivpu_bo_free_vpu_addr(bo);
+       ivpu_bo_unbind(bo);
+       vunmap(bo->kvaddr);
 
        if (bo->sgt)
                ivpu_bo_unmap_and_free_pages(bo);
@@ -435,10 +461,6 @@ static void ivpu_bo_free(struct drm_gem_object *obj)
 static int ivpu_bo_mmap(struct drm_gem_object *obj, struct vm_area_struct *vma)
 {
        struct ivpu_bo *bo = to_ivpu_bo(obj);
-       struct ivpu_device *vdev = ivpu_bo_to_vdev(bo);
-
-       ivpu_dbg(vdev, BO, "mmap: ctx %u handle %u vpu_addr 0x%llx size %zu type %s",
-                bo->ctx->id, bo->handle, bo->vpu_addr, ivpu_bo_size(bo), bo->ops->name);
 
        if (obj->import_attach) {
                /* Drop the reference drm_gem_mmap_obj() acquired.*/
@@ -553,9 +575,6 @@ ivpu_bo_create_ioctl(struct drm_device *dev, void *data, struct drm_file *file)
 
        drm_gem_object_put(&bo->base);
 
-       ivpu_dbg(vdev, BO, "alloc shmem: ctx %u vpu_addr 0x%llx size %zu flags 0x%x\n",
-                file_priv->ctx.id, bo->vpu_addr, ivpu_bo_size(bo), bo->flags);
-
        return ret;
 }
 
@@ -609,9 +628,6 @@ ivpu_bo_alloc_internal(struct ivpu_device *vdev, u64 vpu_addr, u64 size, u32 fla
                goto err_put;
        }
 
-       ivpu_dbg(vdev, BO, "alloc internal: ctx 0 vpu_addr 0x%llx size %zu flags 0x%x\n",
-                bo->vpu_addr, ivpu_bo_size(bo), flags);
-
        return bo;
 
 err_put:
@@ -708,41 +724,30 @@ static void ivpu_bo_print_info(struct ivpu_bo *bo, struct drm_printer *p)
 {
        unsigned long dma_refcount = 0;
 
+       mutex_lock(&bo->lock);
+
        if (bo->base.dma_buf && bo->base.dma_buf->file)
                dma_refcount = atomic_long_read(&bo->base.dma_buf->file->f_count);
 
        drm_printf(p, "%5u %6d %16llx %10lu %10u %12lu %14s\n",
-                  bo->ctx->id, bo->handle, bo->vpu_addr, ivpu_bo_size(bo),
+                  bo->ctx ? bo->ctx->id : -1, bo->handle, bo->vpu_addr, bo->base.size,
                   kref_read(&bo->base.refcount), dma_refcount, bo->ops->name);
+
+       mutex_unlock(&bo->lock);
 }
 
 void ivpu_bo_list(struct drm_device *dev, struct drm_printer *p)
 {
        struct ivpu_device *vdev = to_ivpu_device(dev);
-       struct ivpu_file_priv *file_priv;
-       unsigned long ctx_id;
        struct ivpu_bo *bo;
 
        drm_printf(p, "%5s %6s %16s %10s %10s %12s %14s\n",
                   "ctx", "handle", "vpu_addr", "size", "refcount", "dma_refcount", "type");
 
-       mutex_lock(&vdev->gctx.lock);
-       list_for_each_entry(bo, &vdev->gctx.bo_list, ctx_node)
+       mutex_lock(&vdev->bo_list_lock);
+       list_for_each_entry(bo, &vdev->bo_list, bo_list_node)
                ivpu_bo_print_info(bo, p);
-       mutex_unlock(&vdev->gctx.lock);
-
-       xa_for_each(&vdev->context_xa, ctx_id, file_priv) {
-               file_priv = ivpu_file_priv_get_by_ctx_id(vdev, ctx_id);
-               if (!file_priv)
-                       continue;
-
-               mutex_lock(&file_priv->ctx.lock);
-               list_for_each_entry(bo, &file_priv->ctx.bo_list, ctx_node)
-                       ivpu_bo_print_info(bo, p);
-               mutex_unlock(&file_priv->ctx.lock);
-
-               ivpu_file_priv_put(&file_priv);
-       }
+       mutex_unlock(&vdev->bo_list_lock);
 }
 
 void ivpu_bo_list_print(struct drm_device *dev)
index 9bbbcd7792658642429d3a5701003389aba759f7..214d8fd143106ffadafcc849ca7e1be1f39ebd65 100644 (file)
@@ -17,10 +17,10 @@ struct ivpu_bo {
        const struct ivpu_bo_ops *ops;
 
        struct ivpu_mmu_context *ctx;
-       struct list_head ctx_node;
+       struct list_head bo_list_node;
        struct drm_mm_node mm_node;
 
-       struct mutex lock; /* Protects: pages, sgt, mmu_mapped */
+       struct mutex lock; /* Protects: pages, sgt, ctx, mmu_mapped, vpu_addr */
        struct sg_table *sgt;
        struct page **pages;
        bool mmu_mapped;
@@ -48,7 +48,7 @@ struct ivpu_bo_ops {
 };
 
 int ivpu_bo_pin(struct ivpu_bo *bo);
-void ivpu_bo_remove_all_bos_from_context(struct ivpu_mmu_context *ctx);
+void ivpu_bo_remove_all_bos_from_context(struct ivpu_device *vdev, struct ivpu_mmu_context *ctx);
 void ivpu_bo_list(struct drm_device *dev, struct drm_printer *p);
 void ivpu_bo_list_print(struct drm_device *dev);
 
index b46f3743c0e7d62d1c918812272b22e08b688e9a..2228c44b115fa0e4d48f36c115e2fdc7b434a8c0 100644 (file)
@@ -775,9 +775,12 @@ int ivpu_mmu_init(struct ivpu_device *vdev)
 
        ivpu_dbg(vdev, MMU, "Init..\n");
 
-       drmm_mutex_init(&vdev->drm, &mmu->lock);
        ivpu_mmu_config_check(vdev);
 
+       ret = drmm_mutex_init(&vdev->drm, &mmu->lock);
+       if (ret)
+               return ret;
+
        ret = ivpu_mmu_structs_alloc(vdev);
        if (ret)
                return ret;
index f6de6a4ea60884c9c0ebc1f8531a16374e32d492..122c90fecf6657f6bbcf5a6dc7f991af39dc3cc4 100644 (file)
@@ -335,6 +335,9 @@ ivpu_mmu_context_map_sgt(struct ivpu_device *vdev, struct ivpu_mmu_context *ctx,
        u64 prot;
        u64 i;
 
+       if (drm_WARN_ON(&vdev->drm, !ctx))
+               return -EINVAL;
+
        if (!IS_ALIGNED(vpu_addr, IVPU_MMU_PAGE_SIZE))
                return -EINVAL;
        /*
@@ -382,8 +385,8 @@ ivpu_mmu_context_unmap_sgt(struct ivpu_device *vdev, struct ivpu_mmu_context *ct
        int ret;
        u64 i;
 
-       if (!IS_ALIGNED(vpu_addr, IVPU_MMU_PAGE_SIZE))
-               ivpu_warn(vdev, "Unaligned vpu_addr: 0x%llx\n", vpu_addr);
+       if (drm_WARN_ON(&vdev->drm, !ctx))
+               return;
 
        mutex_lock(&ctx->lock);
 
@@ -404,30 +407,34 @@ ivpu_mmu_context_unmap_sgt(struct ivpu_device *vdev, struct ivpu_mmu_context *ct
 }
 
 int
-ivpu_mmu_context_insert_node_locked(struct ivpu_mmu_context *ctx,
-                                   const struct ivpu_addr_range *range,
-                                   u64 size, struct drm_mm_node *node)
+ivpu_mmu_context_insert_node(struct ivpu_mmu_context *ctx, const struct ivpu_addr_range *range,
+                            u64 size, struct drm_mm_node *node)
 {
-       lockdep_assert_held(&ctx->lock);
+       int ret;
 
        WARN_ON(!range);
 
+       mutex_lock(&ctx->lock);
        if (!ivpu_disable_mmu_cont_pages && size >= IVPU_MMU_CONT_PAGES_SIZE) {
-               if (!drm_mm_insert_node_in_range(&ctx->mm, node, size, IVPU_MMU_CONT_PAGES_SIZE, 0,
-                                                range->start, range->end, DRM_MM_INSERT_BEST))
-                       return 0;
+               ret = drm_mm_insert_node_in_range(&ctx->mm, node, size, IVPU_MMU_CONT_PAGES_SIZE, 0,
+                                                 range->start, range->end, DRM_MM_INSERT_BEST);
+               if (!ret)
+                       goto unlock;
        }
 
-       return drm_mm_insert_node_in_range(&ctx->mm, node, size, IVPU_MMU_PAGE_SIZE, 0,
-                                          range->start, range->end, DRM_MM_INSERT_BEST);
+       ret = drm_mm_insert_node_in_range(&ctx->mm, node, size, IVPU_MMU_PAGE_SIZE, 0,
+                                         range->start, range->end, DRM_MM_INSERT_BEST);
+unlock:
+       mutex_unlock(&ctx->lock);
+       return ret;
 }
 
 void
-ivpu_mmu_context_remove_node_locked(struct ivpu_mmu_context *ctx, struct drm_mm_node *node)
+ivpu_mmu_context_remove_node(struct ivpu_mmu_context *ctx, struct drm_mm_node *node)
 {
-       lockdep_assert_held(&ctx->lock);
-
+       mutex_lock(&ctx->lock);
        drm_mm_remove_node(node);
+       mutex_unlock(&ctx->lock);
 }
 
 static int
@@ -437,7 +444,6 @@ ivpu_mmu_context_init(struct ivpu_device *vdev, struct ivpu_mmu_context *ctx, u3
        int ret;
 
        mutex_init(&ctx->lock);
-       INIT_LIST_HEAD(&ctx->bo_list);
 
        ret = ivpu_mmu_pgtable_init(vdev, &ctx->pgtable);
        if (ret) {
index f15d8c630d8ad0b9b3b529881099976a552cb00f..535db3a1fc74ffc717c5fe35babcff285ea07b17 100644 (file)
@@ -23,10 +23,9 @@ struct ivpu_mmu_pgtable {
 };
 
 struct ivpu_mmu_context {
-       struct mutex lock; /* protects: mm, pgtable, bo_list */
+       struct mutex lock; /* Protects: mm, pgtable */
        struct drm_mm mm;
        struct ivpu_mmu_pgtable pgtable;
-       struct list_head bo_list;
        u32 id;
 };
 
@@ -39,11 +38,9 @@ int ivpu_mmu_user_context_init(struct ivpu_device *vdev, struct ivpu_mmu_context
 void ivpu_mmu_user_context_fini(struct ivpu_device *vdev, struct ivpu_mmu_context *ctx);
 void ivpu_mmu_user_context_mark_invalid(struct ivpu_device *vdev, u32 ssid);
 
-int ivpu_mmu_context_insert_node_locked(struct ivpu_mmu_context *ctx,
-                                       const struct ivpu_addr_range *range,
-                                       u64 size, struct drm_mm_node *node);
-void ivpu_mmu_context_remove_node_locked(struct ivpu_mmu_context *ctx,
-                                        struct drm_mm_node *node);
+int ivpu_mmu_context_insert_node(struct ivpu_mmu_context *ctx, const struct ivpu_addr_range *range,
+                                u64 size, struct drm_mm_node *node);
+void ivpu_mmu_context_remove_node(struct ivpu_mmu_context *ctx, struct drm_mm_node *node);
 
 int ivpu_mmu_context_map_sgt(struct ivpu_device *vdev, struct ivpu_mmu_context *ctx,
                             u64 vpu_addr, struct sg_table *sgt, bool llc_coherent);