Enable parallel direct writes on the same file.
authorDharmendra singh <dsingh@ddn.com>
Fri, 8 Apr 2022 10:18:27 +0000 (10:18 +0000)
committerNikolaus Rath <Nikolaus@rath.org>
Fri, 3 Mar 2023 12:41:49 +0000 (12:41 +0000)
Right now fuse kernel serializes direct writes on the
same file. This serialization is good for such FUSE
implementations which rely on the inode lock to
avoid any data inconsistency issues but it hurts badly
such FUSE implementations which have their own mechanism
of dealing with cache/data integrity and can handle
parallel direct writes on the same file.

This patch allows parallel direct writes on the same file to be
enabled with the help of a flag FOPEN_PARALLEL_DIRECT_WRITES.
FUSE implementations which want to use this feature can
set this flag during fuse init. Default behaviour remains
same i.e no parallel direct writes on the same file.

Corresponding fuse kernel patch(Merged).
https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?h=v6.2&id=153524053bbb0d27bb2e0be36d1b46862e9ce74c

include/fuse.h
include/fuse_common.h
include/fuse_kernel.h
lib/fuse.c
lib/fuse_lowlevel.c

index 6f162dd07821cdda9b51fa1ed5113165ac1b2a7f..3cf0423f6727e87ecd210aa25703a25c0b0d627e 100644 (file)
@@ -274,6 +274,20 @@ struct fuse_config {
         * fuse_file_info argument is NULL.
         */
        int nullpath_ok;
+       /**
+        *  Allow parallel direct-io writes to operate on the same file.
+        *
+        *  FUSE implementations which do not handle parallel writes on
+        *  same file/region should NOT enable this option at all as it
+        *  might lead to data inconsistencies.
+        *
+        *  For the FUSE implementations which have their own mechanism
+        *  of cache/data integrity are beneficiaries of this setting as
+        *  it now open doors to parallel writes on the same file (without
+        *  enabling this setting, all direct writes on the same file are
+        *  serialized, resulting in huge data bandwidth loss).
+        */
+       int parallel_direct_writes;
 
        /**
         * The remaining options are used by libfuse internally and
index 06ee365a9eed414f257c8ed7883b6b3e72098365..d2e7fbe6c04fbd15c89201b5952115747e926697 100644 (file)
@@ -59,7 +59,7 @@ struct fuse_file_info {
            requests if write caching had been disabled. */
        unsigned int writepage : 1;
 
-       /** Can be filled in by open, to use direct I/O on this file. */
+       /** Can be filled in by open/create, to use direct I/O on this file. */
        unsigned int direct_io : 1;
 
        /** Can be filled in by open and opendir. It signals the kernel that any
@@ -68,6 +68,10 @@ struct fuse_file_info {
            the file/directory is closed. */
        unsigned int keep_cache : 1;
 
+       /** Can be filled by open/create, to allow parallel direct writes on this
+         *  file */
+        unsigned int parallel_direct_writes : 1;
+
        /** Indicates a flush operation.  Set in flush operation, also
            maybe set in highlevel lock operation and lowlevel release
            operation. */
@@ -93,7 +97,7 @@ struct fuse_file_info {
        unsigned int noflush : 1;
 
        /** Padding.  Reserved for future use*/
-       unsigned int padding : 24;
+       unsigned int padding : 23;
        unsigned int padding2 : 32;
 
        /** File handle id.  May be filled in by filesystem in create,
index 39cfb343faa8283f739583d9e6a9a063e8069c87..814a86fb9169f7b58959a17d27ab304b9583a1e2 100644 (file)
@@ -307,6 +307,7 @@ struct fuse_file_lock {
  * FOPEN_CACHE_DIR: allow caching this directory
  * FOPEN_STREAM: the file is stream-like (no file position at all)
  * FOPEN_NOFLUSH: don't flush data cache on close (unless FUSE_WRITEBACK_CACHE)
+ * FOPEN_PARALLEL_DIRECT_WRITES: allow parallel direct writes on the same file
  */
 #define FOPEN_DIRECT_IO                (1 << 0)
 #define FOPEN_KEEP_CACHE       (1 << 1)
@@ -314,7 +315,7 @@ struct fuse_file_lock {
 #define FOPEN_CACHE_DIR                (1 << 3)
 #define FOPEN_STREAM           (1 << 4)
 #define FOPEN_NOFLUSH          (1 << 5)
-
+#define FOPEN_PARALLEL_DIRECT_WRITES   (1 << 6)
 /**
  * INIT request/reply flags
  *
index a247d3c1cd2738ffa71d6cf1130b9ef44f3ea077..6b42a69cf6a202d9264ebd048428c43bcdff7d3e 100644 (file)
@@ -3145,7 +3145,9 @@ static void fuse_lib_create(fuse_req_t req, fuse_ino_t parent,
                                        fi->direct_io = 1;
                                if (f->conf.kernel_cache)
                                        fi->keep_cache = 1;
-
+                               if (fi->direct_io &&
+                                   f->conf.parallel_direct_writes)
+                                       fi->parallel_direct_writes = 1;
                        }
                }
                fuse_finish_interrupt(f, req, &d);
@@ -3229,6 +3231,10 @@ static void fuse_lib_open(fuse_req_t req, fuse_ino_t ino,
                        if (f->conf.no_rofd_flush &&
                            (fi->flags & O_ACCMODE) == O_RDONLY)
                                fi->noflush = 1;
+
+                       if (fi->direct_io && f->conf.parallel_direct_writes)
+                               fi->parallel_direct_writes = 1;
+
                }
                fuse_finish_interrupt(f, req, &d);
        }
@@ -4653,6 +4659,7 @@ static const struct fuse_opt fuse_lib_opts[] = {
        FUSE_LIB_OPT("noforget",              remember, -1),
        FUSE_LIB_OPT("remember=%u",           remember, 0),
        FUSE_LIB_OPT("modules=%s",            modules, 0),
+       FUSE_LIB_OPT("parallel_direct_write=%d", parallel_direct_writes, 0),
        FUSE_OPT_END
 };
 
index a0f8f00cfbf2dbb647c88a13cb0b1713563f8d21..baed664d474a944eb1b4fcd7256420a31701e265 100644 (file)
@@ -405,6 +405,8 @@ static void fill_open(struct fuse_open_out *arg,
                arg->open_flags |= FOPEN_NONSEEKABLE;
        if (f->noflush)
                arg->open_flags |= FOPEN_NOFLUSH;
+       if (f->parallel_direct_writes)
+               arg->open_flags |= FOPEN_PARALLEL_DIRECT_WRITES;
 }
 
 int fuse_reply_entry(fuse_req_t req, const struct fuse_entry_param *e)