bcachefs: Check if extending inode differently

author Kent Overstreet <kent.overstreet@gmail.com>

Wed, 9 Oct 2019 13:44:36 +0000 (09:44 -0400)

committer Kent Overstreet <kent.overstreet@linux.dev>

Sun, 22 Oct 2023 21:08:29 +0000 (17:08 -0400)
author Kent Overstreet <kent.overstreet@gmail.com>
Wed, 9 Oct 2019 13:44:36 +0000 (09:44 -0400)
committer Kent Overstreet <kent.overstreet@linux.dev>
Sun, 22 Oct 2023 21:08:29 +0000 (17:08 -0400)
diff --git a/fs/bcachefs/fs-io.c b/fs/bcachefs/fs-io.c

index 0756b11ae3e487bb247c30a8143046bc974eea15..de3c6f8c4b049fa3be7d1c3cdbb7daa6c3392d77 100644 (file)
--- a/fs/bcachefs/fs-io.c
+++ b/fs/bcachefs/fs-io.c
@@ -243,12 +243,14 @@ static int sum_sector_overwrites(struct btree_trans *trans,
                                  struct btree_iter *extent_iter,
                                  struct bkey_i *new,
                                  bool may_allocate,
+                                bool *maybe_extending,
                                  s64 *delta)
  {
         struct btree_iter *iter;
         struct bkey_s_c old;
         int ret = 0;
  
+       *maybe_extending = true;
         *delta = 0;
  
         iter = bch2_trans_copy_iter(trans, extent_iter);
@@ -270,8 +272,27 @@ static int sum_sector_overwrites(struct btree_trans *trans,
                         (bkey_extent_is_allocation(&new->k) -
                          bkey_extent_is_allocation(old.k));
  
-               if (bkey_cmp(old.k->p, new->k.p) >= 0)
+               if (bkey_cmp(old.k->p, new->k.p) >= 0) {
+                       /*
+                        * Check if there's already data above where we're
+                        * going to be writing to - this means we're definitely
+                        * not extending the file:
+                        *
+                        * Note that it's not sufficient to check if there's
+                        * data up to the sector offset we're going to be
+                        * writing to, because i_size could be up to one block
+                        * less:
+                        */
+                       if (!bkey_cmp(old.k->p, new->k.p))
+                               old = bch2_btree_iter_next(iter);
+
+                       if (old.k && !bkey_err(old) &&
+                           old.k->p.inode == extent_iter->pos.inode &&
+                           bkey_extent_is_data(old.k))
+                               *maybe_extending = false;
+
                         break;
+               }
         }
  
         bch2_trans_iter_put(trans, iter);
@@ -293,7 +314,7 @@ int bch2_extent_update(struct btree_trans *trans,
         struct btree_iter *inode_iter = NULL;
         struct bch_inode_unpacked inode_u;
         struct bkey_inode_buf inode_p;
-       bool extended = false;
+       bool extending = false;
         s64 i_sectors_delta;
         int ret;
  
@@ -301,8 +322,8 @@ int bch2_extent_update(struct btree_trans *trans,
         if (ret)
                 return ret;
  
-       ret = sum_sector_overwrites(trans, extent_iter, k,
-                                   may_allocate, &i_sectors_delta);
+       ret = sum_sector_overwrites(trans, extent_iter, k, may_allocate,
+                                   &extending, &i_sectors_delta);
         if (ret)
                 return ret;
  
@@ -310,27 +331,34 @@ int bch2_extent_update(struct btree_trans *trans,
  
         new_i_size = min(k->k.p.offset << 9, new_i_size);
  
-       /* XXX: inode->i_size locking */
-       if (i_sectors_delta ||
-           new_i_size > inode->ei_inode.bi_size) {
+       if (i_sectors_delta || extending) {
                 inode_iter = bch2_inode_peek(trans, &inode_u,
                                 k->k.p.inode, BTREE_ITER_INTENT);
                 if (IS_ERR(inode_iter))
                         return PTR_ERR(inode_iter);
  
-               inode_u.bi_sectors += i_sectors_delta;
-
                 /*
-                * XXX: can BCH_INODE_I_SIZE_DIRTY be true here? i.e. can we
-                * race with truncate?
+                * XXX:
+                * writeback can race a bit with truncate, because truncate
+                * first updates the inode then truncates the pagecache. This is
+                * ugly, but lets us preserve the invariant that the in memory
+                * i_size is always >= the on disk i_size.
+                *
+               BUG_ON(new_i_size > inode_u.bi_size &&
+                      (inode_u.bi_flags & BCH_INODE_I_SIZE_DIRTY));
                  */
+               BUG_ON(new_i_size > inode_u.bi_size && !extending &&
+                      !(inode_u.bi_flags & BCH_INODE_I_SIZE_DIRTY));
+
                 if (!(inode_u.bi_flags & BCH_INODE_I_SIZE_DIRTY) &&
-                   new_i_size > inode_u.bi_size) {
+                   new_i_size > inode_u.bi_size)
                         inode_u.bi_size = new_i_size;
-                       extended = true;
-               }
+               else
+                       extending = false;
+
+               inode_u.bi_sectors += i_sectors_delta;
  
-               if (i_sectors_delta || extended) {
+               if (i_sectors_delta || extending) {
                         bch2_inode_pack(&inode_p, &inode_u);
                         bch2_trans_update(trans, inode_iter,
                                           &inode_p.inode.k_i);
@@ -346,14 +374,14 @@ int bch2_extent_update(struct btree_trans *trans,
         if (ret)
                 goto err;
  
-       if (i_sectors_delta || extended) {
+       if (i_sectors_delta || extending) {
                 inode->ei_inode.bi_sectors      = inode_u.bi_sectors;
                 inode->ei_inode.bi_size         = inode_u.bi_size;
         }
  
         if (direct)
                 i_sectors_acct(c, inode, quota_res, i_sectors_delta);
-       if (direct && extended) {
+       if (direct && extending) {
                 spin_lock(&inode->v.i_lock);
                 if (new_i_size > inode->v.i_size)
                         i_size_write(&inode->v, new_i_size);
@@ -2241,8 +2269,7 @@ out:
  /* truncate: */
  
  int bch2_fpunch_at(struct btree_trans *trans, struct btree_iter *iter,
-                  struct bpos end, struct bch_inode_info *inode,
-                  u64 new_i_size)
+                  struct bpos end, struct bch_inode_info *inode)
  {
         struct bch_fs *c        = trans->c;
         unsigned max_sectors    = KEY_SIZE_MAX & (~0 << c->block_bits);
@@ -2270,7 +2297,7 @@ int bch2_fpunch_at(struct btree_trans *trans, struct btree_iter *iter,
  
                 ret = bch2_extent_update(trans, inode,
                                 &disk_res, NULL, iter, &delete,
-                               new_i_size, false, true, NULL);
+                               0, false, true, NULL);
                 bch2_disk_reservation_put(c, &disk_res);
  btree_err:
                 if (ret == -EINTR) {
@@ -2303,8 +2330,7 @@ static int __bch2_fpunch(struct bch_fs *c, struct bch_inode_info *inode,
                                    BTREE_ITER_INTENT);
  
         ret = bch2_fpunch_at(&trans, iter,
-                            POS(inode->v.i_ino, end_offset),
-                            inode, 0);
+                       POS(inode->v.i_ino, end_offset), inode);
  
         bch2_trans_exit(&trans);
  
diff --git a/fs/bcachefs/fs-io.h b/fs/bcachefs/fs-io.h

index 861ec25ab9efcb67b380a4a00d7a3f6a124f4de8..5e48d21bd2e49d3125260ae0ee2a6d2f2f4c7fe4 100644 (file)
--- a/fs/bcachefs/fs-io.h
+++ b/fs/bcachefs/fs-io.h
@@ -19,7 +19,7 @@ int bch2_extent_update(struct btree_trans *,
                        struct bkey_i *,
                        u64, bool, bool, s64 *);
  int bch2_fpunch_at(struct btree_trans *, struct btree_iter *,
-                  struct bpos, struct bch_inode_info *, u64);
+                  struct bpos, struct bch_inode_info *);
  
  int __must_check bch2_write_inode_size(struct bch_fs *,
                                        struct bch_inode_info *,
diff --git a/fs/bcachefs/reflink.c b/fs/bcachefs/reflink.c

index f1b0e7fc8487a1143d5546650bb762f81a9422e5..de4c8b075a65e7c3c85640acae370cd7edd545bf 100644 (file)
--- a/fs/bcachefs/reflink.c
+++ b/fs/bcachefs/reflink.c
@@ -213,7 +213,7 @@ s64 bch2_remap_range(struct bch_fs *c,
  
                 if (bkey_cmp(dst_iter->pos, dst_want) < 0) {
                         ret = bch2_fpunch_at(&trans, dst_iter, dst_want,
-                                            dst_inode, new_i_size);
+                                            dst_inode);
                         if (ret)
                                 goto btree_err;
                         continue;
author	Kent Overstreet <kent.overstreet@gmail.com>
	Wed, 9 Oct 2019 13:44:36 +0000 (09:44 -0400)
committer	Kent Overstreet <kent.overstreet@linux.dev>
	Sun, 22 Oct 2023 21:08:29 +0000 (17:08 -0400)
fs/bcachefs/fs-io.c		patch \| blob \| history
fs/bcachefs/fs-io.h		patch \| blob \| history
fs/bcachefs/reflink.c		patch \| blob \| history