fuse-loop/fuse_do_work: Avoid lots of thread creations/destructions
authorBernd Schubert <bschubert@ddn.com>
Thu, 24 Mar 2022 11:19:57 +0000 (12:19 +0100)
committerNikolaus Rath <Nikolaus@rath.org>
Sun, 4 Sep 2022 12:07:15 +0000 (13:07 +0100)
commitaf5710e7a3ad42e1b64ee8882fd72b22ffe271ac
tree9fffcd971131d4061069c382dc79b3bd8b92a501
parent30a126c5f9009e8ff8e369c563eb941679bec252
fuse-loop/fuse_do_work: Avoid lots of thread creations/destructions

On benchmarking metadata operations with a single threaded bonnie++
and "max_idle_threads" limited to 1, 'top' was showing suspicious
160% cpu usage.
Profiling the system with flame graphs showed that an astonishing
amount of CPU time was spent in thread creation and destruction.

After verifying the code it turned out that fuse_do_work() was
creating a new thread every time all existing idle threads
were already busy. And then just a few lines later after processing
the current request it noticed that it had created too many threads
and destructed the current thread. I.e. there was a thread
creation/destruction ping-pong.

Code is changed to only create new threads if the max number of
threads is not reached.

Furthermore, thread destruction is disabled, as creation/destruction
is expensive in general.

With this change cpu usage of passthrough_hp went from ~160% to
~80% (with different values of max_idle_threads). And bonnie
values got approximately faster by 90%. This is a with single
threaded bonnie++
bonnie++ -x 4 -q -s0  -d <path> -n 30:1:1:10 -r 0

Without this patch, using the default max_idle_threads=10 and just
a single bonnie++ the thread creation/destruction code path is not
triggered.  Just one libfuse and one application thread is just
a corner case - the requirement for the issue was just
n-application-threads >= max_idle_threads.

Signed-off-by: Bernd Schubert <bschubert@ddn.com>
example/passthrough_hp.cc
include/fuse_common.h
include/fuse_lowlevel.h
lib/fuse_i.h
lib/fuse_loop_mt.c
lib/fuse_versionscript
lib/helper.c