Merge patch series "scsi: target: Allow userspace to config cmd submission"
authorMartin K. Petersen <martin.petersen@oracle.com>
Fri, 13 Oct 2023 19:56:37 +0000 (15:56 -0400)
committerMartin K. Petersen <martin.petersen@oracle.com>
Fri, 13 Oct 2023 19:56:37 +0000 (15:56 -0400)
commit1caddfc5816e4bf55cf7962775e6ed509ddfdf9b
treee6d5b7166dc0c320a939825b2cfcda58d20d5d27
parent9f4c887fe64e27413509979b5be3fb2630d813ba
parent6dbc829d101d9edb41081de01968792a009c9a78
Merge patch series "scsi: target: Allow userspace to config cmd submission"

Mike Christie <michael.christie@oracle.com> says:

The following patches were made over Linus's tree but apply over
Martin's branches. They allow userspace to configure how fabric
drivers submit cmds to backend drivers.

Right now loop and vhost use a worker thread, and the other drivers
submit from the contexts they receive/process the cmd from. For
multiple LUN cases where the target can queue more cmds than the
backend can handle then deferring to a worker thread is safest because
the backend driver can block when doing things like waiting for a free
request/tag. Deferring also helps when the target has to handle
transport level requests from the recv context.

For cases where the backend devices can queue everything the target
sends, then there is no need to defer to a workqueue and you can see a
perf boost of up to 26% for small IO workloads. For a nvme device and
vhost-scsi I can see with 4K IOs:

fio jobs        1       2       4       8       10
--------------------------------------------------
workqueue
submit        94K     190K    394K    770K    890K

direct
submit       128K     252K    488K    950K    -

Link: https://lore.kernel.org/r/1b1f7a5c-0988-45f9-b103-dfed2c0405b1@oracle.com
Signed-off-by: Martin K. Petersen <martin.petersen@oracle.com>
drivers/scsi/qla2xxx/tcm_qla2xxx.c
drivers/target/target_core_configfs.c
drivers/target/target_core_transport.c