NFSD: Fix checksum mismatches in the duplicate reply cache
authorChuck Lever <chuck.lever@oracle.com>
Fri, 10 Nov 2023 16:28:45 +0000 (11:28 -0500)
committerChuck Lever <chuck.lever@oracle.com>
Fri, 17 Nov 2023 20:13:01 +0000 (15:13 -0500)
commitbf51c52a1f3c238d72c64e14d5e7702d3a245b82
treef59430c2604465b7ef714ab13ef09dd0e18589bc
parent1caf5f61dd8430ae5a0b4538afe4953ce7517cbb
NFSD: Fix checksum mismatches in the duplicate reply cache

nfsd_cache_csum() currently assumes that the server's RPC layer has
been advancing rq_arg.head[0].iov_base as it decodes an incoming
request, because that's the way it used to work. On entry, it
expects that buf->head[0].iov_base points to the start of the NFS
header, and excludes the already-decoded RPC header.

These days however, head[0].iov_base now points to the start of the
RPC header during all processing. It no longer points at the NFS
Call header when execution arrives at nfsd_cache_csum().

In a retransmitted RPC the XID and the NFS header are supposed to
be the same as the original message, but the contents of the
retransmitted RPC header can be different. For example, for krb5,
the GSS sequence number will be different between the two. Thus if
the RPC header is always included in the DRC checksum computation,
the checksum of the retransmitted message might not match the
checksum of the original message, even though the NFS part of these
messages is identical.

The result is that, even if a matching XID is found in the DRC,
the checksum mismatch causes the server to execute the
retransmitted RPC transaction again.

Reviewed-by: Jeff Layton <jlayton@kernel.org>
Tested-by: Jeff Layton <jlayton@kernel.org>
Signed-off-by: Chuck Lever <chuck.lever@oracle.com>
fs/nfsd/cache.h
fs/nfsd/nfscache.c
fs/nfsd/nfssvc.c