nvme: handle the persistent internal error AER
authorMichael Kelley <mikelley@microsoft.com>
Wed, 8 Jun 2022 18:52:21 +0000 (11:52 -0700)
committerJens Axboe <axboe@kernel.dk>
Tue, 2 Aug 2022 23:14:47 +0000 (17:14 -0600)
commit2c61c97fb12b806e1c8eb15f04c277ad097ec95e
tree15ecd40af4fb6d14c2e71be97471f20ea3d319f0
parentb7df575f8aac538878c1b2b3099f6d594626dfe8
nvme: handle the persistent internal error AER

In the NVM Express Revision 1.4 spec, Figure 145 describes possible
values for an AER with event type "Error" (value 000b). For a
Persistent Internal Error (value 03h), the host should perform a
controller reset.

Add support for this error using code that already exists for
doing a controller reset. As part of this support, introduce
two utility functions for parsing the AER type and subtype.

This new support was tested in a lab environment where we can
generate the persistent internal error on demand, and observe
both the Linux side and NVMe controller side to see that the
controller reset has been done.

Signed-off-by: Michael Kelley <mikelley@microsoft.com>
Signed-off-by: Christoph Hellwig <hch@lst.de>
Signed-off-by: Jens Axboe <axboe@kernel.dk>
drivers/nvme/host/core.c
include/linux/nvme.h