x86/mce: Remove old CMCI storm mitigation code
authorTony Luck <tony.luck@intel.com>
Wed, 15 Nov 2023 19:54:48 +0000 (11:54 -0800)
committerBorislav Petkov (AMD) <bp@alien8.de>
Fri, 15 Dec 2023 12:44:12 +0000 (13:44 +0100)
commit3ed57b41a4125609e9fd03e32228aec61d95fe1f
treecbd8d4c52f587ba80c8b1f63489603b68e7fe7c6
parentcf0573939d3f4ce822ceb742a8179f38697b1953
x86/mce: Remove old CMCI storm mitigation code

When a "storm" of corrected machine check interrupts (CMCI) is detected
this code mitigates by disabling CMCI interrupt signalling from all of
the banks owned by the CPU that saw the storm.

There are problems with this approach:

1) It is very coarse grained. In all likelihood only one of the banks
   was generating the interrupts, but CMCI is disabled for all.  This
   means Linux may delay seeing and processing errors logged from other
   banks.

2) Although CMCI stands for Corrected Machine Check Interrupt, it is
   also used to signal when an uncorrected error is logged. This is
   a problem because these errors should be handled in a timely manner.

Delete all this code in preparation for a finer grained solution.

Signed-off-by: Tony Luck <tony.luck@intel.com>
Signed-off-by: Borislav Petkov (AMD) <bp@alien8.de>
Reviewed-by: Yazen Ghannam <yazen.ghannam@amd.com>
Tested-by: Yazen Ghannam <yazen.ghannam@amd.com>
Link: https://lore.kernel.org/r/20231115195450.12963-2-tony.luck@intel.com
arch/x86/kernel/cpu/mce/core.c
arch/x86/kernel/cpu/mce/intel.c
arch/x86/kernel/cpu/mce/internal.h