几年前我买了一台 Supermicro 存储服务器 – 具体来说是 SuperStorage 6047R-E1R36N。它最初配备了一个 LSI/Broadcom 2108 SAS2 RAID AOC HBA,该 HBA 连接到支持 24 个驱动器的前背板 (Supermicro BPN-SAS2-846EL1) 和后背板 (Supermicro BPN-SAS2-826EL1)。

因为我想使用软件 RAID 而不是硬件 RAID,所以我用 LSI 9207-8i 替换了 2108,并以与它要替换的 2108 相同的方式将其连接到前后背板。固件是 20.00.07.00-IT。

安装在前背板上的驱动器工作正常。但是当我尝试在后背板上安装驱动器时,虽然它们会被识别,但我一直收到错误。我知道这不是驱动器的问题,因为当我注意到错误时,我尝试将同一个驱动器移到前背板上,它们工作正常。我很确定这不是连接 9207 和后背板的电缆的问题,因为我曾尝试用全新的电缆替换它,但仍然收到相同的错误。我尝试了后背板的多个插槽,但仍然收到相同的错误。我能够对驱动器进行分区,但尝试写入它们一直失败。

我在服务器上运行 Debian,当驱动器在后背板上出现故障时,dmesg 显示以下错误 – 我对其进行了一些编辑,删除了相同错误的重复行:

[55896.254500] mpt2sas_cm0: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
[55896.254546] sd 0:0:26:0: [sdz] tag#3446 FAILED Result: hostbyte=DID_SOFT_ERROR driverbyte=DRIVER_OK
[55896.254558] sd 0:0:26:0: [sdz] tag#3446 CDB: Read(16) 88 00 00 00 00 00 02 0c 96 e0 00 00 00 18 00 00
[55896.254565] blk_update_request: I/O error, dev sdz, sector 34379488 op 0x0:(READ) flags 0x80700 phys_seg 3 prio class 0
55896.255545] sd 0:0:26:0: [sdz] tag#3436 FAILED Result: hostbyte=DID_SOFT_ERROR driverbyte=DRIVER_OK
[55896.255547] sd 0:0:26:0: [sdz] tag#3436 CDB: Read(16) 88 00 00 00 00 00 02 0c 94 60 00 00 00 18 00 00
[55896.255549] blk_update_request: I/O error, dev sdz, sector 34378848 op 0x0:(READ) flags 0x80700 phys_seg 3 prio class 0
[55897.004292] sd 0:0:26:0: Power-on or device reset occurred
[55902.038356] JBD2: Detected IO errors while flushing file data on sdz1-8
[55906.255274] scsi_io_completion_action: 22 callbacks suppressed
[55906.255276] print_req_error: 22 callbacks suppressed
[55906.255282] blk_update_request: I/O error, dev sdz, sector 34481280 op 0x0:(READ) flags 0x80700 phys_seg 30 prio class 0
[55906.255286] sd 0:0:26:0: [sdz] tag#3483 FAILED Result: hostbyte=DID_SOFT_ERROR driverbyte=DRIVER_OK
[55906.255994] sd 0:0:26:0: [sdz] tag#3483 CDB: Read(16) 88 00 00 00 00 00 01 f1 14 a0 00 00 03 60 00 00
[55906.255998] blk_update_request: I/O error, dev sdz, sector 32576672 op 0x0:(READ) flags 0x80700 phys_seg 108 prio class 0

我有点不知道如何进一步诊断或修复该问题。如果您能提供任何建议或推荐,我将不胜感激。

0