Диагностировать и заменить неисправный диск
Вы можете проверить состояние диска с помощью атрибутов SMART (Self-Monitoring, Analysis and Reporting Technology). Если по результатам проверки диск окажется неисправным, вы можете заменить неисправный диск.
Проверить состояние диска
1. Получить атрибуты SMART
Метод получения атрибутов SMART зависит от установленной на сервер операционной системы и от способа подключения диска к серверу:
- без RAID-контроллера — диск подключается напрямую в материнскую плату или через HBA-контроллер;
- через RAID-контроллер — диск подключается через контроллер Adaptec или MegaRAID, установленный на сервере.
Linux
Windows
Без RAID-контроллера
Adaptec
MegaRAID
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Установите пакет
smartmontools
— это набор утилит для мониторинга состояния HDD-дисков и SSD-накопителей, поддерживающих технологию SMART.apt-get install smartmontools
-
Выведите информацию о дисках, подключенных к серверу:
lsblk
В ответе появится информация о дисках. Запомните или скопируйте идентификаторы дисков. Например:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS
sda 8:0 0 1.8T 0 disk
└─sda1 8:1 0 1.8T 0 part /mnt/data
sdb 8:16 0 931.5G 0 disk
└─sdb1 8:17 0 931.5G 0 part /mnt/backup
nvme0n1 259:0 0 465.8G 0 disk
├─nvme0n1p1 259:1 0 512M 0 part /boot/efi
├─nvme0n1p2 259:2 0 16G 0 part [SWAP]
└─nvme0n1p3 259:3 0 449.3G 0 part /Здесь
sda
,sdb
,nvme0n1
— идентификаторы дисков. -
Запустите чтение атрибутов SMART. Команда для запуска зависит от интерфейса диска:
- для SATA:
smartctl -iA /dev/<disk_id>
Укажите
<disk_id>
— идентификатор диска, который вы скопировали на шаге 3.- для NVME:
nvme smart-log /dev/<disk_id>
Укажите
<disk_id>
— идентификатор диска, который вы скопировали на шаге 3.
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Установите пакет
smartmontools
— это набор утилит для мониторинга состояния HDD-дисков и SSD-накопителей, поддерживающих технологию SMART.apt-get install smartmontools
-
Получите номера RAID-контроллеров:
arcconf LIST
В ответе появится информация о RAID-контроллерах. Запомните или скопируйте номер RAID-контроллера. Например:
Controllers found: 1
----------------------------------------------------------------------
Controller information
----------------------------------------------------------------------
Controller ID : Status, Slot, Mode, Name, SerialNumber, WWN
----------------------------------------------------------------------
Controller 1: : Optimal, Slot 3, RAID, Adaptec SmartRAID, 0X00XXXX000, 50000D0000X01234Здесь
1
в значенииController 1
— номер RAID-контроллера. -
Получите идентификаторы дисков и номера каналов, на которых диски подключены к RAID-контроллеру:
arcconf getconfig <raid_number>
Укажите
<raid_number>
— номер RAID-контроллера, который вы скопировали на шаге 3.В ответе появится информация о дисках. Запомните или скопируйте идентификаторы дисков и номера каналов. Например:
----------------------------------------------------------------------
Physical Device information
----------------------------------------------------------------------
Device #5
Device is a Hard drive
State : Online
Supported : Yes
Transfer Speed : SATA 3.0 Gb/s
Reported Channel,Device(T:L) : 0,5(5:0)Здесь
Reported Channel,Device(T:L): 0,5(5,0)
— информация о подключенном в контроллер диске, где:0
— номер канала контроллера, к которому подключен диск;5
— идентификатор диска на контроллере.
-
Получите идентификаторы SCSI-устройств:
sg_map
В ответе появится список соответствия SCSI-устройств (
/dev/sg\*
) блочным дискам (/dev/sd\*
). Запомните или скопируйте идентификаторы SCSI-устройств. Например:/dev/sg0 /dev/sda
/dev/sg1 /dev/sdbЗдесь
sg0
,sg1
— идентификаторы SCSI-устройств. -
Запустите чтение атрибутов SMART:
smartctl -iA -d aacraid,<raid_number>,<logical_unit_number>,<device_id> /dev/<scsi_id>