Диагностировать и заменить неисправный диск
Вы можете проверить состояние диска с помощью атрибутов SMART (Self-Monitoring, Analysis and Reporting Technology). Если по результатам проверки диск окажется неисправным, вы можете заменить неисправный диск.
Проверить состояние диска
1. Получить атрибуты SMART
Метод получения атрибутов SMART зависит от установленной на сервер операционной системы и от способа подключения диска к серверу:
- без RAID-контроллера — диск подключается напрямую в материнскую плату или через HBA-контроллер;
- через RAID-контроллер — диск подключается через контроллер Adaptec или MegaRAID, установленный на сервере.
Linux
Windows
Без RAID-контроллера
Adaptec
MegaRAID
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Установите пакет
smartmontools
— это набор утилит для мониторинга состояния HDD-дисков и SSD-накопителей, поддерживающих технологию SMART.apt-get install smartmontools
-
Выведите информацию о дисках, подключенных к серверу:
lsblk
В ответе появится информация о дисках. Запомните или скопируйте идентификаторы дисков. Например:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS
sda 8:0 0 1.8T 0 disk
└─sda1 8:1 0 1.8T 0 part /mnt/data
sdb 8:16 0 931.5G 0 disk
└─sdb1 8:17 0 931.5G 0 part /mnt/backup
nvme0n1 259:0 0 465.8G 0 disk
├─nvme0n1p1 259:1 0 512M 0 part /boot/efi
├─nvme0n1p2 259:2 0 16G 0 part [SWAP]
└─nvme0n1p3 259:3 0 449.3G 0 part /Здесь
sda
,sdb
,nvme0n1
— идентификаторы дисков. -
Запустите чтение атрибутов SMART. Команда для запуска зависит от интерфейса диска:
- для SATA:
smartctl -iA /dev/<disk_id>
Укажите
<disk_id>
— идентификатор диска, который вы скопировали на шаге 3.- для NVME:
nvme smart-log /dev/<disk_id>
Укажите
<disk_id>
— идентификатор диска, который вы скопировали на шаге 3.
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Установите пакет
smartmontools
— это набор утилит для мониторинга состояния HDD-дисков и SSD-накопителей, поддерживающих технологию SMART.apt-get install smartmontools
-
Получите номера RAID-контроллеров:
arcconf LIST
В ответе появится информация о RAID-контроллерах. Запомните или скопируйте номер RAID-контроллера. Например:
Controllers found: 1
----------------------------------------------------------------------
Controller information
----------------------------------------------------------------------
Controller ID : Status, Slot, Mode, Name, SerialNumber, WWN
----------------------------------------------------------------------
Controller 1: : Optimal, Slot 3, RAID, Adaptec SmartRAID, 0X00XXXX000, 50000D0000X01234Здесь
1
в значенииController 1
— номер RAID-контроллера. -
Получите идентификаторы дисков и номера каналов, на которых диски подключены к RAID-контроллеру:
arcconf getconfig <raid_number>
Укажите
<raid_number>
— номер RAID-контроллера, который вы скопировали на шаге 3.В ответе появится информация о дисках. Запомните или скопируйте идентификаторы дисков и номера каналов. Напр имер:
----------------------------------------------------------------------
Physical Device information
----------------------------------------------------------------------
Device #5
Device is a Hard drive
State : Online
Supported : Yes
Transfer Speed : SATA 3.0 Gb/s
Reported Channel,Device(T:L) : 0,5(5:0)Здесь
Reported Channel,Device(T:L): 0,5(5,0)
— информация о подключенном в контроллер диске, где:0
— номер канала контроллера, к которому подключен диск;5
— идентификатор диска на контроллере.
-
Получите идентификаторы SCSI-устройств:
sg_map
В ответе появится список соответствия SCSI-устройств (
/dev/sg\*
) блочным дискам (/dev/sd\*
). Запомните или скопируйте идентификаторы SCSI-устройств. Например:/dev/sg0 /dev/sda
/dev/sg1 /dev/sdbЗдесь
sg0
,sg1
— идентификаторы SCSI-устройств. -
Запустите чтение атрибутов SMART:
smartctl -iA -d aacraid,<raid_number>,<logical_unit_number>,<device_id> /dev/<scsi_id>
Укажите:
<raid_number>
— номер RAID-контроллера, который вы скопировали на шаге 3;<logical_unit_number>
— номер канала с диском, который вы скопировали на шаге 4;<device_id>
— идентификатор диска на RAID-контроллере, который вы скопировали на шаге 4;<scsi_id>
— идентификатор SCSI-устройства, который вы скопировали на шаге 5.
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Установите пакет
smartmontools
— это набор утилит для мониторинга состояния HDD-дисков и SSD-накопителей, поддерживающих технологию SMART.apt-get install smartmontools
-
Получите номера RAID-контроллеров:
storcli64 show all
В ответе появится информация о RAID-контроллерах. Запомните или скопируйте номер RAID-контроллера. Например:
System Overview :
===============
------------------------------------------------------------------------------------
Ctl Model Ports PDs DGs DNOpt VDs VNOpt BBU sPR DS EHS ASOs Hlth
------------------------------------------------------------------------------------
0 AVAGOMegaRAIDSAS9361-8i 8 4 2 0 2 0 Opt On 1&2 Y 3 Opt
------------------------------------------------------------------------------------Здесь
0
в полеCtl
— номер RAID-контроллера. -
Получите индексы дисков, которые установлены на RAID-контроллере:
storcli /c<raid_number> show all
Укажите
<raid_number>
— номер RAID-контроллера, который вы скопировали на шаге 3.В ответе появится информация о дисках, подключенных к RAID-контроллеру. Запомните или скопируйте индексы дисков. Например:
Drive Information :
---------------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
---------------------------------------------------------------------------------
252:4 39 Onln 1 446.625 GB SATA SSD N N 512B INTEL SSDSC2KB480G8 U -
252:5 40 Onln 0 893.750 GB SATA SSD N N 512B INTEL SSDSC2KB960G8 U -
---------------------------------------------------------------------------------Здесь значения
39
,40
в полеDID
— индексы дисков. -
Получите идентификаторы дисков, которые установлены на RAID-контроллере:
lsscsi
В ответе появится информация о дисках. Запомните или скопируйте идентификаторы дисков. Например:
[32:0:0:0] disk LSI MR9271-8i 3.46 /dev/sda
[32:1:0:0] disk LSI MR9271-8i 3.46 /dev/sdbЗдесь
sda
,sdb
— идентификаторы дисков. -
Запустите чтение атрибутов SMART:
smartctl -iA -d megaraid,<disk_index> /dev/<disk_id>
Укажите:
<disk_index>
— индекс диска, который вы скопировали на шаге 4;<disk_id>
— идентификатор диска, который вы скопировали на шаге 5.
Без RAID-контроллера
Adaptec
MegaRAID
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Установите smartmontools — это набор утилит для мониторинга состояния HDD-дисков и SSD-накопителей, поддерживающих технологию SMART.
-
Запустите PowerShell от имени администратора.
-
Получите идентификаторы дисков:
smartctl --scan
В ответе появится информация о дисках. Запомните или скопируйте идентификаторы дисков. Например:
/dev/sda -d ata # Kingston SSD
/dev/sdb -d ata # Seagate HDD
/dev/nvme0 -d nvme # Samsung NVMeЗдесь
sda
,sdb
,nvme0
— идентификаторы дисков. -
Запустите чтение атрибутов SMART. Команда для запуска зависит от интерфейса диска:
smartctl -A /dev/<disk_id>
Укажите
<disk_id>
— идентификатор диска, который вы скопировали на шаге 4.
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Скачайте и установите Adaptec maxView Storage Manager — это графический интерфейс для управления и мониторинга RAID-контроллеров Adaptec. С его помощью можно просматривать атрибуты SMART для каждого физического диска.
-
Запустите maxView Storage Manager.
-
В меню Enterprise View разверните список дисков для нужного RAID-контроллера.
-
Выберите диск.
-
Откройте вкладку SMART.
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Скачайте и установите StorCLI — это утилита для управления RAID-контроллерами MegaRAID.
-
Запустите PowerShell от имени администратора.
-
Получите номера RAID-контроллеров:
storcli64 show all
В ответе появится информация о RAID-контроллерах. Запомните или скопируйте номер RAID-контроллера. Например:
System Overview :
===============
------------------------------------------------------------------------------------
Ctl Model Ports PDs DGs DNOpt VDs VNOpt BBU sPR DS EHS ASOs Hlth
------------------------------------------------------------------------------------
0 AVAGOMegaRAIDSAS9361-8i 8 4 2 0 2 0 Opt On 1&2 Y 3 Opt
------------------------------------------------------------------------------------Здесь
0
в полеCtl
— номер RAID-контроллера. -
Получите идентификатор корпуса и номера слотов, в которые установлены диски на RAID-контроллере:
storcli /c<raid_number> /eall /sall show all
Укажите
<raid_number>
— номер RAID-контроллера, который вы скопировали на шаге 4.В ответе появится информация о дисках. Запомните или скопируйте идентификатор корпуса и номера слотов. Например:
Drive Information :
---------------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
---------------------------------------------------------------------------------
252:4 39 Onln 1 446.625 GB SATA SSD N N 512B INTEL SSDSC2KB480G8 U -
252:5 40 Onln 0 893.750 GB SATA SSD N N 512B INTEL SSDSC2KB960G8 U -
---------------------------------------------------------------------------------Здесь:
- значение
252
в полеEID
— идентификатор корпуса, в котором установлен диск; - значения
4
,5
в полеSlt
— номер слота в корпусе, где установлен диск.
- значение
-
Запустите чтение атрибутов SMART:
storcli /c<raid_number> /e<enclosure_id> /s<slot_id> show all
Укажите:
<enclosure_id>
— идентификатор корпуса, который вы скопировали на шаге 5;<slot_id>
— номер слота в корпусе, который вы скопировали на шаге 5.
2. Оценить атрибуты SMART
Диск считается неисправным, если хотя бы один из атрибутов SMART подходит под указанные условия.
HDD-диски
SSD-накопители
NVME-накопители
Заменить неисправный диск
Установить неисправность диска можно в результате проверки состояния диска. Если в результате оценки атрибутов SMART диск оказался неисправен, вы можете инициировать его замену. Для этого:
- Получите серийный номер неисправного диска.
- Согласуйте замену диска.
- Удалите диск из RAID-массива.
- Подсветите диск.
- Проверьте диск в системе.
- Добавить диск в RAID-массив.
1. Получить серийный номер неисправного диска
Linux
Windows
Без RAID-контроллера
Adaptec
MegaRAID
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Получите серийный номер неисправного диска, для этого выведите информацию о дисках:
lsblk -o name,serial,model