Диагностировать и заменить неисправный диск
Вы можете проверить состояние диска с помощью атрибутов SMART (Self-Monitoring, Analysis and Reporting Technology). Если по результатам проверки диск окажется неисправным, вы можете заменить неисправный диск.
Проверить состояние диска
1. Получить атрибуты SMART
Метод получения атрибутов SMART зависит от установленной на сервер операционной системы и от способа подключения диска к серверу:
- без RAID-контроллера — диск подключается напрямую в материнскую плату или через HBA-контроллер;
- через RAID-контроллер — диск подключается через контроллер Adaptec или MegaRAID, установленный на сервере.
Linux
Windows
Без RAID-контроллера
Adaptec
MegaRAID
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Установите пакет
smartmontools— это набор утилит для мониторинга состояния HDD-дисков и SSD-накопителей, поддерживающих технологию SMART.apt-get install smartmontools -
Выведите информацию о дисках:
lsblkВ ответе появится информация о дисках. Запомните или скопируйте имена дисков. Например:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTSsda 8:0 0 1.8T 0 disk└─sda1 8:1 0 1.8T 0 part /mnt/datasdb 8:16 0 931.5G 0 disk└─sdb1 8:17 0 931.5G 0 part /mnt/backupnvme0n1 259:0 0 465.8G 0 disk├─nvme0n1p1 259:1 0 512M 0 part /boot/efi├─nvme0n1p2 259:2 0 16G 0 part [SWAP]└─nvme0n1p3 259:3 0 449.3G 0 part /Здесь
sda,sdb,nvme0n1— имена дисков. -
Запустите чтение атрибутов SMART. Команда для запуска зависит от интерфейса диска:
- для SATA:
smartctl -iA /dev/<disk_name>Укажите
<disk_name>— имя диска, которое вы скопировали на шаге 3.- для NVME:
nvme smart-log /dev/<disk_name>Укажите
<disk_name>— имя диска, которое вы скопировали на шаге 3.
2. Оценить атрибуты SMART
Диск считается неисправным, если хотя бы один из атрибутов SMART подходит под указанные условия.
HDD-диски
SSD-накопители
NVME-накопители
Заменить неисправный диск
Установить неисправность диска можно в результате проверки состояния диска. Если в результате оценки атрибутов SMART диск оказался неисправен, вы можете инициировать его замену. Для этого:
- Получите серийный номер неисправного диска.
- Согласуйте замену диска.
- Если диск добавлен в RAID-массив, удалите диск из RAID-массива.
- Подсветите диск.
- Проверьте диск в системе.
- Если диск был в RAID-массиве, добавьте диск в RAID-массив.
1. Получить серийный номер неисправного диска
Linux
Windows
Без RAID-контроллера
Adaptec
MegaRAID
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Получите серийный номер неисправного диска, для этого выведите информацию о дисках:
lsblk -o name,serial,modelВ ответе появится информация о дисках. Скопируйте серийный номер неисправного диска. Например:
NAME SERIAL MODELsdb S0H0N0XYZ123456 Samsung SSD 970 EVO Plus 500GBnvme0n1 S0D0NX0M001234 Samsung SSD 980 PRO 1TBЗдесь
SERIAL— серийный номер диска.
2. Согласовать замену диска
-
Создайте тикет. В тикете укажите:
-
Если замена диска будет согласована, сотрудник Selectel уточнит удобное для вас время и продолжительность проведения работ. Продолжительность работ потребуется для определения времени подсветки диска.
3. Удалить диск из RAID-массива
Если диск находится в RAID-массиве, удалите диск из массива.
4. Подсветить диск
В назначенное для проведения работ время мы сообщим вам в тикете о готовности приступить к замене диска.
Если диск не удастся подсветить и инженеры не смогут его идентифицировать по серийному номеру, то для замены диска потребуется выключить сервер. В этом случае мы сообщим о проблеме при идентификации диска и согласуем время выключения сервера в тикете.
Linux
Windows
Без RAID-контроллера
Adaptec
MegaRAID
Чтобы подсветить диск, создайте на него нагрузку, например запустите операцию записи или чтения. Если извлечь диск в то время, когда выполняются эти операции, будут ошибки чтения. Это нормальное поведение, так как команда пытается получить доступ к данным на диске, который уже извлечен.
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Выведите информацию о дисках:
lsblkВ ответе появится информация о дисках. Запомните или скопируйте имя диска. Например:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTSsda 8:0 0 1.8T 0 disk└─sda1 8:1 0 1.8T 0 part /mnt/datasdb 8:16 0 931.5G 0 disk└─sdb1 8:17 0 931.5G 0 part /mnt/backupnvme0n1 259:0 0 465.8G 0 disk├─nvme0n1p1 259:1 0 512M 0 part /boot/efi├─nvme0n1p2 259:2 0 16G 0 part [SWAP]└─nvme0n1p3 259:3 0 449.3G 0 part /Здесь
sda,sdb,nvme0n1— имена дисков. -
Подсветите диск:
dd if=/dev/<disk_name> of=/dev/nullУкажите
<disk_name>— имя диска, которое вы скопировали на шаге 2.
5. Проверить диск в системе
Linux
Windows
Без RAID-контроллера
Adaptec
MegaRAID
-
Дождитесь в тикете сообщения от сотрудника Selectel о том, что диск заменен.
-
Подключитесь к серверу по SSH или через KVM-консоль.
-
Убедитесь, что диск инициализировался в системе:
lsblk -
Если диск отсутствует в списке, перезагрузите сервер. Если после перезагрузки диск не инициализировался в системе, сообщите об этом в тикете.
6. Добавить диск в RAID-массив
Если диск был в RAID-массиве, добавьте замененный диск в массив.