====== SMART (S.M.A.R.T) ====== ===== Інсталяція ===== Виконайте стандартне встановлення пакета (Debian, Ubuntu): sudo apt install smartmontools -y ===== Базовий функціонал ===== Переглянути диски в системі: smartctl --scan Швидка перевірка на ''passed'': smartctl -H /dev/sda Перевірка всіх атрибутів smart: smartctl -a /dev/sda ===== Атрибути дисків ===== ==== HDD: ==== Для накопичувача на магнітних дисках (hdd) зверніть увагу на наступні атрибути: ^ **Параметр** ^ **Важливість** ^ **Що означає** | | \\ **Reallocated_Sector_Ct** (ID 5) | \\ 🔥 КРИТИЧНИЙ | \\ Кількість перенесених (пошкоджених) секторів. Якщо більше 0 – диск починає псуватись. | | \\ **Current_Pending_Sector** (ID 197) | \\ 🔥 КРИТИЧНИЙ | \\ Сектори, які чекають на перенесення. Якщо це число росте – диск має проблеми. | | \\ **Offline_Uncorrectable** (ID 198) | \\ ⚠️ ПОПЕРЕДЖЕННЯ | \\ Кількість неремонтованих помилок. Якщо більше 0 – диск у поганому стані. | | \\ **Power_On_Hours** (ID 9) | \\ ℹ️ ІНФОРМАТИВНИЙ | \\ Час роботи HDD у годинах. | | \\ **Start_Stop_Count** (ID 4) | \\ ℹ️ ІНФОРМАТИВНИЙ | \\ Скільки разів диск запускався і зупинявся. Високі значення – можливий знос механіки. | | \\ **Temperature_Celsius** (ID 194) | \\ ⚠️ ВАЖЛИВО | \\ Температура диска. Бажано < 50°C, критично > 60°C. | | \\ **UDMA_CRC_Error_Count** (ID 199) | \\ ⚠️ МОЖЛИВІ ПРОБЛЕМИ | \\ Помилки передачі даних (можуть бути | ==== SSD: ==== ^ \\ **S.M.A.R.T. атрибут** \\ ^ \\ **Важливість** \\ ^ \\ **Що означає?** \\ ^ \\ **Критичне значення** \\ | | \\ **Available Spare (ID 5, 177)** \\ | \\ 🔥 Критичний \\ | \\ Запас резервних комірок пам’яті. Якщо падає до 10% – диск може скоро вийти з ладу. \\ | \\ < 10% \\ | | \\ **Percentage Used (ID 231, 202)** \\ | \\ 🔥 Критичний \\ | \\ Відсоток зношення SSD. 100% = диск досяг свого ліміту запису. \\ | \\ > 80% – час задуматися про заміну \\ | | \\ **Total Host Writes (ID 241, 246)** \\ | \\ ⚠️ Важливий \\ | \\ Загальний обсяг записаних даних (TBW). Порівняйте з ресурсом вашого SSD. \\ | \\ Близько до TBW диска \\ | | \\ **Media and Data Integrity Errors (ID 100, 183)** \\ | \\ ⚠️ Попередження \\ | \\ Помилки читання/запису через деградацію пам’яті. \\ | \\ > 0 – можливі проблеми \\ | | \\ **Unsafe Shutdowns (ID 192)** \\ | \\ ℹ️ Інформативний \\ | \\ Скільки разів SSD вимикався некоректно. Якщо число велике – можуть бути проблеми з контролером. \\ | \\ > 100 – ризик проблем \\ | | \\ **Power-On Hours (ID 9)** \\ | \\ ℹ️ Інформативний \\ | \\ Час роботи SSD у годинах. SSD зазвичай витримують 30 000 – 50 000 годин. \\ | \\ > 50 000 – можливі ризики \\ | | \\ **Temperature_Celsius (ID 194)** \\ | \\ ⚠️ Важливий \\ | \\ Температура SSD. Висока температура пришвидшує знос. \\ | \\ > 60°C – небезпечно \\ | ===== Перевірка MegaRAID: ===== Приклад перевірки параметрів smart для дисків, які знаходяться в апаратному рейд-контролері: {{:снимок_экрана_2024-12-11_в_16.13.25.png?400}} smartctl -a -d megaraid,10 /dev/bus/14 smartctl -a -d megaraid,11 /dev/bus/14