MĄDRY - S.M.A.R.T.
SMART ( Self-Monitoring, Analysis and Reporting Technology ; często pisany jako SMART ) to system monitorowania zawarty w dyskach twardych komputera (HDD), dyskach półprzewodnikowych (SSD) i dyskach eMMC . Jego podstawową funkcją jest wykrywanie i raportowanie różnych wskaźników niezawodności dysku z zamiarem przewidywania nieuchronnych awarii sprzętu.
Gdy dane SMART wskazują na możliwą nieuchronną awarię dysku, oprogramowanie działające w systemie hosta może powiadomić użytkownika, aby można było podjąć działania zapobiegawcze, aby zapobiec utracie danych, a uszkodzony dysk można wymienić i zachować integralność danych.
Tło
Dysk twardy i inne dyski do przechowywania danych podlegają awariom (patrz awaria dysku twardego ), które można podzielić na dwie podstawowe klasy:
- Przewidywalne awarie, które wynikają z powolnych procesów, takich jak zużycie mechaniczne i stopniowa degradacja powierzchni magazynowych. Monitorowanie może określić, kiedy takie awarie stają się bardziej prawdopodobne.
- Nieprzewidywalne awarie, które pojawiają się bez ostrzeżenia z powodu czegokolwiek, od uszkodzenia elementów elektronicznych po nagłą awarię mechaniczną, w tym awarie związane z niewłaściwą obsługą.
Awarie mechaniczne stanowią około 60% wszystkich awarii napędów. Chociaż ostateczna awaria może być katastrofalna, większość awarii mechanicznych wynika ze stopniowego zużycia i zwykle istnieją pewne oznaki, że awaria jest nieuchronna. Mogą to być: zwiększona moc cieplna, zwiększony poziom hałasu, problemy z odczytem i zapisem danych, czy zwiększenie liczby uszkodzonych sektorów dysku.
Strona PCTechGuide na temat SMART (2003) komentuje, że technologia przeszła przez trzy fazy:
W swoim pierwotnym wcieleniu SMART zapewniał przewidywanie awarii poprzez monitorowanie niektórych działań na dysku twardym online.
Kolejna wersja standardu poprawiła przewidywanie awarii poprzez dodanie automatycznego skanowania odczytu offline w celu monitorowania dodatkowych operacji. atrybuty online są zawsze aktualizowane, podczas gdy atrybuty offline są aktualizowane, gdy dysk twardy nie działa. Jeśli istnieje natychmiastowa potrzeba aktualizacji atrybutów offline, dysk twardy zwalnia, a atrybuty offline są aktualizowane. Najnowsza technologia „SMART” nie tylko monitoruje aktywność dysku twardego, ale także dodaje zapobieganie awariom, próbując wykryć i naprawić błędy sektorów.
Ponadto, podczas gdy wcześniejsze wersje technologii monitorowały aktywność dysku twardego tylko pod kątem danych pobranych przez system operacyjny, najnowszy SMART testuje wszystkie dane i wszystkie sektory dysku, wykorzystując „zbieranie danych offline”, aby potwierdzić stan dysku podczas okresy bezczynności.
Precyzja
Badanie terenowe przeprowadzone przez Google obejmujące ponad 100 000 dysków klasy konsumenckiej od grudnia 2005 do sierpnia 2006 wykazało korelacje między niektórymi informacjami SMART a rocznymi wskaźnikami awarii:
- W ciągu 60 dni po pierwszym niepoprawnym błędzie na dysku ( atrybut SMART 0xC6 lub 198) wykrytym w wyniku skanowania offline, dysk był średnio 39 razy bardziej narażony na awarię niż podobny dysk, dla którego nie ma takiego błędu wystąpił.
- Pierwsze błędy w realokacjach, realokacjach offline ( atrybuty SMART 0xC4 i 0x05 lub 196 i 5) oraz liczenia próbne ( atrybut SMART 0xC5 lub 197) były również silnie skorelowane z wyższym prawdopodobieństwem niepowodzenia.
- Odwrotnie, stwierdzono niewielką korelację ze wzrostem temperatury i brak korelacji z poziomem użytkowania. Jednak badania wykazały, że duża część (56%) uszkodzonych dysków uległa awarii, nie rejestrując żadnej liczby w „czterech silnych ostrzeżeniach SMART” zidentyfikowanych jako błędy skanowania, liczba realokacji, realokacja offline i liczba próbna.
- Co więcej, 36% uszkodzonych dysków zrobiło to bez rejestrowania żadnego błędu SMART, z wyjątkiem temperatury, co oznacza, że same dane SMART miały ograniczoną użyteczność w przewidywaniu awarii.
Historia i poprzednicy
Wczesna technologia monitorowania dysków twardych została wprowadzona przez IBM w 1992 roku w swoich macierzach dyskowych IBM 9337 dla serwerów AS/400 wykorzystujących dyski IBM 0662 SCSI-2. Później nazwano ją technologią Predictive Failure Analysis (PFA). Mierzył kilka kluczowych parametrów kondycji urządzenia i oceniał je w oprogramowaniu układowym dysku. Komunikacja między jednostką fizyczną a oprogramowaniem monitorującym była ograniczona do wyniku binarnego: a mianowicie „urządzenie jest sprawne” lub „napęd prawdopodobnie wkrótce ulegnie awarii”.
Później inny wariant, nazwany IntelliSafe, został stworzony przez producenta komputerów Compaq i producentów dysków Seagate , Quantum i Conner . Napędy dysków mierzyłyby „parametry kondycji” dysku, a wartości byłyby przesyłane do systemu operacyjnego i oprogramowania do monitorowania przestrzeni użytkownika. Każdy dostawca dysków twardych mógł swobodnie decydować, które parametry mają być uwzględnione w monitorowaniu i jakie powinny być ich progi. Ujednolicenie odbyło się na poziomie protokołu z gospodarzem.
Compaq zgłosił IntelliSafe do komitetu Small Form Factor (SFF) w celu standaryzacji na początku 1995 roku. Został on wsparty przez IBM, partnerów programistycznych Compaqa Seagate, Quantum i Conner oraz Western Digital , które nie posiadało systemu przewidywania awarii na czas. Komitet wybrał podejście IntelliSafe, ponieważ zapewniało ono większą elastyczność. Compaq umieścił IntelliSafe w domenie publicznej w dniu 12 maja 1995 r. Powstały wspólnie opracowany standard został nazwany SMART.
Ten standard SFF opisał protokół komunikacyjny dla hosta ATA do używania i kontrolowania monitorowania i analizy na dysku twardym, ale nie określał żadnych konkretnych metryk ani metod analizy. Później zaczęto rozumieć „SMART” (choć bez żadnej formalnej specyfikacji) w odniesieniu do różnych konkretnych metryk i metod oraz w odniesieniu do protokołów niezwiązanych z usługą ATA do komunikowania tego samego rodzaju rzeczy.
Podane informacje
Dokumentacja techniczna SMART jest w standardzie AT Attachment (ATA). Wprowadzony po raz pierwszy w 1994 roku standard ATA przeszedł wiele zmian. Niektóre części oryginalnej specyfikacji SMART opracowanej przez Komitet Small Form Factor (SFF) zostały dodane do ATA-3, opublikowanej w 1997 r. W 1998 r. ATA-4 zrezygnowała z wymogu utrzymywania przez dyski wewnętrznej tabeli atrybutów i zamiast tego była wymagana tylko dla „ OK" lub "NIE OK" wartość do zwrócenia. Jednak producenci zachowali możliwość pobierania wartości atrybutów. Najnowszy standard ATA, ATA-8, został opublikowany w 2004 roku. Poddawany był regularnym zmianom, ostatnia miała miejsce w 2011 roku. odnoszą się również do tych podobnych funkcji w SMART.
Najbardziej podstawową informacją, jaką dostarcza SMART, jest status SMART. Podaje tylko dwie wartości: „próg nie przekroczony” i „próg przekroczony”. Często są one reprezentowane odpowiednio jako „napęd OK” lub „napęd awaria”. Wartość „próg przekroczenia” ma wskazywać, że istnieje stosunkowo duże prawdopodobieństwo, że dysk nie będzie w stanie przestrzegać swojej specyfikacji w przyszłości: oznacza to, że dysk „niedługo ulegnie awarii”. Przewidywana awaria może być katastrofalna lub może być czymś tak subtelnym, jak brak możliwości zapisu do niektórych sektorów lub być może niższa wydajność niż deklarowane przez producenta minimum.
Stan SMART niekoniecznie wskazuje na przeszłą lub obecną niezawodność dysku. Jeśli dysk uległ już katastrofalnej awarii, status SMART może być niedostępny. Alternatywnie, jeśli dysk miał problemy w przeszłości, ale czujniki nie wykrywają już takich problemów, stan SMART może, w zależności od oprogramowania producenta, sugerować, że dysk jest teraz sprawny.
Niemożność odczytania niektórych sektorów nie zawsze oznacza, że dysk niedługo ulegnie awarii. Jednym ze sposobów tworzenia nieczytelnych sektorów, nawet gdy dysk działa zgodnie ze specyfikacją, jest nagła awaria zasilania podczas zapisu dysku. Ponadto, nawet jeśli dysk fizyczny jest uszkodzony w jednym miejscu, tak że pewien sektor jest nieczytelny, dysk może wykorzystać wolne miejsce do zastąpienia uszkodzonego obszaru, aby sektor mógł zostać nadpisany.
Więcej szczegółów na temat stanu dysku można uzyskać, badając atrybuty SMART. Atrybuty SMART zostały uwzględnione w niektórych wersjach roboczych standardu ATA, ale zostały usunięte, zanim standard stał się ostateczny. Znaczenie i interpretacja atrybutów różni się w zależności od producenta i czasami są uważane za tajemnicę handlową dla jednego lub drugiego producenta. Atrybuty są szczegółowo omówione poniżej.
Dyski ze SMART mogą opcjonalnie prowadzić pewną liczbę „dzienników”. W dzienniku błędów zapisywane są informacje o najnowszych błędach zgłoszonych przez dysk do komputera hosta. Przejrzenie tego dziennika może pomóc w ustaleniu, czy problemy z komputerem są związane z dyskiem lub spowodowane przez coś innego (sygnatury czasowe dziennika błędów mogą się „zawinąć” po 2 32 ms = 49,71 dni)
Napęd, w którym zaimplementowano SMART, może opcjonalnie zaimplementować szereg procedur autotestu lub konserwacji, a wyniki testów są przechowywane w dzienniku autotestów . Procedury autotestu mogą być użyte do wykrycia wszelkich nieczytelnych sektorów na dysku, tak aby można je było przywrócić z kopii zapasowych (na przykład z innych dysków w macierzy RAID ). Pomaga to zmniejszyć ryzyko poniesienia trwałej utraty danych.
Standardy i implementacja
Brak wspólnej interpretacji
Wiele płyt głównych wyświetla komunikat ostrzegawczy, gdy dysk zbliża się do awarii. Chociaż wśród większości głównych producentów dysków twardych istnieje standard branżowy, problemy pozostają spowodowane atrybutami celowo pozostawionymi nieudokumentowanymi publicznie w celu rozróżnienia modeli między producentami. Z prawnego punktu widzenia termin „SMART” odnosi się tylko do metody sygnalizacji między czujnikami elektromechanicznymi wewnętrznego dysku twardego a komputerem hosta. Z tego powodu specyfikacje SMART są całkowicie specyficzne dla dostawcy i chociaż wiele z tych atrybutów zostało ustandaryzowanych między dostawcami napędów, inne pozostają zależne od dostawcy. Implementacje SMART wciąż się różnią i w niektórych przypadkach mogą brakować „wspólnych” lub oczekiwanych funkcji, takich jak czujnik temperatury, lub zawierać tylko kilka wybranych atrybutów, jednocześnie umożliwiając producentowi reklamowanie produktu jako „zgodnego z SMART”.
Widoczność dla systemów hosta
W zależności od typu używanego interfejsu, niektóre płyty główne z obsługą SMART i powiązane oprogramowanie mogą nie komunikować się z niektórymi dyskami obsługującymi SMART. Na przykład kilka dysków zewnętrznych podłączonych przez USB i FireWire prawidłowo wysyła dane SMART przez te interfejsy. Przy tak wielu sposobach podłączenia dysku twardego ( SCSI , Fibre Channel , ATA , SATA , SAS , SSA , NVMe i tak dalej) trudno przewidzieć, czy raporty SMART będą działać poprawnie w danym systemie.
Nawet w przypadku dysku twardego i interfejsu, który implementuje specyfikację, system operacyjny komputera może nie widzieć informacji SMART, ponieważ dysk i interfejs są umieszczone w niższej warstwie. Na przykład mogą być częścią podsystemu RAID, w którym kontroler RAID widzi dysk z obsługą SMART, ale komputer hosta widzi tylko wolumin logiczny wygenerowany przez kontroler RAID.
Na platformie Windows wiele programów przeznaczonych do monitorowania i raportowania informacji SMART będzie działać tylko z kontem administratora .
System BIOS i Windows ( Windows Vista i nowsze) mogą wykrywać stan SMART dysków twardych i dysków półprzewodnikowych oraz wyświetlać komunikat, jeśli stan SMART jest zły.
Dostęp
Aby zapoznać się z listą różnych programów, które umożliwiają odczytywanie danych SMART, zobacz Porównanie narzędzi SMART .
Atrybuty ATA SMART
Każdy producent napędu definiuje zestaw atrybutów i ustawia wartości progowe, powyżej których atrybuty nie powinny przejść podczas normalnej pracy. Każdy atrybut ma surową wartość, która może być wartością dziesiętną lub szesnastkową, której znaczenie zależy wyłącznie od producenta dysku (ale często odpowiada liczbie lub jednostce fizycznej, takiej jak stopnie Celsjusza lub sekundy), wartość znormalizowaną , której zakres od 1 do 253 (przy czym 1 reprezentuje najgorszy przypadek, a 253 reprezentuje najlepszy) i najgorszą wartość , która reprezentuje najniższą zarejestrowaną wartość znormalizowaną. Początkowa wartość domyślna atrybutów to 100, ale może się różnić w zależności od producenta.
Producenci, którzy zaimplementowali co najmniej jeden atrybut SMART w różnych produktach, to między innymi Samsung , Seagate , IBM ( Hitachi ), Fujitsu , Maxtor , Toshiba , Intel , sTec, Inc. , Western Digital i ExcelStor Technology .
Znane atrybuty ATA SMART
Poniższa tabela przedstawia niektóre atrybuty SMART i typowe znaczenie ich nieprzetworzonych wartości. Znormalizowane wartości są zwykle mapowane, aby wyższe wartości były lepsze (wyjątki obejmują temperaturę napędu, liczbę cykli ładowania/rozładowania głowicy), ale wyższe wartości atrybutów surowych mogą być lepsze lub gorsze w zależności od atrybutu i producenta. Na przykład znormalizowana wartość atrybutu „ Liczba ponownie przydzielonych sektorów ” zmniejsza się wraz ze wzrostem liczby ponownie przydzielonych sektorów . W takim przypadku surowa wartość atrybutu często wskazuje rzeczywistą liczbę sektorów, które zostały ponownie przydzielone, chociaż dostawcy nie są w żaden sposób zobowiązani do przestrzegania tej konwencji.
Ponieważ producenci niekoniecznie zgadzają się co do dokładnych definicji atrybutów i jednostek miary, poniższa lista atrybutów jest jedynie ogólnym przewodnikiem.
Dyski nie obsługują wszystkich kodów atrybutów (czasami skracanych jako „ID” dla „identyfikatora” w tabelach). Niektóre kody są specyficzne dla poszczególnych typów dysków (talerz magnetyczny, flash, SSD). Napędy mogą używać różnych kodów dla tego samego parametru, np. patrz kody 193 i 225.
NS | 193 0xC1 |
Kod atrybutu w notacji dziesiętnej i szesnastkowej |
---|---|---|
Ideał |
Wysoka
|
Wyższa surowa wartość jest lepsza |
Niski
|
Niższa surowa wartość jest lepsza | |
! (Krytyczny) |
|
Oznacza atrybut krytyczny . Określone wartości mogą przewidywać awarię dysku |
NS | Nazwa atrybutu | Ideał | ! | Opis |
---|---|---|---|---|
01 0x01 |
Wskaźnik błędów odczytu |
Niski
|
(Wartość surowa specyficzna dla dostawcy.) Przechowuje dane związane z częstotliwością sprzętowych błędów odczytu, które wystąpiły podczas odczytu danych z powierzchni dysku. Surowa wartość ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy. | |
02 0x02 |
Wydajność przepustowa |
Wysoka
|
Ogólna (ogólna) przepustowość dysku twardego. Jeśli wartość tego atrybutu maleje, istnieje duże prawdopodobieństwo, że wystąpił problem z dyskiem. | |
03 0x03 |
Czas rozkręcania |
Niski
|
Średni czas rozkręcania się wrzeciona (od zera RPM do pełnej sprawności [milisekundy]). | |
04 0x04 |
Licznik start/stop | Zliczanie cykli start/stop wrzeciona. Wrzeciono włącza się, a zatem liczba jest zwiększana, zarówno gdy dysk twardy jest włączony po wcześniejszym całkowitym wyłączeniu (odłączony od źródła zasilania), jak i gdy dysk twardy powraca z poprzedniego trybu uśpienia. | ||
05 0x05 |
Liczba przeniesionych sektorów |
Niski
|
|
Liczba realokowanych sektorów. Surowa wartość reprezentuje liczbę uszkodzonych sektorów , które zostały znalezione i zmapowane. Dlatego im wyższa wartość atrybutu, tym więcej sektorów dysk musiał ponownie przydzielić. Ta wartość jest używana przede wszystkim jako miara oczekiwanej długości życia dysku; dysk, który w ogóle miał jakiekolwiek realokacje, jest znacznie bardziej podatny na awarię w najbliższych miesiącach. |
06 0x06 |
Przeczytaj margines kanału | Margines kanału podczas odczytu danych. Funkcja tego atrybutu nie jest określona. | ||
07 0x07 |
Szukaj współczynnika błędów | Różne | (Wartość surowa specyficzna dla dostawcy.) Szybkość wyszukiwania błędów głowic magnetycznych. Jeśli wystąpi częściowa awaria mechanicznego systemu pozycjonowania, pojawią się błędy wyszukiwania. Taka awaria może być spowodowana wieloma czynnikami, takimi jak uszkodzenie serwomechanizmu lub rozszerzenie termiczne dysku twardego. Surowa wartość ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy. | |
08 0x08 |
Poszukuj wydajności czasu |
Wysoka
|
Średnia wydajność operacji wyszukiwania głowic magnetycznych. Jeśli ten atrybut maleje, jest to oznaka problemów w podsystemie mechanicznym. | |
09 0x09 |
Godziny włączenia | Liczba godzin w stanie włączonym. Surowa wartość tego atrybutu pokazuje całkowitą liczbę godzin (lub minut lub sekund, w zależności od producenta) w stanie włączonym.
„Domyślnie, całkowity oczekiwany czas życia dysku twardego w idealnym stanie jest definiowany jako 5 lat (działający codziennie i w nocy przez wszystkie dni). Odpowiada to 1825 dniom w trybie 24/7 lub 43800 godzinom”. Na niektórych dyskach sprzed 2005 r. ta wartość surowa może rosnąć nieregularnie i/lub „zawijać” (okresowo resetować do zera). |
||
10 0x0A |
Liczba ponownych prób kręcenia |
Niski
|
|
Liczba ponownych prób rozpoczęcia spinu. Atrybut ten przechowuje całkowitą liczbę prób rozpoczęcia spinu w celu osiągnięcia pełnej prędkości operacyjnej (pod warunkiem, że pierwsza próba zakończyła się niepowodzeniem). Wzrost wartości tego atrybutu jest oznaką problemów w podsystemie mechanicznym dysku twardego. |
11 0x0B |
Próby ponownej kalibracji lub liczba prób kalibracji |
Niski
|
Atrybut ten wskazuje liczbę żądań ponownej kalibracji (pod warunkiem, że pierwsza próba zakończyła się niepowodzeniem). Wzrost wartości tego atrybutu jest oznaką problemów w podsystemie mechanicznym dysku twardego. | |
12 0x0C |
Liczba cykli zasilania | Ten atrybut wskazuje liczbę pełnych cykli włączania/wyłączania dysku twardego. | ||
13 0x0D |
Wskaźnik błędów miękkiego odczytu |
Niski
|
Niepoprawione błędy odczytu zgłoszone do systemu operacyjnego. | |
22 0x16 |
Aktualny poziom helu |
Wysoka
|
Specyficzne dla napędów He8 firmy HGST. Ta wartość mierzy hel wewnątrz napędu specyficznego dla tego producenta. Jest to atrybut przed awarią, który uruchamia się, gdy dysk wykryje, że środowisko wewnętrzne jest niezgodne ze specyfikacją. | |
170 0xAA |
Dostępne zarezerwowane miejsce | Zobacz atrybut E8. | ||
171 0xAB |
Liczba błędów programu SSD | (Kingston) Łączna liczba niepowodzeń działania programu flash od czasu wdrożenia dysku. Identyczny z atrybutem 181. | ||
172 0xAC |
Liczba niepowodzeń kasowania dysku SSD | (Kingston) Zlicza liczbę niepowodzeń wymazywania pamięci flash. Ten atrybut zwraca całkowitą liczbę niepowodzeń operacji wymazywania pamięci Flash od czasu wdrożenia dysku. Ten atrybut jest identyczny z atrybutem 182. | ||
173 0xAD |
Liczba wyrównywania zużycia dysków SSD | Oblicza maksymalną liczbę najgorszych wymazań w dowolnym bloku. | ||
174 0xAE |
Nieoczekiwana liczba strat mocy | Znany również jako „Licznik wycofań po wyłączeniu” zgodnie z konwencjonalną terminologią dotyczącą dysków twardych. Wartość surowa podaje liczbę nieczystych zamknięć, skumulowaną w całym okresie eksploatacji dysku SSD, gdzie „nieczyste zamknięcie” to odłączenie zasilania bez STANDBY IMMEDIATE jako ostatniego polecenia (niezależnie od aktywności PLI wykorzystującej moc kondensatora). Znormalizowana wartość to zawsze 100. | ||
175 0xAF |
Awaria ochrony przed utratą zasilania | Ostatni wynik testu w mikrosekundach do rozładowania nasadki, nasycony do maksymalnej wartości. Rejestruje również minuty od ostatniego testu i liczbę testów w okresie istnienia. Wartość surowa zawiera następujące dane:
Znormalizowana wartość jest ustawiana na jeden w przypadku niepowodzenia testu lub 11, jeśli kondensator był testowany w warunkach nadmiernej temperatury, w przeciwnym razie 100. |
||
176 0xB0 |
Licznik niepowodzeń kasowania | Parametr SMART wskazuje na liczbę niepowodzeń poleceń kasowania błysku. | ||
177 0xB1 |
Różnica zakresu zużycia | Różnica między najbardziej i najrzadziej używanymi blokami Flash. Opisuje, jak dobrze / źle działa wyrównywanie zużycia dysku SSD w bardziej techniczny sposób. | ||
178 0xB2 |
Używana zarezerwowana liczba bloków | Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung. | ||
179 0xB3 |
Używana zarezerwowana całkowita liczba bloków | Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung. | ||
180 0xB4 |
Całkowita liczba niewykorzystanych zarezerwowanych bloków | Atrybut „Pre-Fail” używany przynajmniej w urządzeniach HP. | ||
181 0xB5 |
Całkowita liczba niepowodzeń programu lub liczba dopasowanych dostępów innych niż 4K |
Niski
|
Całkowita liczba niepowodzeń działania programu Flash od czasu wdrożenia dysku. Liczba dostępów do danych użytkownika (zarówno odczyty, jak i zapisy), w których LBA nie są wyrównane 4 KiB (LBA % 8 != 0) lub gdy rozmiar nie jest modułem 4 KiB (liczba bloków != 8), przy założeniu logicznego rozmiaru bloku (LBS) = 512 B. |
|
182 0xB6 |
Licznik niepowodzeń kasowania | Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung. | ||
183 0xB7 |
Liczba błędów redukcji biegów SATA lub nieprawidłowy blok w czasie wykonywania |
Niski
|
Atrybut Western Digital, Samsung lub Seagate: albo liczba redukcji szybkości łącza (np. z 6Gbit/s do 3Gbit/s) albo całkowita liczba bloków danych z wykrytymi, niemożliwymi do naprawienia błędami napotkanymi podczas normalnej pracy. Chociaż degradacja tego parametru może być wskaźnikiem starzenia się napędu i/lub potencjalnych problemów elektromechanicznych, nie wskazuje bezpośrednio na zbliżającą się awarię napędu. | |
184 0xB8 |
Błąd kompleksowy / IOEDC |
Niski
|
|
Ten atrybut jest częścią technologii SMART IV firmy Hewlett-Packard , a także częścią schematów wykrywania i korekcji błędów we/wy innych dostawców i zawiera liczbę błędów parzystości, które występują w ścieżce danych do nośnika za pośrednictwem pamięć podręczna pamięci RAM. |
185 0xB9 |
Stabilność głowy | Atrybut Western Digital. | ||
186 0xBA |
Wykrywanie wibracji indukowanych Op | Atrybut Western Digital. | ||
187 0xBB |
Zgłoszone błędy nie do naprawienia |
Niski
|
|
Liczba błędów, których nie można było naprawić za pomocą sprzętowego ECC (patrz atrybut 195). |
188 0xBC |
Limit czasu polecenia |
Niski
|
|
Liczba operacji przerwanych z powodu przekroczenia limitu czasu HDD. Normalnie ta wartość atrybutu powinna być równa zero. |
189 0xBD |
High Fly pisze |
Niski
|
Producenci dysków twardych wdrażają czujnik wysokości lotu , który stara się zapewnić dodatkowe zabezpieczenia operacji zapisu, wykrywając, kiedy głowica zapisująca znajduje się poza swoim normalnym zakresem roboczym. W przypadku napotkania niebezpiecznego warunku wysokości lotu, proces zapisu jest zatrzymywany, a informacje są ponownie zapisywane lub przenoszone do bezpiecznego regionu dysku twardego. Ten atrybut wskazuje liczbę tych błędów wykrytych w okresie eksploatacji dysku.
Ta funkcja jest zaimplementowana w większości nowoczesnych dysków Seagate i niektórych dysków Western Digital, począwszy od dysków twardych WD Enterprise WDE18300 i WDE9180 Ultra2 SCSI, i będzie dostępna we wszystkich przyszłych produktach WD Enterprise. |
|
190 0xBE |
Różnica temperatur lub temperatura przepływu powietrza | Różne | Wartość jest równa (100-temp. °C), pozwalając producentowi na ustawienie minimalnego progu, który odpowiada maksymalnej temperaturze. Jest to również zgodne z konwencją, w której 100 jest najlepszym przypadkiem, a niższe wartości są niepożądane. Jednak niektóre starsze dyski mogą zamiast tego zgłaszać surową Temperaturę (identyczną z 0xC2) lub Temperaturę minus 50 tutaj. | |
191 0xBF |
Wskaźnik błędów G-sense |
Niski
|
Liczba błędów wynikających z zewnętrznych wstrząsów i wibracji. | |
192 0xC0 |
Power-off Retract hrabiego , awaryjne Retract Cykl Hrabia (Fujitsu) lub niebezpieczne Shutdown Hrabia |
Niski
|
Liczba cykli wyłączania lub wycofywania awaryjnego. | |
193 0xC1 |
Liczba cykli ładowania lub Liczba cykli ładowania/rozładowywania (Fujitsu) |
Niski
|
Liczba cykli załadunku/rozładunku do pozycji strefy lądowania czołowego. Niektóre dyski używają zamiast tego 225 (0xE1) do licznika cykli obciążenia.
Western Digital ocenia swoje dyski VelociRaptor na 600 000 cykli ładowania/rozładowywania, a dyski WD Green na 300 000 cykli; te ostatnie są przeznaczone do częstego rozładowywania głowic w celu oszczędzania energii. Z drugiej strony, WD3000GLFS (dysk do komputerów stacjonarnych) jest przeznaczony tylko do 50 000 cykli ładowania/rozładowywania. Niektóre dyski do laptopów i dyski do komputerów stacjonarnych „zielonej energii” są zaprogramowane tak, aby rozładowywały głowice, gdy przez krótki czas nie było żadnej aktywności, w celu oszczędzania energii. Systemy operacyjne często uzyskują dostęp do systemu plików kilka razy na minutę w tle, powodując 100 lub więcej cykli ładowania na godzinę, jeśli głowice są rozładowywane: ocena cyklu ładowania może zostać przekroczona w mniej niż rok. Istnieją programy dla większości systemów operacyjnych, które wyłączają funkcje zaawansowanego zarządzania energią (APM) i automatycznego zarządzania akustycznego (AAM), powodując częste cykle ładowania. |
|
194 0xC2 |
Temperatura lub temperatura Celsjusza |
Niski
|
Wskazuje temperaturę urządzenia, jeśli jest zamontowany odpowiedni czujnik. Najniższy bajt nieprzetworzonej wartości zawiera dokładną wartość temperatury (stopnie Celsjusza). | |
195 0xC3 |
Odzyskano ECC sprzętu | Różne | (Wartość surowa specyficzna dla dostawcy.) Wartość surowa ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy. | |
196 0xC4 |
Liczba zdarzeń realokacji |
Niski
|
|
Liczba operacji remapowania. Nieprzetworzona wartość tego atrybutu pokazuje całkowitą liczbę prób przesłania danych z ponownie przydzielonych sektorów do wolnego obszaru. Liczone są zarówno udane, jak i nieudane próby. |
197 0xC5 |
Aktualna liczba oczekujących sektorów |
Niski
|
|
Liczba sektorów „niestabilnych” (oczekujących na ponowne odwzorowanie z powodu nieodwracalnych błędów odczytu). Jeśli niestabilny sektor zostanie następnie pomyślnie odczytany, sektor jest ponownie mapowany, a wartość ta jest zmniejszana. Błędy odczytu w sektorze nie spowodują natychmiastowego przemapowania sektora (ponieważ poprawna wartość nie może być odczytana, a więc wartość do przemapowania nie jest znana, a także może stać się czytelna później); zamiast tego oprogramowanie układowe dysku pamięta, że sektor musi zostać ponownie zmapowany, i zmapuje go przy następnym zapisie.
Jednak niektóre dyski nie będą od razu remapować takich sektorów po zapisaniu; zamiast tego dysk najpierw spróbuje zapisać w problematycznym sektorze, a jeśli operacja zapisu się powiedzie, sektor zostanie oznaczony jako dobry (w tym przypadku „Liczba zdarzeń realokacji” (0xC4) nie zostanie zwiększona). Jest to poważna wada, ponieważ jeśli taki dysk zawiera marginalne sektory, które konsekwentnie zawodzą dopiero po pewnym czasie od pomyślnej operacji zapisu, dysk nigdy nie zmieni mapowania tych problematycznych sektorów. |
198 0xC6 |
(Offline) Liczba sektorów, których nie można naprawić |
Niski
|
|
Całkowita liczba niepoprawnych błędów podczas odczytu/zapisu sektora. Wzrost wartości tego atrybutu wskazuje na wady powierzchni dysku i/lub problemy w podsystemie mechanicznym. |
199 0xC7 |
Liczba błędów UltraDMA CRC |
Niski
|
Liczba błędów w przesyłaniu danych przez kabel interfejsu określona przez ICRC (Interface Cyclic Redundancy Check). | |
200 0xC8 |
Częstość błędów w wielu strefach |
Niski
|
Liczba błędów znalezionych podczas zapisywania sektora. Im wyższa wartość, tym gorszy stan mechaniczny dysku. | |
200 0xC8 |
Współczynnik błędów zapisu (Fujitsu) |
Niski
|
Całkowita liczba błędów podczas zapisywania sektora. | |
201 0xC9 |
Wykryto wskaźnik błędów miękkiego odczytu lub licznik TA |
Niski
|
|
Liczba wskazuje liczbę niepoprawnych błędów odczytu oprogramowania. |
202 0xCA |
Błędy oznaczenia adresu danych lub zwiększenie licznika TA |
Niski
|
Liczba błędów znacznika adresu danych (lub specyficznych dla dostawcy). | |
203 0xCB |
Zabrakło Anuluj |
Niski
|
Liczba błędów spowodowanych nieprawidłową sumą kontrolną podczas korekcji błędów. | |
204 0xCC |
Miękka korekcja ECC |
Niski
|
Liczba błędów skorygowanych przez wewnętrzne oprogramowanie do korekcji błędów. | |
205 0xCD |
Współczynnik chropowatości termicznej |
Niski
|
Liczba błędów spowodowanych wysoką temperaturą. | |
206 0xCE |
Latająca wysokość | Wysokość głowic nad powierzchnią dysku. Jeśli jest zbyt nisko, bardziej prawdopodobny jest wypadek głowy; jeśli jest zbyt wysoki, bardziej prawdopodobne są błędy odczytu/zapisu. | ||
207 0xCF |
Wiruj wysoki prąd |
Niski
|
Wielkość prądu udarowego użytego do rozkręcenia napędu. | |
208 0xD0 |
Zakręć Buzz | Liczba brzęczących procedur potrzebnych do rozkręcenia dysku z powodu niewystarczającej mocy. | ||
209 0xD1 |
Szukaj wyników offline | Dysk szuka wydajności podczas testów wewnętrznych. | ||
210 0xD2 |
Wibracje podczas zapisu | Znajduje się na dyskach Maxtor 6B200M0 200 GB i Maxtor 2R015H1 15 GB. | ||
211 0xD3 |
Wibracje podczas zapisu | Nagranie drgań napotkanych podczas operacji zapisu. | ||
212 0xD4 |
Szok podczas zapisu | Nagranie wstrząsu napotkanego podczas operacji zapisu. | ||
220 0xDC |
Przesunięcie dysku |
Niski
|
Odległość, o którą przesunęła się tarcza względem wrzeciona (zwykle z powodu wstrząsu lub temperatury). Jednostka miary jest nieznana. | |
221 0xDD |
Wskaźnik błędów G-Sense |
Niski
|
Liczba błędów wynikających z zewnętrznych wstrząsów i wibracji. Bardziej typowo zgłaszane na 0xBF. | |
222 0xDE |
Załadowane godziny | Czas spędzony na pracy pod obciążeniem danych (ruch magnetycznej zwory głowicy). | ||
223 0xDF |
Liczba ponownych prób załadowania/rozładowania | Zliczanie zmian pozycji głowy. | ||
224 0xE0 |
Tarcie obciążenia |
Niski
|
Opór spowodowany tarciem w częściach mechanicznych podczas pracy. | |
225 0xE1 |
Liczba cykli ładowania/rozładowywania |
Niski
|
Całkowita liczba cykli obciążenia Niektóre dyski używają zamiast tego liczby 193 (0xC1) do liczby cykli obciążenia. Zobacz opis 193, aby poznać znaczenie tej liczby. | |
226 0xE2 |
Wczytaj „w czasie” | Całkowity czas ładowania siłownika głowic magnetycznych (czas nie spędzony na parkingu). | ||
227 0xE3 |
Liczba wzmocnienia momentu obrotowego |
Niski
|
Liczba prób kompensacji wahań prędkości talerza. | |
228 0xE4 |
Cykl wycofania przy wyłączonym zasilaniu |
Niski
|
Liczba cykli wyłączania, które są liczone, gdy występuje „zdarzenie cofania” i głowice są ładowane z nośnika, na przykład gdy urządzenie jest wyłączone, uśpione lub bezczynne. | |
230 0xE6 |
Amplituda głowicy GMR (dyski magnetyczne), stan ochrony dysku (SSD) | Amplituda „miotania” (powtarzalne ruchy głowy pomiędzy operacjami).
W przypadku dysków półprzewodnikowych wskazuje, czy trajektoria użytkowania przekracza oczekiwaną krzywą żywotności |
||
231 0xE7 |
Pozostała żywotność (dyski SSD) lub temperatura | Wskazuje przybliżony pozostały czas eksploatacji dysku SSD pod względem cykli programu/kasowania lub dostępnych zarezerwowanych bloków. Znormalizowana wartość 100 oznacza nowy dysk, a wartość progowa 10 oznacza konieczność wymiany. Wartość 0 może oznaczać, że dysk działa w trybie tylko do odczytu, aby umożliwić odzyskanie danych.
Wcześniej (przed 2010 r.) sporadycznie używany do pomiaru temperatury przemiennika (częściej zgłaszany przy 0xC2). |
||
232 0xE8 |
Pozostała wytrzymałość lub dostępna zarezerwowana przestrzeń | Liczba fizycznych cykli wymazywania wykonanych na dysku SSD wyrażona jako procent maksymalnej liczby fizycznych cykli wymazywania, jakie ma wytrzymać dysk.
Dyski Intel SSD zgłaszają dostępne zarezerwowane miejsce jako procent początkowej zarezerwowanej przestrzeni. |
||
233 0xE9 |
Wskaźnik zużycia nośnika (SSD) lub godziny włączenia | Dyski Intel SSD zgłaszają znormalizowaną wartość od 100, nowy dysk, do minimum 1. Zmniejsza się, podczas gdy cykle kasowania NAND wzrastają od 0 do maksymalnych cykli.
Wcześniej (przed 2010 r.) sporadycznie używany do godzin włączenia zasilania (częściej zgłaszany w 0x09). |
||
234 0xEA |
Średnia liczba kasowań ORAZ maksymalna liczba kasowanych | Dekodowany jako: bajt 0-1-2 = średnia liczba kasowań (big endian) i bajt 3-4-5 = maksymalna ilość kasowań (big endian). | ||
235 0xEB |
Dobra liczba bloków ORAZ systemowa (bezpłatna) liczba bloków | Dekodowany jako: bajt 0-1-2 = dobra liczba bloków (big endian) i bajt 3-4 = systemowa (wolna) liczba bloków. | ||
240 0xF0 |
Godziny lotu głową lub „ Współczynnik błędów transferu” (Fujitsu) | Czas spędzony podczas pozycjonowania głowic napędowych. Niektóre dyski Fujitsu zgłaszają liczbę resetów łącza podczas przesyłania danych. | ||
241 0xF1 |
Całkowita liczba napisanych LBA | Całkowita liczba napisanych LBA. | ||
242 0xF2 |
Łączny odczyt LBA | Całkowita liczba odczytanych LBA. Niektóre narzędzia SMART zgłaszają liczbę ujemną dla surowej wartości, ponieważ w rzeczywistości ma ona 48 bitów zamiast 32. |
||
243 0xF3 |
Łączna liczba napisanych LBA po rozwinięciu | Górne 5 bajtów z 12-bajtowej łącznej liczby LBA zapisanych w urządzeniu. Mniejsza wartość 7 bajtów znajduje się w atrybucie 0xF1. | ||
244 0xF4 |
Łączna liczba rozszerzonych odczytów LBA | Górne 5 bajtów z 12-bajtowej łącznej liczby LBA odczytanych z urządzenia. Mniejsza wartość 7 bajtów znajduje się w atrybucie 0xF2. | ||
249 0xF9 |
Zapisy NAND (1GiB) | Całkowita liczba zapisów NAND. Wartość surowa podaje liczbę zapisów do NAND w przyrostach o 1 GB. | ||
250 0xFA |
Częstotliwość ponownych prób odczytu |
Niski
|
Liczba błędów podczas odczytu z dysku. | |
251 0xFB |
Pozostała minimalna ilość części zamiennych | Atrybut Minimum Spares Remaining wskazuje liczbę pozostałych zapasowych bloków jako procent całkowitej liczby dostępnych zapasowych bloków. | ||
252 0xFC |
Nowo dodany zły blok Flash | Atrybut „Newly Added Bad Flash Block” wskazuje całkowitą liczbę uszkodzonych bloków pamięci flash wykrytych przez dysk od momentu jego pierwszej inicjalizacji w produkcji. | ||
254 0xFE |
Ochrona przed upadkiem |
Niski
|
Liczba wykrytych „zdarzeń swobodnego spadania”. |
Próg przekracza warunek
Threshold Exceeds Condition (TEC) to szacowana data, w której krytyczny atrybut statystyki dysku osiągnie swoją wartość progową. Gdy oprogramowanie Drive Health zgłasza „Najbliższy TEC”, należy to traktować jako „Datę awarii”. Czasami nie podaje się daty i można oczekiwać, że dysk będzie działał bezbłędnie.
Aby przewidzieć datę, dysk śledzi tempo zmian atrybutu. Należy zauważyć, że daty TEC są tylko szacunkowe; Dyski twarde mogą i zawodzą znacznie wcześniej lub znacznie później niż data TEC.
Autotesty
Dyski SMART mogą oferować szereg autotestów:
- Niski
- Sprawdza wydajność elektryczną i mechaniczną, a także wydajność odczytu dysku. Testy elektryczne mogą obejmować test pamięci RAM bufora, test obwodów odczytu/zapisu lub test elementów głowicy odczytu/zapisu. Test mechaniczny obejmuje wyszukiwanie i serwo na ścieżkach danych. Skanuje małe części powierzchni dysku (obszar zależy od dostawcy, a test jest ograniczony czasowo). Sprawdza listę oczekujących sektorów, które mogą zawierać błędy odczytu i zwykle zajmuje to mniej niż dwie minuty.
- Długie/przedłużone
- Dłuższa i bardziej dokładna wersja krótkiego autotestu, skanująca całą powierzchnię dysku bez ograniczeń czasowych. Ten test trwa zwykle kilka godzin, w zależności od szybkości odczytu/zapisu dysku i jego rozmiaru.
- Przewóz
- Przeznaczony do szybkiego testu identyfikującego uszkodzenia powstałe podczas transportu urządzenia od producenta napędu do producenta komputera. Dostępne tylko na dyskach ATA i zwykle zajmuje kilka minut.
- Selektywny
- Niektóre napędy umożliwiają selektywne autotesty tylko części powierzchni.
Dzienniki autotestu dla dysków SCSI i ATA są nieco inne. Możliwe jest, że test długi przejdzie, nawet jeśli test krótki zakończy się niepowodzeniem.
Dziennik autotestu dysku może zawierać do 21 wpisów tylko do odczytu. Po zapełnieniu dziennika stare wpisy są usuwane.
Zobacz też
- Porównanie narzędzi SMART
- Czyszczenie danych
- Narzędzie dyskowe
- Lista oprogramowania do partycjonowania dysków
- Predykcyjna analiza awarii
- Monitor systemu
- Dysk optyczny § Skanowanie błędów powierzchni
Bibliografia
Dalsza lektura
- Stephens, Curtis E, wyd. (22 czerwca 2011), "Zestaw poleceń ATA/ATAPI - 2 (ACS-2)" (PDF) , Zestaw poleceń ATA 2 (wersja robocza) (7 wyd.), ANSI INCITS, s. 73.
- "Znaczenie atrybutu SMART" . siguardian.com . Zarchiwizowane z oryginału 26 lutego 2011 . Pobrano 3 lutego 2006 .
- Chlondowski, Zbigniew. "Witryna SMART: tabela referencyjna atrybutów" . SMART Linux . Źródło 17 stycznia 2007 .
- „Atrybuty SMART znaczenie” . Ariolik. 2007 . Źródło 26 października 2007 .
- "Czy możemy wierzyć SMART?" . HDS Węgry . 2007 . Źródło 4 czerwca 2008 .
- Allena, Bruce'a (2004). „Monitorowanie dysków twardych za pomocą SMART” . Dziennik Linuksa . Pobrano 8 sierpnia 2010 .
Zewnętrzne linki
- UC Santa Cruz i Quantum wydają oprogramowanie SMART dla systemu Linux , Michael Cornwell.
- Pakiet UCSC SMART , SourceForgeprzez: cornwell .
- Czym różnią się smartmontools od smartsuite? , SourceForge.
- Narzędzia do monitorowania SMART , SourceForgeprzez: ballen4705 .
- smartmontools i smartsuite , smartmontools.org.
- GSmartControl to GUI dla smartctl (część smartmontools) autorstwa Alexandra Shaduriego
- Jak SMART jest twój dysk twardy? , Wielka Brytania : pc-king.co.uk.
- Jak przewidzieć awarię dysku twardego (raport SMART) , 2010-05-19z Palimpsestem (pierwotnie Red Hat)
- KB251: Zrozumienie awarii i błędów SMART i SMART , Western Digital.
- Jak działa SMART funkcji dysków twardych?.
- Hard Drive SMART Stats , raport terenowy na dużą skalę
- Specyfikacja atrybutów Seagate SMART
- Normalne zachowanie atrybutu SATA SMART (Seagate)
- Duży zbiór raportów SMART