MĄDRY - S.M.A.R.T.

SMART ( Self-Monitoring, Analysis and Reporting Technology ; często pisany jako SMART ) to system monitorowania zawarty w dyskach twardych komputera (HDD), dyskach półprzewodnikowych (SSD) i dyskach eMMC . Jego podstawową funkcją jest wykrywanie i raportowanie różnych wskaźników niezawodności dysku z zamiarem przewidywania nieuchronnych awarii sprzętu.

Gdy dane SMART wskazują na możliwą nieuchronną awarię dysku, oprogramowanie działające w systemie hosta może powiadomić użytkownika, aby można było podjąć działania zapobiegawcze, aby zapobiec utracie danych, a uszkodzony dysk można wymienić i zachować integralność danych.

Tło

Dysk twardy i inne dyski do przechowywania danych podlegają awariom (patrz awaria dysku twardego ), które można podzielić na dwie podstawowe klasy:

Przewidywalne awarie, które wynikają z powolnych procesów, takich jak zużycie mechaniczne i stopniowa degradacja powierzchni magazynowych. Monitorowanie może określić, kiedy takie awarie stają się bardziej prawdopodobne.
Nieprzewidywalne awarie, które pojawiają się bez ostrzeżenia z powodu czegokolwiek, od uszkodzenia elementów elektronicznych po nagłą awarię mechaniczną, w tym awarie związane z niewłaściwą obsługą.

Awarie mechaniczne stanowią około 60% wszystkich awarii napędów. Chociaż ostateczna awaria może być katastrofalna, większość awarii mechanicznych wynika ze stopniowego zużycia i zwykle istnieją pewne oznaki, że awaria jest nieuchronna. Mogą to być: zwiększona moc cieplna, zwiększony poziom hałasu, problemy z odczytem i zapisem danych, czy zwiększenie liczby uszkodzonych sektorów dysku.

Strona PCTechGuide na temat SMART (2003) komentuje, że technologia przeszła przez trzy fazy:

W swoim pierwotnym wcieleniu SMART zapewniał przewidywanie awarii poprzez monitorowanie niektórych działań na dysku twardym online.

Kolejna wersja standardu poprawiła przewidywanie awarii poprzez dodanie automatycznego skanowania odczytu offline w celu monitorowania dodatkowych operacji. atrybuty online są zawsze aktualizowane, podczas gdy atrybuty offline są aktualizowane, gdy dysk twardy nie działa. Jeśli istnieje natychmiastowa potrzeba aktualizacji atrybutów offline, dysk twardy zwalnia, a atrybuty offline są aktualizowane. Najnowsza technologia „SMART” nie tylko monitoruje aktywność dysku twardego, ale także dodaje zapobieganie awariom, próbując wykryć i naprawić błędy sektorów.

Ponadto, podczas gdy wcześniejsze wersje technologii monitorowały aktywność dysku twardego tylko pod kątem danych pobranych przez system operacyjny, najnowszy SMART testuje wszystkie dane i wszystkie sektory dysku, wykorzystując „zbieranie danych offline”, aby potwierdzić stan dysku podczas okresy bezczynności.

Precyzja

Badanie terenowe przeprowadzone przez Google obejmujące ponad 100 000 dysków klasy konsumenckiej od grudnia 2005 do sierpnia 2006 wykazało korelacje między niektórymi informacjami SMART a rocznymi wskaźnikami awarii:

W ciągu 60 dni po pierwszym niepoprawnym błędzie na dysku ( atrybut SMART 0xC6 lub 198) wykrytym w wyniku skanowania offline, dysk był średnio 39 razy bardziej narażony na awarię niż podobny dysk, dla którego nie ma takiego błędu wystąpił.
Pierwsze błędy w realokacjach, realokacjach offline ( atrybuty SMART 0xC4 i 0x05 lub 196 i 5) oraz liczenia próbne ( atrybut SMART 0xC5 lub 197) były również silnie skorelowane z wyższym prawdopodobieństwem niepowodzenia.
Odwrotnie, stwierdzono niewielką korelację ze wzrostem temperatury i brak korelacji z poziomem użytkowania. Jednak badania wykazały, że duża część (56%) uszkodzonych dysków uległa awarii, nie rejestrując żadnej liczby w „czterech silnych ostrzeżeniach SMART” zidentyfikowanych jako błędy skanowania, liczba realokacji, realokacja offline i liczba próbna.
Co więcej, 36% uszkodzonych dysków zrobiło to bez rejestrowania żadnego błędu SMART, z wyjątkiem temperatury, co oznacza, że same dane SMART miały ograniczoną użyteczność w przewidywaniu awarii.

Historia i poprzednicy

Wczesna technologia monitorowania dysków twardych została wprowadzona przez IBM w 1992 roku w swoich macierzach dyskowych IBM 9337 dla serwerów AS/400 wykorzystujących dyski IBM 0662 SCSI-2. Później nazwano ją technologią Predictive Failure Analysis (PFA). Mierzył kilka kluczowych parametrów kondycji urządzenia i oceniał je w oprogramowaniu układowym dysku. Komunikacja między jednostką fizyczną a oprogramowaniem monitorującym była ograniczona do wyniku binarnego: a mianowicie „urządzenie jest sprawne” lub „napęd prawdopodobnie wkrótce ulegnie awarii”.

Później inny wariant, nazwany IntelliSafe, został stworzony przez producenta komputerów Compaq i producentów dysków Seagate , Quantum i Conner . Napędy dysków mierzyłyby „parametry kondycji” dysku, a wartości byłyby przesyłane do systemu operacyjnego i oprogramowania do monitorowania przestrzeni użytkownika. Każdy dostawca dysków twardych mógł swobodnie decydować, które parametry mają być uwzględnione w monitorowaniu i jakie powinny być ich progi. Ujednolicenie odbyło się na poziomie protokołu z gospodarzem.

Compaq zgłosił IntelliSafe do komitetu Small Form Factor (SFF) w celu standaryzacji na początku 1995 roku. Został on wsparty przez IBM, partnerów programistycznych Compaqa Seagate, Quantum i Conner oraz Western Digital , które nie posiadało systemu przewidywania awarii na czas. Komitet wybrał podejście IntelliSafe, ponieważ zapewniało ono większą elastyczność. Compaq umieścił IntelliSafe w domenie publicznej w dniu 12 maja 1995 r. Powstały wspólnie opracowany standard został nazwany SMART.

Ten standard SFF opisał protokół komunikacyjny dla hosta ATA do używania i kontrolowania monitorowania i analizy na dysku twardym, ale nie określał żadnych konkretnych metryk ani metod analizy. Później zaczęto rozumieć „SMART” (choć bez żadnej formalnej specyfikacji) w odniesieniu do różnych konkretnych metryk i metod oraz w odniesieniu do protokołów niezwiązanych z usługą ATA do komunikowania tego samego rodzaju rzeczy.

Podane informacje

Dokumentacja techniczna SMART jest w standardzie AT Attachment (ATA). Wprowadzony po raz pierwszy w 1994 roku standard ATA przeszedł wiele zmian. Niektóre części oryginalnej specyfikacji SMART opracowanej przez Komitet Small Form Factor (SFF) zostały dodane do ATA-3, opublikowanej w 1997 r. W 1998 r. ATA-4 zrezygnowała z wymogu utrzymywania przez dyski wewnętrznej tabeli atrybutów i zamiast tego była wymagana tylko dla „ OK" lub "NIE OK" wartość do zwrócenia. Jednak producenci zachowali możliwość pobierania wartości atrybutów. Najnowszy standard ATA, ATA-8, został opublikowany w 2004 roku. Poddawany był regularnym zmianom, ostatnia miała miejsce w 2011 roku. odnoszą się również do tych podobnych funkcji w SMART.

Najbardziej podstawową informacją, jaką dostarcza SMART, jest status SMART. Podaje tylko dwie wartości: „próg nie przekroczony” i „próg przekroczony”. Często są one reprezentowane odpowiednio jako „napęd OK” lub „napęd awaria”. Wartość „próg przekroczenia” ma wskazywać, że istnieje stosunkowo duże prawdopodobieństwo, że dysk nie będzie w stanie przestrzegać swojej specyfikacji w przyszłości: oznacza to, że dysk „niedługo ulegnie awarii”. Przewidywana awaria może być katastrofalna lub może być czymś tak subtelnym, jak brak możliwości zapisu do niektórych sektorów lub być może niższa wydajność niż deklarowane przez producenta minimum.

Stan SMART niekoniecznie wskazuje na przeszłą lub obecną niezawodność dysku. Jeśli dysk uległ już katastrofalnej awarii, status SMART może być niedostępny. Alternatywnie, jeśli dysk miał problemy w przeszłości, ale czujniki nie wykrywają już takich problemów, stan SMART może, w zależności od oprogramowania producenta, sugerować, że dysk jest teraz sprawny.

Niemożność odczytania niektórych sektorów nie zawsze oznacza, że dysk niedługo ulegnie awarii. Jednym ze sposobów tworzenia nieczytelnych sektorów, nawet gdy dysk działa zgodnie ze specyfikacją, jest nagła awaria zasilania podczas zapisu dysku. Ponadto, nawet jeśli dysk fizyczny jest uszkodzony w jednym miejscu, tak że pewien sektor jest nieczytelny, dysk może wykorzystać wolne miejsce do zastąpienia uszkodzonego obszaru, aby sektor mógł zostać nadpisany.

Więcej szczegółów na temat stanu dysku można uzyskać, badając atrybuty SMART. Atrybuty SMART zostały uwzględnione w niektórych wersjach roboczych standardu ATA, ale zostały usunięte, zanim standard stał się ostateczny. Znaczenie i interpretacja atrybutów różni się w zależności od producenta i czasami są uważane za tajemnicę handlową dla jednego lub drugiego producenta. Atrybuty są szczegółowo omówione poniżej.

Dyski ze SMART mogą opcjonalnie prowadzić pewną liczbę „dzienników”. W dzienniku błędów zapisywane są informacje o najnowszych błędach zgłoszonych przez dysk do komputera hosta. Przejrzenie tego dziennika może pomóc w ustaleniu, czy problemy z komputerem są związane z dyskiem lub spowodowane przez coś innego (sygnatury czasowe dziennika błędów mogą się „zawinąć” po 2 ³² ms = 49,71 dni)

Napęd, w którym zaimplementowano SMART, może opcjonalnie zaimplementować szereg procedur autotestu lub konserwacji, a wyniki testów są przechowywane w dzienniku autotestów . Procedury autotestu mogą być użyte do wykrycia wszelkich nieczytelnych sektorów na dysku, tak aby można je było przywrócić z kopii zapasowych (na przykład z innych dysków w macierzy RAID ). Pomaga to zmniejszyć ryzyko poniesienia trwałej utraty danych.

Standardy i implementacja

Brak wspólnej interpretacji

Wiele płyt głównych wyświetla komunikat ostrzegawczy, gdy dysk zbliża się do awarii. Chociaż wśród większości głównych producentów dysków twardych istnieje standard branżowy, problemy pozostają spowodowane atrybutami celowo pozostawionymi nieudokumentowanymi publicznie w celu rozróżnienia modeli między producentami. Z prawnego punktu widzenia termin „SMART” odnosi się tylko do metody sygnalizacji między czujnikami elektromechanicznymi wewnętrznego dysku twardego a komputerem hosta. Z tego powodu specyfikacje SMART są całkowicie specyficzne dla dostawcy i chociaż wiele z tych atrybutów zostało ustandaryzowanych między dostawcami napędów, inne pozostają zależne od dostawcy. Implementacje SMART wciąż się różnią i w niektórych przypadkach mogą brakować „wspólnych” lub oczekiwanych funkcji, takich jak czujnik temperatury, lub zawierać tylko kilka wybranych atrybutów, jednocześnie umożliwiając producentowi reklamowanie produktu jako „zgodnego z SMART”.

Widoczność dla systemów hosta

W zależności od typu używanego interfejsu, niektóre płyty główne z obsługą SMART i powiązane oprogramowanie mogą nie komunikować się z niektórymi dyskami obsługującymi SMART. Na przykład kilka dysków zewnętrznych podłączonych przez USB i FireWire prawidłowo wysyła dane SMART przez te interfejsy. Przy tak wielu sposobach podłączenia dysku twardego ( SCSI , Fibre Channel , ATA , SATA , SAS , SSA , NVMe i tak dalej) trudno przewidzieć, czy raporty SMART będą działać poprawnie w danym systemie.

Nawet w przypadku dysku twardego i interfejsu, który implementuje specyfikację, system operacyjny komputera może nie widzieć informacji SMART, ponieważ dysk i interfejs są umieszczone w niższej warstwie. Na przykład mogą być częścią podsystemu RAID, w którym kontroler RAID widzi dysk z obsługą SMART, ale komputer hosta widzi tylko wolumin logiczny wygenerowany przez kontroler RAID.

Na platformie Windows wiele programów przeznaczonych do monitorowania i raportowania informacji SMART będzie działać tylko z kontem administratora .

System BIOS i Windows ( Windows Vista i nowsze) mogą wykrywać stan SMART dysków twardych i dysków półprzewodnikowych oraz wyświetlać komunikat, jeśli stan SMART jest zły.

Dostęp

Aby zapoznać się z listą różnych programów, które umożliwiają odczytywanie danych SMART, zobacz Porównanie narzędzi SMART .

Atrybuty ATA SMART

Każdy producent napędu definiuje zestaw atrybutów i ustawia wartości progowe, powyżej których atrybuty nie powinny przejść podczas normalnej pracy. Każdy atrybut ma surową wartość, która może być wartością dziesiętną lub szesnastkową, której znaczenie zależy wyłącznie od producenta dysku (ale często odpowiada liczbie lub jednostce fizycznej, takiej jak stopnie Celsjusza lub sekundy), wartość znormalizowaną , której zakres od 1 do 253 (przy czym 1 reprezentuje najgorszy przypadek, a 253 reprezentuje najlepszy) i najgorszą wartość , która reprezentuje najniższą zarejestrowaną wartość znormalizowaną. Początkowa wartość domyślna atrybutów to 100, ale może się różnić w zależności od producenta.

Producenci, którzy zaimplementowali co najmniej jeden atrybut SMART w różnych produktach, to między innymi Samsung , Seagate , IBM ( Hitachi ), Fujitsu , Maxtor , Toshiba , Intel , sTec, Inc. , Western Digital i ExcelStor Technology .

Znane atrybuty ATA SMART

Poniższa tabela przedstawia niektóre atrybuty SMART i typowe znaczenie ich nieprzetworzonych wartości. Znormalizowane wartości są zwykle mapowane, aby wyższe wartości były lepsze (wyjątki obejmują temperaturę napędu, liczbę cykli ładowania/rozładowania głowicy), ale wyższe wartości atrybutów surowych mogą być lepsze lub gorsze w zależności od atrybutu i producenta. Na przykład znormalizowana wartość atrybutu „ Liczba ponownie przydzielonych sektorów ” zmniejsza się wraz ze wzrostem liczby ponownie przydzielonych sektorów . W takim przypadku surowa wartość atrybutu często wskazuje rzeczywistą liczbę sektorów, które zostały ponownie przydzielone, chociaż dostawcy nie są w żaden sposób zobowiązani do przestrzegania tej konwencji.

Ponieważ producenci niekoniecznie zgadzają się co do dokładnych definicji atrybutów i jednostek miary, poniższa lista atrybutów jest jedynie ogólnym przewodnikiem.

Dyski nie obsługują wszystkich kodów atrybutów (czasami skracanych jako „ID” dla „identyfikatora” w tabelach). Niektóre kody są specyficzne dla poszczególnych typów dysków (talerz magnetyczny, flash, SSD). Napędy mogą używać różnych kodów dla tego samego parametru, np. patrz kody 193 i 225.

Legenda
NS	193 0xC1	Kod atrybutu w notacji dziesiętnej i szesnastkowej
Ideał	Wysoka	Wyższa surowa wartość jest lepsza
Ideał	Niski	Niższa surowa wartość jest lepsza
! (Krytyczny)		Oznacza atrybut krytyczny . Określone wartości mogą przewidywać awarię dysku

NS	Nazwa atrybutu	Ideał	Opis
01 0x01	Wskaźnik błędów odczytu	Niski	(Wartość surowa specyficzna dla dostawcy.) Przechowuje dane związane z częstotliwością sprzętowych błędów odczytu, które wystąpiły podczas odczytu danych z powierzchni dysku. Surowa wartość ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy.
02 0x02	Wydajność przepustowa	Wysoka	Ogólna (ogólna) przepustowość dysku twardego. Jeśli wartość tego atrybutu maleje, istnieje duże prawdopodobieństwo, że wystąpił problem z dyskiem.
03 0x03	Czas rozkręcania	Niski	Średni czas rozkręcania się wrzeciona (od zera RPM do pełnej sprawności [milisekundy]).
04 0x04	Licznik start/stop		Zliczanie cykli start/stop wrzeciona. Wrzeciono włącza się, a zatem liczba jest zwiększana, zarówno gdy dysk twardy jest włączony po wcześniejszym całkowitym wyłączeniu (odłączony od źródła zasilania), jak i gdy dysk twardy powraca z poprzedniego trybu uśpienia.
05 0x05	Liczba przeniesionych sektorów	Niski	Liczba realokowanych sektorów. Surowa wartość reprezentuje liczbę uszkodzonych sektorów , które zostały znalezione i zmapowane. Dlatego im wyższa wartość atrybutu, tym więcej sektorów dysk musiał ponownie przydzielić. Ta wartość jest używana przede wszystkim jako miara oczekiwanej długości życia dysku; dysk, który w ogóle miał jakiekolwiek realokacje, jest znacznie bardziej podatny na awarię w najbliższych miesiącach.
06 0x06	Przeczytaj margines kanału		Margines kanału podczas odczytu danych. Funkcja tego atrybutu nie jest określona.
07 0x07	Szukaj współczynnika błędów	Różne	(Wartość surowa specyficzna dla dostawcy.) Szybkość wyszukiwania błędów głowic magnetycznych. Jeśli wystąpi częściowa awaria mechanicznego systemu pozycjonowania, pojawią się błędy wyszukiwania. Taka awaria może być spowodowana wieloma czynnikami, takimi jak uszkodzenie serwomechanizmu lub rozszerzenie termiczne dysku twardego. Surowa wartość ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy.
08 0x08	Poszukuj wydajności czasu	Wysoka	Średnia wydajność operacji wyszukiwania głowic magnetycznych. Jeśli ten atrybut maleje, jest to oznaka problemów w podsystemie mechanicznym.
09 0x09	Godziny włączenia		Liczba godzin w stanie włączonym. Surowa wartość tego atrybutu pokazuje całkowitą liczbę godzin (lub minut lub sekund, w zależności od producenta) w stanie włączonym. „Domyślnie, całkowity oczekiwany czas życia dysku twardego w idealnym stanie jest definiowany jako 5 lat (działający codziennie i w nocy przez wszystkie dni). Odpowiada to 1825 dniom w trybie 24/7 lub 43800 godzinom”. Na niektórych dyskach sprzed 2005 r. ta wartość surowa może rosnąć nieregularnie i/lub „zawijać” (okresowo resetować do zera).
10 0x0A	Liczba ponownych prób kręcenia	Niski	Liczba ponownych prób rozpoczęcia spinu. Atrybut ten przechowuje całkowitą liczbę prób rozpoczęcia spinu w celu osiągnięcia pełnej prędkości operacyjnej (pod warunkiem, że pierwsza próba zakończyła się niepowodzeniem). Wzrost wartości tego atrybutu jest oznaką problemów w podsystemie mechanicznym dysku twardego.
11 0x0B	Próby ponownej kalibracji lub liczba prób kalibracji	Niski	Atrybut ten wskazuje liczbę żądań ponownej kalibracji (pod warunkiem, że pierwsza próba zakończyła się niepowodzeniem). Wzrost wartości tego atrybutu jest oznaką problemów w podsystemie mechanicznym dysku twardego.
12 0x0C	Liczba cykli zasilania		Ten atrybut wskazuje liczbę pełnych cykli włączania/wyłączania dysku twardego.
13 0x0D	Wskaźnik błędów miękkiego odczytu	Niski	Niepoprawione błędy odczytu zgłoszone do systemu operacyjnego.
22 0x16	Aktualny poziom helu	Wysoka	Specyficzne dla napędów He8 firmy HGST. Ta wartość mierzy hel wewnątrz napędu specyficznego dla tego producenta. Jest to atrybut przed awarią, który uruchamia się, gdy dysk wykryje, że środowisko wewnętrzne jest niezgodne ze specyfikacją.
170 0xAA	Dostępne zarezerwowane miejsce		Zobacz atrybut E8.
171 0xAB	Liczba błędów programu SSD		(Kingston) Łączna liczba niepowodzeń działania programu flash od czasu wdrożenia dysku. Identyczny z atrybutem 181.
172 0xAC	Liczba niepowodzeń kasowania dysku SSD		(Kingston) Zlicza liczbę niepowodzeń wymazywania pamięci flash. Ten atrybut zwraca całkowitą liczbę niepowodzeń operacji wymazywania pamięci Flash od czasu wdrożenia dysku. Ten atrybut jest identyczny z atrybutem 182.
173 0xAD	Liczba wyrównywania zużycia dysków SSD		Oblicza maksymalną liczbę najgorszych wymazań w dowolnym bloku.
174 0xAE	Nieoczekiwana liczba strat mocy		Znany również jako „Licznik wycofań po wyłączeniu” zgodnie z konwencjonalną terminologią dotyczącą dysków twardych. Wartość surowa podaje liczbę nieczystych zamknięć, skumulowaną w całym okresie eksploatacji dysku SSD, gdzie „nieczyste zamknięcie” to odłączenie zasilania bez STANDBY IMMEDIATE jako ostatniego polecenia (niezależnie od aktywności PLI wykorzystującej moc kondensatora). Znormalizowana wartość to zawsze 100.
175 0xAF	Awaria ochrony przed utratą zasilania		Ostatni wynik testu w mikrosekundach do rozładowania nasadki, nasycony do maksymalnej wartości. Rejestruje również minuty od ostatniego testu i liczbę testów w okresie istnienia. Wartość surowa zawiera następujące dane: Bajty 0-1: ostatni wynik testu w mikrosekundach do rozładowania limitu, nasycenie przy maksymalnej wartości. Wynik testu oczekiwany w zakresie 25 <= wynik <= 5000000, niższy oznacza określony kod błędu. Bajty 2-3: minuty od ostatniego testu, nasycenie przy maksymalnej wartości. Bajty 4-5: Żywotna liczba testów, nie zwiększana w cyklu zasilania, nasyca się przy maksymalnej wartości. Znormalizowana wartość jest ustawiana na jeden w przypadku niepowodzenia testu lub 11, jeśli kondensator był testowany w warunkach nadmiernej temperatury, w przeciwnym razie 100.
176 0xB0	Licznik niepowodzeń kasowania		Parametr SMART wskazuje na liczbę niepowodzeń poleceń kasowania błysku.
177 0xB1	Różnica zakresu zużycia		Różnica między najbardziej i najrzadziej używanymi blokami Flash. Opisuje, jak dobrze / źle działa wyrównywanie zużycia dysku SSD w bardziej techniczny sposób.
178 0xB2	Używana zarezerwowana liczba bloków		Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung.
179 0xB3	Używana zarezerwowana całkowita liczba bloków		Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung.
180 0xB4	Całkowita liczba niewykorzystanych zarezerwowanych bloków		Atrybut „Pre-Fail” używany przynajmniej w urządzeniach HP.
181 0xB5	Całkowita liczba niepowodzeń programu lub liczba dopasowanych dostępów innych niż 4K	Niski	Całkowita liczba niepowodzeń działania programu Flash od czasu wdrożenia dysku. Liczba dostępów do danych użytkownika (zarówno odczyty, jak i zapisy), w których LBA nie są wyrównane 4 KiB (LBA % 8 != 0) lub gdy rozmiar nie jest modułem 4 KiB (liczba bloków != 8), przy założeniu logicznego rozmiaru bloku (LBS) = 512 B.
182 0xB6	Licznik niepowodzeń kasowania		Atrybut „Pre-Fail” używany przynajmniej w urządzeniach Samsung.
183 0xB7	Liczba błędów redukcji biegów SATA lub nieprawidłowy blok w czasie wykonywania	Niski	Atrybut Western Digital, Samsung lub Seagate: albo liczba redukcji szybkości łącza (np. z 6Gbit/s do 3Gbit/s) albo całkowita liczba bloków danych z wykrytymi, niemożliwymi do naprawienia błędami napotkanymi podczas normalnej pracy. Chociaż degradacja tego parametru może być wskaźnikiem starzenia się napędu i/lub potencjalnych problemów elektromechanicznych, nie wskazuje bezpośrednio na zbliżającą się awarię napędu.
184 0xB8	Błąd kompleksowy / IOEDC	Niski	Ten atrybut jest częścią technologii SMART IV firmy Hewlett-Packard , a także częścią schematów wykrywania i korekcji błędów we/wy innych dostawców i zawiera liczbę błędów parzystości, które występują w ścieżce danych do nośnika za pośrednictwem pamięć podręczna pamięci RAM.
185 0xB9	Stabilność głowy		Atrybut Western Digital.
186 0xBA	Wykrywanie wibracji indukowanych Op		Atrybut Western Digital.
187 0xBB	Zgłoszone błędy nie do naprawienia	Niski	Liczba błędów, których nie można było naprawić za pomocą sprzętowego ECC (patrz atrybut 195).
188 0xBC	Limit czasu polecenia	Niski	Liczba operacji przerwanych z powodu przekroczenia limitu czasu HDD. Normalnie ta wartość atrybutu powinna być równa zero.
189 0xBD	High Fly pisze	Niski	Producenci dysków twardych wdrażają czujnik wysokości lotu , który stara się zapewnić dodatkowe zabezpieczenia operacji zapisu, wykrywając, kiedy głowica zapisująca znajduje się poza swoim normalnym zakresem roboczym. W przypadku napotkania niebezpiecznego warunku wysokości lotu, proces zapisu jest zatrzymywany, a informacje są ponownie zapisywane lub przenoszone do bezpiecznego regionu dysku twardego. Ten atrybut wskazuje liczbę tych błędów wykrytych w okresie eksploatacji dysku. Ta funkcja jest zaimplementowana w większości nowoczesnych dysków Seagate i niektórych dysków Western Digital, począwszy od dysków twardych WD Enterprise WDE18300 i WDE9180 Ultra2 SCSI, i będzie dostępna we wszystkich przyszłych produktach WD Enterprise.
190 0xBE	Różnica temperatur lub temperatura przepływu powietrza	Różne	Wartość jest równa (100-temp. °C), pozwalając producentowi na ustawienie minimalnego progu, który odpowiada maksymalnej temperaturze. Jest to również zgodne z konwencją, w której 100 jest najlepszym przypadkiem, a niższe wartości są niepożądane. Jednak niektóre starsze dyski mogą zamiast tego zgłaszać surową Temperaturę (identyczną z 0xC2) lub Temperaturę minus 50 tutaj.
191 0xBF	Wskaźnik błędów G-sense	Niski	Liczba błędów wynikających z zewnętrznych wstrząsów i wibracji.
192 0xC0	Power-off Retract hrabiego , awaryjne Retract Cykl Hrabia (Fujitsu) lub niebezpieczne Shutdown Hrabia	Niski	Liczba cykli wyłączania lub wycofywania awaryjnego.
193 0xC1	Liczba cykli ładowania lub Liczba cykli ładowania/rozładowywania (Fujitsu)	Niski	Liczba cykli załadunku/rozładunku do pozycji strefy lądowania czołowego. Niektóre dyski używają zamiast tego 225 (0xE1) do licznika cykli obciążenia. Western Digital ocenia swoje dyski VelociRaptor na 600 000 cykli ładowania/rozładowywania, a dyski WD Green na 300 000 cykli; te ostatnie są przeznaczone do częstego rozładowywania głowic w celu oszczędzania energii. Z drugiej strony, WD3000GLFS (dysk do komputerów stacjonarnych) jest przeznaczony tylko do 50 000 cykli ładowania/rozładowywania. Niektóre dyski do laptopów i dyski do komputerów stacjonarnych „zielonej energii” są zaprogramowane tak, aby rozładowywały głowice, gdy przez krótki czas nie było żadnej aktywności, w celu oszczędzania energii. Systemy operacyjne często uzyskują dostęp do systemu plików kilka razy na minutę w tle, powodując 100 lub więcej cykli ładowania na godzinę, jeśli głowice są rozładowywane: ocena cyklu ładowania może zostać przekroczona w mniej niż rok. Istnieją programy dla większości systemów operacyjnych, które wyłączają funkcje zaawansowanego zarządzania energią (APM) i automatycznego zarządzania akustycznego (AAM), powodując częste cykle ładowania.
194 0xC2	Temperatura lub temperatura Celsjusza	Niski	Wskazuje temperaturę urządzenia, jeśli jest zamontowany odpowiedni czujnik. Najniższy bajt nieprzetworzonej wartości zawiera dokładną wartość temperatury (stopnie Celsjusza).
195 0xC3	Odzyskano ECC sprzętu	Różne	(Wartość surowa specyficzna dla dostawcy.) Wartość surowa ma różną strukturę dla różnych dostawców i często nie ma znaczenia jako liczba dziesiętna. W przypadku niektórych dysków liczba ta może wzrosnąć podczas normalnej pracy, niekoniecznie oznaczając błędy.
196 0xC4	Liczba zdarzeń realokacji	Niski	Liczba operacji remapowania. Nieprzetworzona wartość tego atrybutu pokazuje całkowitą liczbę prób przesłania danych z ponownie przydzielonych sektorów do wolnego obszaru. Liczone są zarówno udane, jak i nieudane próby.
197 0xC5	Aktualna liczba oczekujących sektorów	Niski	Liczba sektorów „niestabilnych” (oczekujących na ponowne odwzorowanie z powodu nieodwracalnych błędów odczytu). Jeśli niestabilny sektor zostanie następnie pomyślnie odczytany, sektor jest ponownie mapowany, a wartość ta jest zmniejszana. Błędy odczytu w sektorze nie spowodują natychmiastowego przemapowania sektora (ponieważ poprawna wartość nie może być odczytana, a więc wartość do przemapowania nie jest znana, a także może stać się czytelna później); zamiast tego oprogramowanie układowe dysku pamięta, że sektor musi zostać ponownie zmapowany, i zmapuje go przy następnym zapisie. Jednak niektóre dyski nie będą od razu remapować takich sektorów po zapisaniu; zamiast tego dysk najpierw spróbuje zapisać w problematycznym sektorze, a jeśli operacja zapisu się powiedzie, sektor zostanie oznaczony jako dobry (w tym przypadku „Liczba zdarzeń realokacji” (0xC4) nie zostanie zwiększona). Jest to poważna wada, ponieważ jeśli taki dysk zawiera marginalne sektory, które konsekwentnie zawodzą dopiero po pewnym czasie od pomyślnej operacji zapisu, dysk nigdy nie zmieni mapowania tych problematycznych sektorów.
198 0xC6	(Offline) Liczba sektorów, których nie można naprawić	Niski	Całkowita liczba niepoprawnych błędów podczas odczytu/zapisu sektora. Wzrost wartości tego atrybutu wskazuje na wady powierzchni dysku i/lub problemy w podsystemie mechanicznym.
199 0xC7	Liczba błędów UltraDMA CRC	Niski	Liczba błędów w przesyłaniu danych przez kabel interfejsu określona przez ICRC (Interface Cyclic Redundancy Check).
200 0xC8	Częstość błędów w wielu strefach	Niski	Liczba błędów znalezionych podczas zapisywania sektora. Im wyższa wartość, tym gorszy stan mechaniczny dysku.
200 0xC8	Współczynnik błędów zapisu (Fujitsu)	Niski	Całkowita liczba błędów podczas zapisywania sektora.
201 0xC9	Wykryto wskaźnik błędów miękkiego odczytu lub licznik TA	Niski	Liczba wskazuje liczbę niepoprawnych błędów odczytu oprogramowania.
202 0xCA	Błędy oznaczenia adresu danych lub zwiększenie licznika TA	Niski	Liczba błędów znacznika adresu danych (lub specyficznych dla dostawcy).
203 0xCB	Zabrakło Anuluj	Niski	Liczba błędów spowodowanych nieprawidłową sumą kontrolną podczas korekcji błędów.
204 0xCC	Miękka korekcja ECC	Niski	Liczba błędów skorygowanych przez wewnętrzne oprogramowanie do korekcji błędów.
205 0xCD	Współczynnik chropowatości termicznej	Niski	Liczba błędów spowodowanych wysoką temperaturą.
206 0xCE	Latająca wysokość		Wysokość głowic nad powierzchnią dysku. Jeśli jest zbyt nisko, bardziej prawdopodobny jest wypadek głowy; jeśli jest zbyt wysoki, bardziej prawdopodobne są błędy odczytu/zapisu.
207 0xCF	Wiruj wysoki prąd	Niski	Wielkość prądu udarowego użytego do rozkręcenia napędu.
208 0xD0	Zakręć Buzz		Liczba brzęczących procedur potrzebnych do rozkręcenia dysku z powodu niewystarczającej mocy.
209 0xD1	Szukaj wyników offline		Dysk szuka wydajności podczas testów wewnętrznych.
210 0xD2	Wibracje podczas zapisu		Znajduje się na dyskach Maxtor 6B200M0 200 GB i Maxtor 2R015H1 15 GB.
211 0xD3	Wibracje podczas zapisu		Nagranie drgań napotkanych podczas operacji zapisu.
212 0xD4	Szok podczas zapisu		Nagranie wstrząsu napotkanego podczas operacji zapisu.
220 0xDC	Przesunięcie dysku	Niski	Odległość, o którą przesunęła się tarcza względem wrzeciona (zwykle z powodu wstrząsu lub temperatury). Jednostka miary jest nieznana.
221 0xDD	Wskaźnik błędów G-Sense	Niski	Liczba błędów wynikających z zewnętrznych wstrząsów i wibracji. Bardziej typowo zgłaszane na 0xBF.
222 0xDE	Załadowane godziny		Czas spędzony na pracy pod obciążeniem danych (ruch magnetycznej zwory głowicy).
223 0xDF	Liczba ponownych prób załadowania/rozładowania		Zliczanie zmian pozycji głowy.
224 0xE0	Tarcie obciążenia	Niski	Opór spowodowany tarciem w częściach mechanicznych podczas pracy.
225 0xE1	Liczba cykli ładowania/rozładowywania	Niski	Całkowita liczba cykli obciążenia Niektóre dyski używają zamiast tego liczby 193 (0xC1) do liczby cykli obciążenia. Zobacz opis 193, aby poznać znaczenie tej liczby.
226 0xE2	Wczytaj „w czasie”		Całkowity czas ładowania siłownika głowic magnetycznych (czas nie spędzony na parkingu).
227 0xE3	Liczba wzmocnienia momentu obrotowego	Niski	Liczba prób kompensacji wahań prędkości talerza.
228 0xE4	Cykl wycofania przy wyłączonym zasilaniu	Niski	Liczba cykli wyłączania, które są liczone, gdy występuje „zdarzenie cofania” i głowice są ładowane z nośnika, na przykład gdy urządzenie jest wyłączone, uśpione lub bezczynne.
230 0xE6	Amplituda głowicy GMR (dyski magnetyczne), stan ochrony dysku (SSD)		Amplituda „miotania” (powtarzalne ruchy głowy pomiędzy operacjami). W przypadku dysków półprzewodnikowych wskazuje, czy trajektoria użytkowania przekracza oczekiwaną krzywą żywotności
231 0xE7	Pozostała żywotność (dyski SSD) lub temperatura		Wskazuje przybliżony pozostały czas eksploatacji dysku SSD pod względem cykli programu/kasowania lub dostępnych zarezerwowanych bloków. Znormalizowana wartość 100 oznacza nowy dysk, a wartość progowa 10 oznacza konieczność wymiany. Wartość 0 może oznaczać, że dysk działa w trybie tylko do odczytu, aby umożliwić odzyskanie danych. Wcześniej (przed 2010 r.) sporadycznie używany do pomiaru temperatury przemiennika (częściej zgłaszany przy 0xC2).
232 0xE8	Pozostała wytrzymałość lub dostępna zarezerwowana przestrzeń		Liczba fizycznych cykli wymazywania wykonanych na dysku SSD wyrażona jako procent maksymalnej liczby fizycznych cykli wymazywania, jakie ma wytrzymać dysk. Dyski Intel SSD zgłaszają dostępne zarezerwowane miejsce jako procent początkowej zarezerwowanej przestrzeni.
233 0xE9	Wskaźnik zużycia nośnika (SSD) lub godziny włączenia		Dyski Intel SSD zgłaszają znormalizowaną wartość od 100, nowy dysk, do minimum 1. Zmniejsza się, podczas gdy cykle kasowania NAND wzrastają od 0 do maksymalnych cykli. Wcześniej (przed 2010 r.) sporadycznie używany do godzin włączenia zasilania (częściej zgłaszany w 0x09).
234 0xEA	Średnia liczba kasowań ORAZ maksymalna liczba kasowanych		Dekodowany jako: bajt 0-1-2 = średnia liczba kasowań (big endian) i bajt 3-4-5 = maksymalna ilość kasowań (big endian).
235 0xEB	Dobra liczba bloków ORAZ systemowa (bezpłatna) liczba bloków		Dekodowany jako: bajt 0-1-2 = dobra liczba bloków (big endian) i bajt 3-4 = systemowa (wolna) liczba bloków.
240 0xF0	Godziny lotu głową lub „ Współczynnik błędów transferu” (Fujitsu)		Czas spędzony podczas pozycjonowania głowic napędowych. Niektóre dyski Fujitsu zgłaszają liczbę resetów łącza podczas przesyłania danych.
241 0xF1	Całkowita liczba napisanych LBA		Całkowita liczba napisanych LBA.
242 0xF2	Łączny odczyt LBA		Całkowita liczba odczytanych LBA. Niektóre narzędzia SMART zgłaszają liczbę ujemną dla surowej wartości, ponieważ w rzeczywistości ma ona 48 bitów zamiast 32.
243 0xF3	Łączna liczba napisanych LBA po rozwinięciu		Górne 5 bajtów z 12-bajtowej łącznej liczby LBA zapisanych w urządzeniu. Mniejsza wartość 7 bajtów znajduje się w atrybucie 0xF1.
244 0xF4	Łączna liczba rozszerzonych odczytów LBA		Górne 5 bajtów z 12-bajtowej łącznej liczby LBA odczytanych z urządzenia. Mniejsza wartość 7 bajtów znajduje się w atrybucie 0xF2.
249 0xF9	Zapisy NAND (1GiB)		Całkowita liczba zapisów NAND. Wartość surowa podaje liczbę zapisów do NAND w przyrostach o 1 GB.
250 0xFA	Częstotliwość ponownych prób odczytu	Niski	Liczba błędów podczas odczytu z dysku.
251 0xFB	Pozostała minimalna ilość części zamiennych		Atrybut Minimum Spares Remaining wskazuje liczbę pozostałych zapasowych bloków jako procent całkowitej liczby dostępnych zapasowych bloków.
252 0xFC	Nowo dodany zły blok Flash		Atrybut „Newly Added Bad Flash Block” wskazuje całkowitą liczbę uszkodzonych bloków pamięci flash wykrytych przez dysk od momentu jego pierwszej inicjalizacji w produkcji.
254 0xFE	Ochrona przed upadkiem	Niski	Liczba wykrytych „zdarzeń swobodnego spadania”.

Próg przekracza warunek

Threshold Exceeds Condition (TEC) to szacowana data, w której krytyczny atrybut statystyki dysku osiągnie swoją wartość progową. Gdy oprogramowanie Drive Health zgłasza „Najbliższy TEC”, należy to traktować jako „Datę awarii”. Czasami nie podaje się daty i można oczekiwać, że dysk będzie działał bezbłędnie.

Aby przewidzieć datę, dysk śledzi tempo zmian atrybutu. Należy zauważyć, że daty TEC są tylko szacunkowe; Dyski twarde mogą i zawodzą znacznie wcześniej lub znacznie później niż data TEC.

Autotesty

Dyski SMART mogą oferować szereg autotestów:

Niski: Sprawdza wydajność elektryczną i mechaniczną, a także wydajność odczytu dysku. Testy elektryczne mogą obejmować test pamięci RAM bufora, test obwodów odczytu/zapisu lub test elementów głowicy odczytu/zapisu. Test mechaniczny obejmuje wyszukiwanie i serwo na ścieżkach danych. Skanuje małe części powierzchni dysku (obszar zależy od dostawcy, a test jest ograniczony czasowo). Sprawdza listę oczekujących sektorów, które mogą zawierać błędy odczytu i zwykle zajmuje to mniej niż dwie minuty.

Długie/przedłużone: Dłuższa i bardziej dokładna wersja krótkiego autotestu, skanująca całą powierzchnię dysku bez ograniczeń czasowych. Ten test trwa zwykle kilka godzin, w zależności od szybkości odczytu/zapisu dysku i jego rozmiaru.

Przewóz: Przeznaczony do szybkiego testu identyfikującego uszkodzenia powstałe podczas transportu urządzenia od producenta napędu do producenta komputera. Dostępne tylko na dyskach ATA i zwykle zajmuje kilka minut.

Selektywny: Niektóre napędy umożliwiają selektywne autotesty tylko części powierzchni.

Dzienniki autotestu dla dysków SCSI i ATA są nieco inne. Możliwe jest, że test długi przejdzie, nawet jeśli test krótki zakończy się niepowodzeniem.

Dziennik autotestu dysku może zawierać do 21 wpisów tylko do odczytu. Po zapełnieniu dziennika stare wpisy są usuwane.

Zobacz też

Bibliografia

Dalsza lektura

Stephens, Curtis E, wyd. (22 czerwca 2011), "Zestaw poleceń ATA/ATAPI - 2 (ACS-2)" (PDF) , Zestaw poleceń ATA 2 (wersja robocza) (7 wyd.), ANSI INCITS, s. 73.
"Znaczenie atrybutu SMART" . siguardian.com . Zarchiwizowane z oryginału 26 lutego 2011 . Pobrano 3 lutego 2006 .
Chlondowski, Zbigniew. "Witryna SMART: tabela referencyjna atrybutów" . SMART Linux . Źródło 17 stycznia 2007 .
„Atrybuty SMART znaczenie” . Ariolik. 2007 . Źródło 26 października 2007 .
"Czy możemy wierzyć SMART?" . HDS Węgry . 2007 . Źródło 4 czerwca 2008 .
Allena, Bruce'a (2004). „Monitorowanie dysków twardych za pomocą SMART” . Dziennik Linuksa . Pobrano 8 sierpnia 2010 .

Zewnętrzne linki

UC Santa Cruz i Quantum wydają oprogramowanie SMART dla systemu Linux , Michael Cornwell.
Pakiet UCSC SMART , SourceForgeprzez: cornwell .
Czym różnią się smartmontools od smartsuite? , SourceForge.
Narzędzia do monitorowania SMART , SourceForgeprzez: ballen4705 .
smartmontools i smartsuite , smartmontools.org.
GSmartControl to GUI dla smartctl (część smartmontools) autorstwa Alexandra Shaduriego
Jak SMART jest twój dysk twardy? , Wielka Brytania : pc-king.co.uk.
Jak przewidzieć awarię dysku twardego (raport SMART) , 2010-05-19z Palimpsestem (pierwotnie Red Hat)
KB251: Zrozumienie awarii i błędów SMART i SMART , Western Digital.
Jak działa SMART funkcji dysków twardych?.
Hard Drive SMART Stats , raport terenowy na dużą skalę
Specyfikacja atrybutów Seagate SMART
Normalne zachowanie atrybutu SATA SMART (Seagate)
Duży zbiór raportów SMART

Languages

In other projects