Przypadek z życia wzięty, w sumie relacjonowany prawie na żywo. A dlaczego o tym piszę – na końcu.
Każdy dysk twardy od wielu lat posiada tzw Self-Monitoring, Analysis, and Reporting Technology, w skrócie S.M.A.R.T, czyli zestaw funkcji monitorujących i raportujących jego stan. Stąd wiemy ile godzin dysk przepracował, ile upadków przeżył, znamy stan fizyczny (badsectory itd).
Moja przygoda zaczęła się tu pół roku temu. Posiadam domowy serwer plików, www i nie tylko (do niedawna serwował choćby kitor.pl). Oparty o płytę główną ITX, małą płaską obudowę i dwa dyski SATA. Problem polegał na tym że urządzenie stało w pionie na podłodze, blisko szafy – ale praktycznie w przejściu. I w końcu stało się, pod moją nieobecność ktoś przyhaczył o kable nogą i komputer zwyczajnie się przewrócił. Włączony.
O zajściu dowiedziałem się dwa dni później – oczywiście sprzęt cały czas pracuje. Szybki wgląd w SMART nie pozostawił złudzeń – dwa sektory realokowane, „G-Sensor rate” = 1 (czujnik przeciążeń), natomiast wszystko chodziło, a łącząc brak wolnego dysku na przekopiowanie danych z faktem że po dwóch dniach nic nie „sypało” się dalej, oraz to ile dysków ratowałem już po badsectorach logicznych, stwierdziłem że to najwyraźniej błąd zapisu i kiedyś się tym zajmę…
Oj, jak bardzo się myliłem. Ten dzień nadszedł dzisiaj. SMART wciąż wskazywał to samo, przed wyłączeniem serwera (oczywiście nie pierwszym w ciągu tego okresu czasu). W trakcie przenoszenia danych zaczęły się schodki – na szczęście na plikach które były mało ważne – ale kopiowanie wysypało się kilkukrotnie. System wstał z nowego dysku, więc przyszedł czas na typowe zerowanie w MHDD – po czym zwykle wyparowywały badsectory logiczne.
Dwie i pół godziny nadpisywania później zaglądam ponownie w parametry SMART… i co widzę? 40 sektorów realokowanych, kolejne kilkadziesiąt w kolejce. Skan powierzchni nie pozostawił złudzeń – w regularnych odstępach problemy z odczytem sektorów.
Mam farta, ogromnego. Na tym dysku była kopia danych (a podwójnego backupu nie stosowałem). Natomiast, niemal zgubiło mnie przeświadczenie że znam temat, wraz z zaufaniem do systemu SMART. Owszem, przypadek że przez pół roku nie doszło do natrafienia na uszkodzone dane (dlatego nie zaraportował tego system) jest jedną stroną medalu, drugą jest to że mogłem się bardzo łatwo pozbawić efektów wielu miesięcy prac.
A więc teraz, „co mi do tego, nie mam serwera/mam serwer ale w normalnym miejscu – po co mi zaśmiecasz umysł takimi bzdetami?”.
Sprawa bardzo prosta – w ciągu ostatniego roku tyle widziałem upadających laptopów że nie jestem w stanie tego podliczyć. A były to znacznie większe wysokości niż zwykłe przewrócenie się dwudziestokilku centymetrowego pudełka. Oczywiście nikt nie przejmował się tym – a znakomitą większością byli to studenci informatyki. A później będzie płacz jak coś się stanie.
A proste wykonanie pełnego skanu powierzchni – czy to z pomocą HDTune, czy MHDD, czy dowolnego innego narzędzia – co prawda zajmie nam kilka godzin z życia, ale ile może zaoszczędzić przed zmarnowaniem – tego nie da się ocenić.
Komentarze