またまたサーバーのHDD不調になった…

うーむ、学校休んでゆっくりしてたらこれだよ・・・

どうもファイルサーバーの調子が悪いなぁと思ってたら
割り込みのログでファイルシステムにエラーが起きているとのログが・・・
/var/log/messageを調べてみると、
どうやらHDDのS.M.A.R.Tが原因でエラーが多発しているようだ

ということでS.M.A.R.Tの情報を調べるコマンドをggってみると

smartctlというコマンドに行き着いた

参考元:smartctlの出力についてまとめてみた – BitWalker

ということで早速実行してみる。

# smartctl -l error /dev/sda

こんな具合に4台あるHDDを順番にみてみると
1台だけエラーはいてるやつがいた・・・

コマンドの結果を保存しておくのを忘れたため
代わりにCrystal Disk Infoの画面で
結果を見てみると

どうやら「代替処理保留中のセクタ数」と「回復不可能セクタ数」の値が急上昇しているせいだったみたい

この間壊れたHDDと一緒に買ったやつだったんだけど
このロット不良になりやすいのが多かったのかな…?

というわけであまり扱いになってたやつで
リビルドなう><

午後2時くらいから始めてようやく27%だからまだまだ時間かかるなぁ…

そして、とりあえず取り外したけど
まだ完全に壊れてるわけじゃないからたぶん交換もできないし。。。
かといってすぐ壊れそうなHDDにデータ入れておく訳にもいかないし。。
使用時間まだ3000時間も行ってないのに
どうしてくれようか・・・><