2011年版PT2録画静音サーバーのトラブル(たった4か月で)

2011年版サーバーを5月から稼働して、ずっと絶好調でした。が、何と8月末に1台のHDDが読み書きできなくなり、録画不能となりました。

故障の理由は、上記写真のピンクの円の中で矢印が指しているHDDが壊れてしまったからです。

録画用に4台の2TバイトのHDDを使っていましたが、その1台が壊れてしまうと、4台分すべてのデータがパーになります。今回は、ダイナミックディスクのストライプモードを使っていたためです。まさかHDDが故障するなど想定外でした。

しかし、自作の知識があればわかることで、初歩的なミスといえます。
以下のような条件が重なって、HDDは壊れたと考えられます。
(1)3.5インチのHDDを4台も密着して並べてしまった。HDDの温度は相当上がっています。
(2)夏で最高気温は35℃を越えました。しかも練馬。しかも昼間は冷房なし。
(3)静音サーバーなので、ケースファンがありません。マザーボード温度は、40℃台でしたが、HDD付近は温度が高くなります。
(4)24時間稼働でした。しかも、アクセスがない時HDDの電源を切るなどの節電設定を一切行っていなかった。

壊れたのは、下から2番目のHDDです。両側からはさまれ熱が一番こもっていたのでしょう。Western Digitalの2TバイトのSATA HDDで型番20EARS、商品名WD Caviar Green (3Gb/s)です。

壊れたのは、右側の一台です。HDDが故障したというより、私が非常に過酷な条件下で酷使した結果と言えるでしょう。

対策としては、以下のような手を打ちました。
(1)HDDを4台総入れ替え。今回は、SeagateのモデルBarracuda Green (5900rpm,6Gbps)、型番ST2000DL003 (2TB,64MB)です。
(2)配置を変えました。上に2台持って行き、十分な間隔を空けて設置しました。
(3)コントロールパネルの電源オプションで、以下を設定した。
「詳細設定ーハードディスクー次の時間が経過後ハードディスクの電源を切るー設定:20分」

今回もダイナミックディスクのストライプモードに設定してしまいました。

最終的には、RAID1がついたマザーボードを使う方が安全かなあと思いながら、様子見てみます。これだけ空けておけば、HDDを冷却しなくても、壊れることはないと思うのですが…

2011年09月08日 | Posted in 電脳:静音サーバー | タグ: , 7 Comments » 

関連記事

コメント7件

  • レシィ より:

    こんにちは。録画サーバーの省エネ化したくて調べていたらここに辿り着きました。

    2011年版PT2録画静音サーバーの構成を見せて頂いたのですが、
    P8H67-V REV 3.0にはRAID機能が付いているようなので、
    RAID10かRAID5辺りで構成したほうが良いと思うのですがどうでしょうか?

    http://www.asus.co.jp/Motherboards/Intel_Socket_1155/P8H67V/#specifications

  • もののけ より:

    Crystal Disk Info というツールを使えばHDDの温度を表示できます。
    50度以下になっていれば安全圏と言えるでしょうね。

  • simplelife より:

    Crystal Disk Info使ってみました。すごいですね。やはり、交換した4台のうち2台が45℃、46℃と室温が27℃なのに高いです。あちゃーです。

  • simplelife より:

    なぜかコメントがスパムに認識されていました。失礼しました。そうですね。RAIDで安全なもの使うべきですね。
    しかし、こりずにRAID0にしてしまいました。なぜかというと、HDDの温度管理がいくらか改善されたからです。
    この前ある方から教えていただいたCrystalDiskInfoというツールで、HDDの温度がわかるので、危険は避けられそうです。

  • oka より:

    はじめまして。通りすがりのコメントになりますが、
    HDD温度が45℃や46℃であったのなら半年経たずに壊れるのは「運が悪かった」としか言えませんね。。。

    「次の時間が経過後ハードディスクの電源を切る」
    設定は控えた方がいいと思います。
    電源を切る=回転を停止させるということだと思いますので、
    HDDに一番負荷がかかるスピンアップの回数が増えて短命になる可能性があります。

    ちなみにマザーのRAIDはそれほど信頼性が高いわけではないので、RAID1などで冗長性を確保するより、一週間に一度など定期的にバックアップをするのが良いのではないでしょうか。
    もちろんデータの重要性によってもかわってくるとは思いますが。

    横から分かったようなコメント失礼しました。

  • simplelife より:

    okaさん、コメントありがとうございます。

    かなり説明不足の点がありましたので、補足します。
    HDD温度は、50~60℃位になっていたために、こわれたと思います。室温が27℃の時HDDが45℃以上ですから、夏で室温が30℃を越えていた時はずっとHDDは50℃越えていたと思います。

    ディスクの電源は切らない方がいいですか?実際には、どちらがいいか確認するのは難しそうですが、電源立ち上げ回数をCrystalDiskInfoで確認すればいいのでしょうか。とりあえず設定はなしにしてみます。

  • oka より:

    こんばんは。
    50~60℃くらいになっていたのですか。
    それだとやはり故障のリスクは上がりそうですね。

    ディスクの電源についてですが、自分もあれから少し調べるなどしてみましたが、やはり切らない方がいいかと思います。
    「スピンアップ1回と使用時間1時間が等価」という説があるようで、1時間以上使用しないなら電源を切っても良いとも言えます。ただ、windows側が何かしらのアクセスを行うとそれでHDDの電源がONになってスピンアップ回数が増える可能性があります。そうすると1時間以上使用しないからと言って電源を切っても、実質1時間以内にスピンアップを行ってしまうということも考えられます。
    ここまでくるとどちらが○×とははっきりと結論を出しづらい部分ではありますが、こうやって試行錯誤するのも一つの楽しみとも言えますよね。
    あくまで一意見ですので参考になれば幸いです。

  • コメントを残す

    メールアドレスが公開されることはありません。 が付いている欄は必須項目です

    このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください