安物のUSBメモリはダメですね。特に頻繁にRWが繰り返される作業にはリスクが大きすぎる。
これまでの経緯
前回の記事の続きです。
友人の代理で構築しているマイニングリグもこんな感じで本格的になってきました。
GPUなどの初期投資を回収できると思えないのですが、まぁ数日したら友人宅に旅立つので気にしない。
・・・と思っていた矢先です。
HiveOSの動作が止まった!
流石に焦りました。
友人に手渡す前に稼働確認を行っている一環で、2日ほどの稼働検証を行っていた時です。
25時間くらいは問題なく動いていたのですが、26時間目くらいから
Web画面でHiveOSがオフラインの状態となってしまった。
ただ、HiveOS上で動作しているマイニングアプリ自体は正常に稼働しているようでして、プールのカウントアップはされている。電源も2台正常に連動して稼働されている。
HiveOSのプロセス(Daemon)に障害が発生したのかな?
という安直な気持ちで一旦再起動したところ・・・
全く起動しなくなりました
マザーボードのBIOS画面が表示され、その後にブラックアウトです。この時点では原因不明だったのでマジで焦りました。とりあえず、以下の切り分けを実施。
- 電源の確認:OK
- 全てのGPUを外して稼働:同様にBIOSの画面までは出る
- USBメモリのランプをチェック:BIOSの後にデータを読み込んでいる形跡がない
この時点でUSBメモリの破損の可能性が高いと判断。別のWindows端末にUSBメモリを挿入して書き込みチェックをしたところ、不良セクターが続出・・・
ちなみに、使用していたUSBメモリはこちらです。
結局は別のUSBメモリで再度HiveOSを焼き直したところ、全く問題なくブートしました。更に、以前のUSBメモリよりも起動が数倍早くなり、Wi-Fiドライバのインストールも数倍早くなりました。
はじめからUSBメモリが壊れてた疑惑があるな
では、なぜマイニングアプリのプロセスは動いていたかですが、恐らく一旦HiveOSが起動さえすれば主要なプロセスはメモリ上で稼働するからだと推測します。マイニングアプリはメモリ上で動いていたのでUSBメモリが不良であっても影響がなかったと。HiveOSのプロセスは一定の間隔でUSBメモリ(Diskストレージ)にアクセスをして何らかの書き込みをしており、そのタイミングで書き込みができなかったのでプロセスが停止したのでは。まぁもう全てが推測の範囲ですけどね。
まとめ
HiveOSはUSBメモリから簡単に起動・運用できるので便利だが、USBメモリそのものの堅牢性にシステムが依存してしまう。
USBメモリはできるだけ安定した製品を購入すべきだし、可能であればSSDなどのポータブル目的じゃない周辺機器を使ったほうが良いと思います。
コメント