MegaRAID SATA150-6
導入 †
LSI LogicのMegaRAIDシリーズ(旧AMI)で、SATA用6ポートのカードです。
購入したのは2003年11月頃です。
http://www.lsilogic.com/products/megaraid/sata_150_6.html
特徴
・(SCSIの)MegaRAIDシリーズで培われたソフトウェア
・6ポート ← RAID5で値段的にも使いやすい
・実売5万円くらい
・オプションでバッテリバックアップあり
・オンラインボリューム拡張ができる
・SMART対応
・SNMP対応
メーカーの信頼性もあって、そこそこ良い製品だと思うのですが、なぜか個人で使っているという話をあまり聞きません。OEMとかメーカーPCに組み込まれることは良くあるようです。
個人用途だと、ベンチ性能とか、速度面が重視される傾向にあるようなので、そのせいかもしれません。私はベンチは計っていませんが、WEBで検索すると、それほど速くもないけれど、別に遅いわけでもないというような感じらしいです。というか、ベンチなんてどうでもいいです。ファイルサーバに載せて使う場合、重要なのは安定性とか、ソフトウェアの機能とかです。
あと、取り扱い店がいまいち少ないのも普及していない理由かもしれません。
個人的にはAdaptecよりは良いと思うんですけどね・・・。Adaptecには、どうもRAIDというイメージが湧いてきません(偏見?)。
ちなみに、3wareは結構好きです。実際、2枚ほど使っています。新しい会社の割にソフトウェアがしっかりしていて安心して使えます。特にwebで管理できるのが便利でいいです。障害時にメールで通知してくれる機能もあります。
以前(2003夏)は、オンラインボリューム拡張ができる使える製品がMegaRAIDくらいしかなかったのですが、3wareの9500シリーズではできるようになるという話です。
そんな理由でMegaRAIDにしたのですが、結局オンラインボリューム拡張は使っていません。
最新の3wareの方が良いと思うのですが、3wareのラインナップは4,8,12ポートになっていて、少し使いづらいです。
4ポートでRAID5にすると実質3/4の容量になってしまいますし、ホットスペアを用意する余力も残りません。8ポートだと、カードの値段が上がってしまって、7台のRAID構成は少し大きすぎる感じがします(1台分はホットスペアで計算しています)。
6ポートだと、5台でRAID5の構成に丁度良いのです。カードの値段も抑えられます。ちなみに、うちの場合、160GBx6(うち1台ホットスペア)という構成になっています。RAID5で640GBの容量です。
あと、同型カードを2枚使いたいというのも6ポートにする理由の1つです。これは、1枚壊れたときの復旧のためです。
SATA150-6の不満点
・障害時にメールで通知する機能がない。
3wareだとこの機能がついています。
もちろん、LSILogicでもボード上にアラーム機能はついているので、障害が起きても気が付かずに放置ということはありません。
・管理ツールがあまり信用できない
SCSIも含めた各種MegaRAIDで共通のツールなので、使えない機能がさも使えるかのように表示されていたりするところが嫌です。
FailedDisk?の処理の選択を間違えると論理ドライブが丸ごと壊れたりする、フールプルーフが十分で無い点など。
速度 †
250GB*6のRAID5で、Initializeにかかる時間は約25時間です。
転送速度
読み込み(HDD->LTO)で、19.8MB/sくらい。
書き込み(LTO->HDD)で、6.3MB/sくらい。
前者は多分LTO(というか、LTO2で40MB/s出るはずなので、安物のSCSIカード)がボトルネックだと思います。でも、もしかしたらRAIDカードのせいかもしれません。
後者は多分RAIDカードがボトルネックです。
ちなみに、ライトスルーモードなので、ライトキャッシュにしたら少しはましになるかも。
Tips †
定期的なConsistency Check †
PowerConsolePlus?だと手動で開始する必要がありますが、megarcを使うとコマンドラインから開始でき、タスクとしてスケジュールすることもできます。
megarc -chkonLd -a0 -Lall
で、アダプタ0の全論理ドライブのチェックが始まります。6台のRAID5で、38GB/Hourくらい。
回復可能なエラーの場合にエラー表示がされないので、Consisitency Checkが終わったらPowerConsolePlus?で確認する必要があります。
Adapter > View NVRAM Event Log
このログはmegarcでは確認できないようです(Version 1.10(12-07-2004))。
Windowsの「タスク」でスケジューリングした場合、(テキストの)ログファイルに記録が残らないようです。対応方法はあるとは思うのですが、ちゃんと実行されてるようなので放置中です。
障害時の対応手順 †
以前、FailedDisk?が出たときの対応を間違って被害を拡大させてしまいました。やっぱり手順書は必要です。
FailedDisk?が出た時の対応 †
HotSpare?無しで運用していて、Failedになった場合の対応手順です。
1.アラームを止める
アラームが鳴り響いているはずなので、PowerConsolePlus?(以下PCP)からアラームを止める。
Properties > Alarm Control > Silence Alarm
2.問題の物理ドライブを含んでいる全論理ドライブをフルバックアップする
これはオプションではなく必須項目なので省かないこと。
LTO2で600GBのバックアップに要する時間は9時間(スループットは約1GB/分)。
3.問題のHDDのシリアル番号の確認
megarcを使ってシリアル番号を確認する。
例)アダプタ0の全チャネル・ターゲットのシリアルを列挙する megarc -physdrvSerialInfo -a0 -chAll -idAll
4.電源を落とす
5.新しいHDDに交換する
抜いたHDDのシリアル番号を確認する。
Degrade中に間違ったHDDを抜くと論理ドライブが壊れるので、ホットスワップは利用しないこと。
6.電源を入れる
7.PCPで問題の物理ドライブをリビルドする
物理ドライブを選択し、単体でRebuildingする。
絶対にそのままの状態でOnlineに変えないこと。
8.リビルド終了
9.障害時にアラームが鳴るように設定を戻す
10.Consistency check
PCPからConsistency checkを行う
11.通常運用に戻す
Consistency Checkでエラーが出た場合 †
早いうちにHDDを交換します。
FailedにしてRebuildしていますが、ホットスペアなどを使った方がいいかもしれません。
1.問題の物理ドライブを含んでいる全論理ドライブをフルバックアップする
これはオプションではなく必須項目なので省かないこと。
2.エラーのあるドライブをFailed Diskにする
3.問題のHDDのシリアル番号の確認
megarcを使ってシリアル番号を確認する。
例)アダプタ0の全チャネル・ターゲットのシリアルを列挙する
megarc -physdrvSerialInfo? -a0 -chAll -idAll
4.電源を落とす
5.新しいHDDに交換する
抜いたHDDのシリアル番号を確認する。
Degrade中に間違ったHDDを抜くと論理ドライブが壊れるので、ホットスワップは利用しないこと。
6.電源を入れる
7.PCPで問題の物理ドライブをリビルドする
物理ドライブを選択し、単体でRebuildingする。
絶対にそのままの状態でOnlineに変えないこと。
8.リビルド終了
9.障害時にアラームが鳴るように設定を戻す
10.Consistency check
PCPからConsistency checkを行う
11.通常運用に戻す
ダウンロード情報 †
ここにはファイルはありません。
LSILogicのバージョンアップをチェックした際のレポートです。
最終チェック日:2007-04-18
注意事項
- 更新頻度は高くありません
- 私の環境に関係ないものは書いていません
2007-04-16 †
Windows向けドライバ更新
2k3とXP64bitは、MegaRAID SATA 300-8XLPに対応。
XP32bitはなぜか内容が異なり、細かいバク修正がリリースノートに書いてあります。
Windows Server 2003(32bit) 6.49.2.32
Windows XP(64bit) 6.49.3.64
Windows XP(32bit) 6.49.32.0
2007-03-16 †
Linuxのドライバ更新です。
うちはLinuxじゃないので関係ありませんでした。
OS:Redhat AS 3.0
Ver. 2.10.10.3
インストール時の不具合修正
insmod, rmmod時のkernel panicの修正
対応バージョンが増えた
OS:Redhat AS 4.0, SLES9, SLES10
Ver. 2.20.5.0
IA64でのkernel unaligned accessの修正
linux_3x.iniの更新
RH4.0 IA64での320-2xのmegaraidアプリの問題を修正
対応バージョンが増えた(SLES10等)
2006-10-16 †
- Sco OSR Unix 5.x ドライバ 2.26
2006-08-30 †
- Windows2000ドライバ 5.49
- WindowsServer2003 ドライバ(32bit) 6.45.2.32
- WindowsServer2003 ドライバ(64bit) 6.46.3.64
リリースノートに変更点が書かれていないので、何が変わったか分かりません。
- PowerConsolePlus? 5.00n-4
インストーラの表示だけ変わりました。中身に変更はありません。
2006-06-26 †
Firmware 713R 26-Jun-2006
今回は、不具合修正がメインです。
異常系での不具合(トドメをさしてくれそう)や、高負荷での不具合が多いです。しかも、データ破損、コントローラハング、ブルースクリーン、OSクラッシュ等の致命的なものばかりです。
ほぼ必須のアップデートと言えます。
詳しくはリリースノートを読んでください。
でも、今回の内容は良く分かりません。PRとか、NUM_TIMER_REQS_EXHAUSTEDとか、local commandとか、何のことでしょう。
2005-09-25 †
Driver(2003) 6.45.3.32 28-Apr-2005
PowerConsolePlus? 5.00N 23-Aug-2005
PCPは、SNMPまわりがAMIのままだったバグの修正。
ドライバは、マイクロソフト認定になりました。
今回はアップデートはパス。
2004-12-27 †
(ブログから移動しました)
LSILogic の MegaRAIDのソフトがアップデートされていました。
SATA 150-6関連だと、
Firmware FW_713N 13-Dec-2004
Driver(2003) 6.43.2.32 15-Dec-2004
PowerConsolePlus? 5.00L 13-Dec-2004
MegaRC Windows 1.10 15-Dec-2004
といった感じです。
ファームは、細かいバグフィックスと、デフォルト値の変更。
ドライバは、新デバイス対応と、細かいバグフィックスと、W2K,W2K3の統合。
PCPは、リリースノートが無いので未確認。
MegaRCは、今回がファーストリリースで、コマンドラインベースの管理ツールっぽいです。
HDD †
Maxtor 6V250F0 †
DiamondMax10シリーズ。SATAII 3GのHDDです。
どうも相性が悪いみたいです。使用していると、
port 0 Target 3 Lun 0 Code 0x22 Category: Physical Device Error Event
というエラーメッセージが出て、HDDが全く反応を返さなくなります。
このHDDには、1.5Gにするジャンパ(速度以外に副作用があるかどうかは知りません)があるのですが、これを切り替えても同じでした。
必ずしも症状が出るわけではないようですが、今のところ5台中2台で問題が出ています。
ちなみに、6L250S0と7L250S0は問題なく動いています。ただし、両方ともSATAII 3Gではありません。
参考:
Linux RAID(だと思う)のMLにも同様の不具合が上がっています。
http://www.spinics.net/lists/raid/msg12931.html
ファームアップデート:
リムーバブルケース(MB455)経由だと特にエラーが多発します。HDDのファームが新しいと大丈夫っぽいです。VA111900で3ヵ月以上動かしていますが、今のところ問題はありません。(2006/12)
やっぱりダメです。エラーの頻度は低くなりましたが、
7ヶ月間で3台中2台(2回)エラーが出ました。(2007/4)
6V250F0はこのRAIDカードでは使わない方がいいです。
HDT722525DLA380 †
HGSTのDeskstar T7K250です。SATAII 3G対応です。
250GBですが、6V250F0よりも容量が少ないのでMaxtorと一緒に使うときは要注意です。これは238470MBですが、Maxtorは239368MBです。
HGSTでは設定はツール(HGSTのFeatureTool?)で行います。
コメント †
- hirano 2006-02-18 (土) 16:39:29
SiliconImage?のチップが3個も。曲線のパターンがいい感じです。
基板の写真しか見てません。 - vvp 2006-02-18 (土) 18:13:16
最近の信号は速いですからねぇ。
というか、基板だけかよ。 - とろいすがり 2007-12-13 (木) 14:16:53
MaxtorのSATAディスクって死ねますよね。さんざん苦労しましたよ。
Counter: 3080, today: 2, yesterday: 0