2018年9月6日に北海道を襲った震災により、停電状態に陥ったさくらインターネットの石狩データセンターに対し、9月8日ようやく電力供給が再開された。想定を超えた約60時間を非常用電源設備で乗り切り、インフラ事業者としての矜持を見せた石狩データセンターの「奇跡」について、改めてきちんと説明していきたいと思う。
卓越したオペレーション能力で「想定外」を「想定内」に
2011年11月に開設された石狩データセンターは、数多くのサーバーを収容するさくらインターネットの基幹データセンターになる。開設当時はソーシャルゲームの普及でサーバーの需要がうなぎ登りだったほか、環境に配慮したエコなデータセンターが求められていた。こうしたニーズに対応する石狩データセンターは、寒冷地のメリットを活かした外気冷却と東京ドーム1個分に相当する広大な敷地を用いたスケーラビリティが大きな売りだった。私も開設時と増設時で2回ほど現地に足を運んでおり、現地のエンジニアとも話をしている。同じデータセンターに2度訪れることなんてほぼないので、個人的にも思い入れが深い。
思い起こせば、なぜ石狩だったのか? 皮肉なことにその大きな一因は災害リスクが低いことであった。同社の石狩データセンターの紹介にも「石狩地域は、今後30年間で震度6以上の地震が発生する確率が0.1~3%と低く、(以下略)」と明記されており、さくらインターネットにとっても今回の地震は「想定外」だったはずだ。しかし、今回さくらは約3000ラックを超える巨大データセンターを非常用電源設備で60時間無停止で運用し続けた。卓越したオペレーション能力で未曾有の停電を乗り切り、「想定外」を「想定内」にしてしまったのだ。
東日本大震災のときは首都圏のデータセンターが停電の影響をあまり受けてないので、ここまで長時間での非常用電源設備の運用はおそらく初めて。世界的に見てもあまり例を見ないはずだ。しかも、途中で電力が一部復活し、燃料調達にめどが付いたこともあり、非常用電源設備停止の直前は、1週間近い連続稼働まで視野に入れていた。薄氷を踏むどころか、最後は余力すらあったわけだ。
さくらにとって絶対落とせなかった石狩データセンター
まずは話の前提としてデータセンターの停電対策について簡単に説明しておきたい。実は9月6日に北海道の震災が発生してから、石狩データセンターに関しては経緯から復旧まで3本の記事を挙げているのだが、どれもシンプルな速報体裁。細かい説明を割愛していたため、書き手としてもどれだけ読者に伝わっているか正直不安だった。しかも、ITに対する知識の不足により、いたずらに不安をあおるような報道も多い。これを読めば、今回さくらがどれだけすごかったのか、信頼性というデータセンターの役割をきちんと果したのか、少しは理解してもらえるはずだ。
個人・企業問わず数多くのサーバーが集まるデータセンターでは、停電時の対策として非常用電源設備が用意されている。そのため、電力会社からの電力供給が停止すると、バックアップ用のUPSで非常電源設備の起動までの時間を確保し、ガスや重油などの燃料を用いて自家発電するようになっている。発電の際に用いられる燃料も多くのデータセンターでは48時間程度の燃料が備蓄されているので、停電が起こってもおおむね2日間は運用は止まらない。とはいえ、一連の設備はどれも高価で、日本でも自前できちんと運用できる事業者はそれほど多くない。さくらインターネットはこうした数少ない事業者のうちの1つだ。
石狩データセンターでも48時間稼働する分の重油を備蓄していた。しかし、今回の大規模な停電からの復旧は当初「1週間後」と発表されており、実際に東日本大震災のときは停電解消が約80%に至るまで3日間、94%に至るまで8日間かかっている。そのため、電力供給が再開せず、重油が足りなくなったら、石狩データセンター自体の稼働を停止しなければならなかった。
もし石狩データセンターが停止に追い込まれたら、そのインパクトは計り知れない。40万以上にも上るさくらのレンタルサーバのユーザーや、メルカリやマネーフォワードといったWebサービス事業者、官公庁や学術機関などのサービスも大きな影響を受けることになる。また、石狩データセンターならではの事情として、ユーザー自身が運用するコロケーションもそれなりにある。さくらインターネットにとっては絶対落とせないデータセンターなのだ。
さくらが偉いんじゃなくて、非発の設置・維持・管理業者が偉いの。さくら関係ない。
その自家発を導入したのはさくらだよ
世間知らずだわ
今時の先端データセンターならそんな設備は当たり前
今は都内からも首都圏周辺に移動新設して免震で震度7クラスでも耐えるセンターは当たり前
非常用発電も72時間 燃料補給も最優先調達のルート確保済み
非常用食料と飲料は一週間以上の備えもあるよ
>>1
同じデータセンターに2度訪れることなんてほぼないので、個人的にも思い入れが深い。
は?現場にも出たことない机上の理論野郎が!現場をバカにしたい記事か?
これだけのガチンコ本番をベアメタル少し止めた程度で乗り切ったのは普通に凄い
うむ
SEと呼ぶな。IT奴隷様と呼べ。
燃料確保頑張ったね
これでいい?
その通り
燃料の行先は病院、避難所(小中学校)、市町村の庁舎などが最優先
放送通信と言えども企業なので、これらの次になる
48時間分は常時蓄えてたとして、プラス12時間分の補給できたことは評価すべき
上は「それができて当たり前」になるからなあ
随時メールをくれていたので安心できた
外部アクセスはほぼ無かったから大した電気消費量にならなかったとかそんなオチか
当たり前の話だよ。逆にきっちり保守管理してないところは肝心な時に非常用電源
が役に立たたず損失こうむってるところがたくさんあるよ。
この業界ではきっちり保守管理できるだけのリソースが適切に注ぎ込まれていることが奇跡なんですよ…
それは言えてる
サーバー半分なら、単純に考えて消費電力も半分。
48時間の2倍の96時間乗り切れるだろう。
そういう観点からすると奇跡と言えなくはないかもしれない。
メンテは当然されていたんだろうけど。
>>68
らしいね。(笑)
UPSの意味ないだろ。
そうだよな。なんでこんな美談になる?
金もらってんのか。
うちはここ使ってるがデータバックアップ先のみの用途でサーバはない
サーバは別のDCで稼働
遠隔地にサーバ機能まで冗長化するのはとんでもなく高コストだろう
データは常時同期しないといけないし
ディザスタリカバリできるようにしろとは思う
「ユーザー自ら」ってかけよ
いちおうさくらが用意してほしいけどだめか?
AWSのリージョン相当のユーザー操作は必要ってことで
引用元
http://anago.2ch.sc/test/read.cgi/bizplus/1536573713/
管理人からひと言
この記事へのコメントはありません。