【クラウド障害】AWSが11月の大規模障害について説明

管理人からひと言

僕は影響なかったです(使ってない)

引用元

https://anago.2ch.sc/test/read.cgi/bizplus/1606799137/

1: へっぽこ立て子@エリオット ★ 2020/12/01(火) 14:05:37.86 ID:CAP_USER

 Amazon Web Services(AWS)は、米国時間11月25日に発生した大規模障害についての説明を公開した。この障害では、何千ものサードパーティーのオンラインサービスが数時間にわたって影響を受けた。
□AWSで障害–多数のサービスに影響 – ZDNet Japan
https://japan.zdnet.com/article/35162958/

数十におよぶAWSのサービスも影響を受けたが、同社によれば、障害が発生したのはバージニア北部のUS-EAST-1リージョンだけだった。同社によれば、ことが起こったのはKinesisサーバーのフロントエンドフリートに「小規模な容量の追加」を行った後だったという。

Kinesisはデータや動画のストリームをキャプチャーし、AWSの機械学習プラットフォームで処理するサービスであり、顧客にも使用されているが、「CloudWatch」や認証サービスの「Cognito」などをはじめとするAWSの他サービスでも使用されている。

Kinesisサービスのフロントエンドでは認証やスロットリングの処理を行っているほか、「シャーディング」と呼ばれるデータベースのメカニズムを介してワークロードをバックエンドの実働クラスターに分散している。

AWSが長々とした障害対応経緯のまとめで説明しているように、容量の追加は障害発生のきっかけではあったが、根本的な原因ではなかった。原因は、容量の追加作業が午前2時44分(太平洋標準時〈PST〉)から約1時間かけて行われた後、Kinesisのフロントエンドフリートに属する全てのサーバーで、スレッド数が現在のOSの設定で許容されている最大値を超過し始めたことだった。
□Summary of the Amazon Kinesis Event in the Northern Virginia (US-EAST-1) Region(英文)
https://aws.amazon.com/message/11201/

最初のアラームが発生したのは午前5時15分(PST)で、問題の解決までには約5時間かかった。Kinesisが完全に復旧したのは午後10時23分(PST)だった。

Amazonは、Kinesisのフロントエンドサーバーがバックエンドにデータを分散させる方法について、「フロントエンドの各サーバーは、バックエンドクラスターのメンバーシップの詳細やシャードの所有権を含む情報のキャッシュを保持しており、このキャッシュはシャードマップと呼ばれている」と説明している。

AWSによれば、この情報はメンバーシップ情報や「DynamoDB」からの設定情報の取得、他のKinesisフロントエンドサーバーからのメッセージの継続的な処理を行うマイクロサービスを呼び出すことで取得されている。

問題は、スレッド数がOSの設定を超えたことが原因で、フロンドエンドサーバーのシャードマップが使い物にならなくなり、リクエストをKinesisのバックエンドクラスターにルーティングすることができなくなってしまったことだったという。AWSは障害のきっかけとなった追加された容量を取り外したが、障害対応中は復旧に遅れが生じることを恐れてスレッドの上限値を上げるのを避けたと説明している。

AWSは「今回の事態がお客さまに与えた影響についてお詫びしたい」と述べている。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
https://www.zdnet.com/article/amazon-heres-what-caused-major-aws-outage-last-week-apologies/

2020-12-01 12:55
ZDNet Japan
https://japan.zdnet.com/article/35163174/

2: 名刺は切らしておりまして 2020/12/01(火) 14:22:56.87 ID:FEePJnre
で、誰のクビが飛ぶの?

 

10: 名刺は切らしておりまして 2020/12/01(火) 16:56:48.56 ID:9lzT0d2O
>>2
ユーザー

 

3: 名刺は切らしておりまして 2020/12/01(火) 14:26:08.08 ID:QQSaGxfg
>>2
日本とは違う
アメリカはこの程度では飛ばさないよ

 

6: 名刺は切らしておりまして 2020/12/01(火) 14:41:35.12 ID:8oJzjh9s
>>2
責任もクラウドの向こう側

 

4: 名刺は切らしておりまして 2020/12/01(火) 14:27:26.66 ID:1BVQje80
クラウドはバックアップに使え。
実データは自分の手元に置いとけ。

 

9: 名刺は切らしておりまして 2020/12/01(火) 16:19:53.31 ID:qC8UVPlg
これって補償無いんだよな

 

11: 名刺は切らしておりまして 2020/12/01(火) 17:17:42.54 ID:wS0iz7dA
>>9
何年か前にあった大規模障害でデータ全損失食らったけど、ゴメンの一言すらなかったよ
バックアップ取ってなかったら死んでたわ

 

15: 名刺は切らしておりまして 2020/12/02(水) 10:50:21.79 ID:AC+X6EX7
>>9
オンプレでも補償しないでしょ?

 

13: 名刺は切らしておりまして 2020/12/01(火) 17:29:55.78 ID:4k+jrsaM
だからグーグルにしとけと

引用元

管理人からひと言

関連記事

  1. アマゾン「お急がない便」ならポイント還元 物流対策か

  2. amazon

    【悲報】Amazonで不正利用相次ぐ 二段階認証も突破された模様

  3. 【小売】アマゾンが書籍「買い切り」書店が本を値下げへ

  4. 【プレゼン】 なぜアマゾンは社内プレゼンで「パワポ」の使用を禁止しているのか

  5. 【EC】Amazonの5つ星レビューには販売業者がお金を払って書かせたものが存在する

  6. 【AI】アマゾン、AIスピーカーのアプリ開発に報奨金

  7. 【通販】Amazon、2024年にネットで新車販売 米で現代自動車と

  8. 【アマゾン】Amazonプライム会員にギフト券だけで登録可能に→「登録できない、詐欺だ!」トラブル続…

  9. 【EC】アマゾン、通販全商品に1%以上のポイント

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

最近の人気記事

おすすめ記事

  1. カテゴリ_news

新着記事

  1. 柏市で全国初のチャット窓口開設 AIだから気軽に相談を 「助けて」と声に出せない…
  2. テレワークで残業100時間して精神疾患。労災認定へ
  3. 【IT】クレジットカード不正利用防止 本人確認の導入働きかけ強化へ
  4. 【IT】Apple、レトロゲーム機のエミュレータアプリにApp Storeを開放…
  5. Windowsに「デフォルトのブラウザをMicrosoft Edgeから変更でき…

ボンブの戯言

  1. 【ボンブの戯言】ITエンジニアがフリーランスになるときに考える・準備すること
  2. 【ボンブの戯言】フリーランスが払う税金など6選!私たちはこんなに支払っている!
  3. 【ボンブの戯言】ITエンジニアは、なぜうつ病になるのか
  4. 【ボンブの戯言】フリーランスのメリットを全否定してみた
  5. 【ボンブの戯言】はじめました。
PAGE TOP