パスワードを忘れた? アカウント作成
13658571 story
バグ

Amazonプライムデーのシステム障害、自動スケーリングが動作しなかったのが原因? 20

ストーリー by hylom
本業の部分でトラブルとは 部門より

7月16日から17日かけて世界各国で行われたAmazonの期間限定セール「プライムデー」では、開始直後に各国のAmazonのサイトにアクセスしにくくなる障害が発生した(過去記事)。このトラブルについてAmazonが内部的にまとめたドキュメントが流出したようだ(CNBCCNETSlashdot)。

この文書を入手したというCNBCによると、今回のトラブルはアクセスの増加に応じてサーバーをリアルタイムに増やす機構が適切に動作しなかったために発生したのではないかという。そのため、管理者は手動でサーバーを増やす作業を実行しなければならなかったという。

また、この影響でAmazonのほかのサービスにも一時的に問題が発生していたようだ。ただ、このトラブルによるセールへの影響は少なく、多くの販売者はセールの売上に満足しているという。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 本件の要点は「流出」 (スコア:2, すばらしい洞察)

    by Anonymous Coward on 2018年07月26日 16時54分 (#3449820)

    先日のプライムデーで発生した障害の内容そのものに関しては前回のスラド記事にて触れられるべきもので、本件の要点は
    アマゾンが障害内容を公表したのではなく誰かが内部文書をCNBCに「流出」させた、という事ではないでしょうか

    AWS等のインフラを提供しているアマゾンとしては失態を隠蔽したかったのかも知れませんが、
    素直に公表しなかったことで募る不信感は小さくないのではないか、と感じます。

  • https://tech.slashdot.org/comments.pl?sid=12390104&cid=56998942 [slashdot.org]

    The entire point of "prime day", which actually started many years ago with a massive sale selling XBox consoles for $100/ea, is to test out their infrastructure. They can test using simulated connections, but that only goes so far. They need to be able to test AWS with massive demand on unpredictable pages, and have the system scale appropriately. What better way to do this than to shove a few "sales" at a bunch of products, and then contact literally every media outlet in the country to promote it. Seriously, name a local news channel NOT hyping the prime day event. This is simply Amazon creating quite possibly the worlds largest single day beta test of new infrastructure code, and done annually. The big difference this year is that something didn't work right, so engineers were right on the spot to scale things up manually by hand.

    なるほどなー。

    • 確かにプライムデーはシステムの負荷テストには打って付けですね

      AWSがダウンしたら損害賠償などで確実にamazonに損害が出ますが
      今回の障害はさほど実害もなく,むしろサイトが重くなっているという宣伝効果さえあったように思います.

      amazonとしては新しいシステムのテストだけでなく,負荷対策のノウハウも蓄積できて
      むしろプラスになったということでしょうか.

      親コメント
      • by Anonymous Coward

        とはいえ主力商品の1つが機能しなかったってのは痛い
        ショップサイトのアマゾンにとっては宣伝になったかもしれませんが
        本体のAWSのほうのダメージが大きい

  • 実機のスイッチON、それともVM上げるとか?

  • by Anonymous Coward on 2018年07月26日 16時41分 (#3449814)

    > 多くの販売者はセールの売上に満足しているという
    amazon利用者の満足度はどうだったんだろう

    • by yhachisu (47108) on 2018年07月26日 17時05分 (#3449827)

      それこそ売上が物語っているのではないですか。

      親コメント
      • by Anonymous Coward

        セールって単語に踊らされて思わず買って後悔。

        • by Anonymous Coward

          そんなあなたに Keepa [keepa.com] がお勧め
          これのプラグインを入れてAmazonにアクセスすれば、目当ての商品が買い時かどうかグラフで一目瞭然

    • by Anonymous Coward

      とりあえずカートに入れるのに何度も失敗して、イライラしました。
      その間に冷静になって、購入した商品の半分はキャンセルしました。

  • by Anonymous Coward on 2018年07月27日 8時18分 (#3450184)

    amazonのトラブルでは叩く声が少ないのな。
    オートスケールが失敗して手動で対応してたっていうクラウドサービス上のトホホなトラブルなのにね。

    • by Anonymous Coward
      amazonは数日に渡ってアクセスできませんでしたか?
      • by Anonymous Coward

        それは程度の差っていうものですよね。

        • by Anonymous Coward

          つまりは程度の差が叩く声の大きさに影響するってことですね。

typodupeerror

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

読み込み中...