Amazonプライムデーのシステム障害、自動スケーリングが動作しなかったのが原因? 20
ストーリー by hylom
本業の部分でトラブルとは 部門より
本業の部分でトラブルとは 部門より
7月16日から17日かけて世界各国で行われたAmazonの期間限定セール「プライムデー」では、開始直後に各国のAmazonのサイトにアクセスしにくくなる障害が発生した(過去記事)。このトラブルについてAmazonが内部的にまとめたドキュメントが流出したようだ(CNBC、CNET、Slashdot)。
この文書を入手したというCNBCによると、今回のトラブルはアクセスの増加に応じてサーバーをリアルタイムに増やす機構が適切に動作しなかったために発生したのではないかという。そのため、管理者は手動でサーバーを増やす作業を実行しなければならなかったという。
また、この影響でAmazonのほかのサービスにも一時的に問題が発生していたようだ。ただ、このトラブルによるセールへの影響は少なく、多くの販売者はセールの売上に満足しているという。
本件の要点は「流出」 (スコア:2, すばらしい洞察)
先日のプライムデーで発生した障害の内容そのものに関しては前回のスラド記事にて触れられるべきもので、本件の要点は
アマゾンが障害内容を公表したのではなく誰かが内部文書をCNBCに「流出」させた、という事ではないでしょうか
AWS等のインフラを提供しているアマゾンとしては失態を隠蔽したかったのかも知れませんが、
素直に公表しなかったことで募る不信感は小さくないのではないか、と感じます。
https:///..orgのコメントより (スコア:2)
https://tech.slashdot.org/comments.pl?sid=12390104&cid=56998942 [slashdot.org]
The entire point of "prime day", which actually started many years ago with a massive sale selling XBox consoles for $100/ea, is to test out their infrastructure. They can test using simulated connections, but that only goes so far. They need to be able to test AWS with massive demand on unpredictable pages, and have the system scale appropriately. What better way to do this than to shove a few "sales" at a bunch of products, and then contact literally every media outlet in the country to promote it. Seriously, name a local news channel NOT hyping the prime day event. This is simply Amazon creating quite possibly the worlds largest single day beta test of new infrastructure code, and done annually. The big difference this year is that something didn't work right, so engineers were right on the spot to scale things up manually by hand.
なるほどなー。
Re:https:///..orgのコメントより (スコア:2)
確かにプライムデーはシステムの負荷テストには打って付けですね
AWSがダウンしたら損害賠償などで確実にamazonに損害が出ますが
今回の障害はさほど実害もなく,むしろサイトが重くなっているという宣伝効果さえあったように思います.
amazonとしては新しいシステムのテストだけでなく,負荷対策のノウハウも蓄積できて
むしろプラスになったということでしょうか.
Re: (スコア:0)
とはいえ主力商品の1つが機能しなかったってのは痛い
ショップサイトのアマゾンにとっては宣伝になったかもしれませんが
本体のAWSのほうのダメージが大きい
手動でサーバーを増やす作業 (スコア:1)
実機のスイッチON、それともVM上げるとか?
Re: (スコア:0)
Amazonでサーバー機をぽちっとなしてカートに入れる作業
Re:手動でサーバーを増やす作業 (スコア:2)
ぽちっとしたらわんこがでてきた
以下、無限ループ
Re:手動でサーバーを増やす作業 (スコア:1)
>ぽちっとしたらわんこがでてきた
あれ、姑息だよね。
ほっこりしてしまって、何度も連打してしまう罠。
Re: (スコア:0)
犬はユーザーの批判から会社を守る盾となってくれます。
-- 禿
Re:手動でサーバーを増やす作業 (スコア:1)
CMの犬猫率ってどれくらいの割合なんだろう。
イノセントさの象徴なんだとしたら子供と赤ちゃんもかな。
Re: (スコア:0)
カスタマーサポートの写真を猫にすると攻撃的な言動が減るという実験があったようでして。
https://gigazine.net/news/20180219-photo-messaging-with-customers/ [gigazine.net]
#性的嫌がらせの投稿は、男性にはほぼ皆無なのに猫画像の場合にはあるようですが。
買うものなかったな (スコア:0)
> 多くの販売者はセールの売上に満足しているという
amazon利用者の満足度はどうだったんだろう
Re:買うものなかったな (スコア:2)
それこそ売上が物語っているのではないですか。
Re: (スコア:0)
セールって単語に踊らされて思わず買って後悔。
Re: (スコア:0)
そんなあなたに Keepa [keepa.com] がお勧め
これのプラグインを入れてAmazonにアクセスすれば、目当ての商品が買い時かどうかグラフで一目瞭然
Re: (スコア:0)
とりあえずカートに入れるのに何度も失敗して、イライラしました。
その間に冷静になって、購入した商品の半分はキャンセルしました。
ファーストサーバーとの違い (スコア:0)
amazonのトラブルでは叩く声が少ないのな。
オートスケールが失敗して手動で対応してたっていうクラウドサービス上のトホホなトラブルなのにね。
Re: (スコア:0)
Re: (スコア:0)
それは程度の差っていうものですよね。
Re: (スコア:0)
つまりは程度の差が叩く声の大きさに影響するってことですね。