Home 世界新聞 亞馬遜揭示了 AWS 宕機的原因,導致從銀行到智能床的所有設備都離線了亞馬遜

亞馬遜揭示了 AWS 宕機的原因,導致從銀行到智能床的所有設備都離線了亞馬遜

59
0

亞馬遜透露,本週AWS長達數小時的宕機導致從Signal到智能床的所有設備都離線,原因是自動化軟件中的一個錯誤,該錯誤造成了廣泛的後果。

長篇概述 關於週四發布的中斷原因,AWS 透露了一系列級聯事件,導致該公司託管服務的數千個站點和應用程序癱瘓。

AWS 表示,由於“該服務的自動 DNS(域名系統)管理系統存在隱藏缺陷”,其客戶無法連接到 AWS 客戶存儲數據的數據庫系統 DynamoDB。

DynamoDB 管理數十萬條 DNS 記錄。它使用自動化來監控系統,以確保頻繁更新記錄,以確保根據需要添加額外容量、管理硬件故障並有效分配流量。

AWS 表示,問題的根本原因是位於弗吉尼亞州的 US-East-1 數據中心區域的 DNS 記錄為空。該錯誤無法自動修復,需要操作員手動干預才能糾正。

AWS 表示,它已在全球範圍內禁用 DynamoDB DNS 調度程序和 DNS Actor 自動化,同時修復導致中斷的情況並增加額外的保護。

該問題還導致其他 AWS 工具中斷。

根據監控互聯網中斷的網站 DownDetector 的數據,Signal、Snapchat、Roblox、Duolingo 等平台以及銀行網站和門鈴公司 Ring 等服務都屬於受此次中斷影響的 2,000 家公司之列,該網站收到了來自全球用戶的超過 810 萬份問題報告。

儘管服務在幾小時內就恢復了,但停電的影響還是廣泛存在。

的客戶 八睡 – 一家連接互聯網來控制床的溫度和傾斜度的智能床公司 – 發現在停電期間無法調整床或床的溫度,因為它無法在手機應用程序中連接到床。

該公司總經理 Matteo Franceschetti 向公司道歉 客戶在 本週推出了一項服務更新,允許用戶在發生斷電時通過藍牙控制關鍵的床功能。

墨爾本大學計算機科學和信息系統教授 Suelette Dreyfus 博士表示,這次中斷表明世界對互聯網單點故障的依賴程度。

“這一點不僅僅與 AWS 相關——它是最大的雲提供商,擁有約 30% 的市場份額——而且與整個雲相關,本質上只有三家公司,”她說。

“互聯網被設計為具有彈性;存在許多其他渠道來解決問題或攻擊,但由於我們過於依賴少數幾家大型科技公司不僅提供數據存儲,還提供數據服務託管,因此失去了一些彈性。”

來源連結