سرویسهای وب آمازون (AWS)، پلتفرم محاسبات ابری که بخش زیادی از اینترنت را قدرت میدهد، چند ساعت در روز دوشنبه خاموش شد و چندین وبسایت و برنامه مهم را غیرقابل استفاده کرد.
از خدمات بانکی گرفته تا شبکههای اجتماعی، سایتهای رزرو هواپیما و خرید آنلاین، هزاران سرویس مختل شدند و میلیونها نفر در سراسر جهان — بسیاری در راه کار در آمریکا شرقی — نتوانستند قهوه سفارش دهند یا به برنامههای کلیدی دسترسی پیدا کنند.
آخرین قطعی به عنوان یادآوری است که چگونه ستون فقرات اینترنت میتواند شکننده باشد، حتی اگر اختلال کوتاه باشد، و چقدر جهان به این خدمات آنلاین وابسته شده است.

اگرچه AWS و رقبای آن عموماً مقاوم هستند، اما اینترنت یک شبکه پیچیده از خدمات همپوشان است که تنها به اندازه ضعیفترین کد آنها قابل اعتماد است. علت اصلی قطعی روز دوشنبه ناشناخته است، اما سرویسی که نامهای کاربری دوستانه وب را به آدرسهای IP تبدیل میکند، نتوانست با پایگاههای داده عظیم شرکتهای زیادی که توسط آمازون میزبانی میشوند، ارتباط برقرار کند.
قطعیهای قبلی در این مقیاس توسط خطاهای مختلفی از جمله بروزرسانیهای معیوب، وارد کردن تصادفی کد بد یا تغییری در نرمافزارهای شخص ثالث که با سرویس سازگار نیستند، ایجاد شده است. نادر است که برشهای کابل اینترنت، حملات سایبری یا حملات سرویس انکار مستقیم بتوانند سرورها را که برنامههای کلیدی را میزبانی میکنند، خاموش یا بارگذاری بیش از حد کنند.
اما فراوانی نسبی این رویدادها نشان دهنده نبود تکرارپذیریهای لازم و خدمات رقابتی است. اغلب، برخی کارشناسان اینترنت میگویند که شرکتها همه تخممرغهای خود را در یک سبد خدمات ابری میگذارند.
به گفته راب ژاردین، مدیر دیجیتال ارشد در شرکت امنیت سایبری NymVPN، «هیچ نشانهای» مبنی بر اینکه این یک حمله سایبری باشد، وجود ندارد و افزود که «به نظر میرسد یک نقص فنی است که یکی از مراکز داده اصلی آمازون را تحت تأثیر قرار داده است».
«اینترنت در اصل طراحی شد تا غیرمتمرکز و مقاوم باشد، اما امروز بخش زیادی از اکوسیستم آنلاین ما در چند منطقه کوچک متمرکز شده است»، او در یادداشتی گفت. «وقتی یکی از این مناطق دچار خطا میشود، تأثیر آن فوری و گسترده است.»
ژاردین گفت «این مشکلات میتوانند زمانی رخ دهند که سیستمها بیش از حد بارگذاری شوند یا بخش کلیدی شبکه خاموش شود؛ و چون بسیاری از وبسایتها و برنامهها به AWS وابسته هستند، تأثیر سریع پخش میشود.»
AWS اغلب چنین اختلالات عمدهای را تجربه نمیکند، و آخرین آن در سال ۲۰۲۱ اتفاق افتاد.
«این در مقایسه با دیگر ارائهدهندگان بزرگ خدمات ابری است و در واقع، تعجبآور است که بدون اختلالات مکرر، در مقیاس بزرگی که دارند، قادر به فعالیت هستند»، مایک چپل، کارشناس امنیت سایبری و استاد فناوری اطلاعات در دانشکده کسبوکار مندوز دانشگاه نوتردام، گفت.
«دلیل اینکه این رویدادها توجه بیشتری را جلب میکند، اثر آنها است»، او به CNN گفت. «اگر یک شرکت در مرکز داده خود مشکلی داشته باشد، این مشکلات برای محصولات و خدمات آن شرکت ایجاد میشود.»
در سال ۲۰۲۴، بزرگترین قطعی فناوری اطلاعات، بخشهای بزرگی از اینترنت را خاموش کرد، زمانی که یک اشکال ویرانگر در نرمافزار CrowdStrike رایانهها را خراب کرد، منجر به لغو پروازها و اختلال در بیمارستانهای سراسر جهان شد، و خسارت مستقیم به کسبوکار به ارزش ۵ میلیارد دلار وارد کرد. یک اشکال در سیستم آزمایش ابری CrowdStrike، بروزرسانی مشکلدار را به رایانههای سراسر جهان ارسال کرد.
سال گذشته، شبکهی AT&T چندین بار قطع شد، از جمله یک بحران ۱۱ ساعته که بسیاری از کارگران فریلنسری را از انجام وظایفشان بازداشت. پس، چه چیزی در روز دوشنبه اشتباه رفت؟ AWS یک ارائهدهندهی محاسبات ابری است که میزبان بسیاری از پرکاربردترین خدمات آنلاین جهان است. در اوایل تأسیس آمازون، این شرکت نیاز به ظرفیت سرور اضافی داشت تا مطمئن شود توانایی پردازش کافی برای مدیریت حجم عظیم ترافیک وارد شده به سایتش در طول فصل تعطیلات را دارد. آمازون درک کرد که در طول باقی سال، میتواند از آن سرورها برای پشتیبانی نیازهای آنلاین سایر شرکتها استفاده کند، و از آنجا AWS متولد شد.
در میان ارائههای متعدد AWS، DynamoDB است، یک پایگاه داده که اطلاعات شرکتها، از جمله دادههای مشتریان، را میزبانی میکند. آمازون روز دوشنبه اعلام کرد که مشتریانش نمیتوانند به دادههای ذخیره شده در DynamoDB دسترسی پیدا کنند، زیرا سیستم نام دامنه (DNS) — که نوعی دفتر تلفن برای اینترنت است — دچار مشکل شده است.
DNS مانند موتور مکانیابی اینترنت است، که آدرسهای وب کاربرپسند مانند amazon.com را به آدرسهای آیپی — مجموعهای از اعداد که سایر وبسایتها و برنامهها میتوانند درک کنند — تبدیل میکند.
«آمازون دادهها را به صورت امن ذخیره کرده بود، اما هیچکس دیگر نمیتوانست آن را پیدا کند، که باعث شد برنامهها برای چند ساعت به طور موقت از دادههایشان جدا شوند،» شابل گفت. «انگار بخشهای بزرگی از اینترنت دچار فراموشی موقت شده بودند.»
مشخص نیست چه چیزی باعث خاموشی DNS شد، اما تنها چند ساعت طول کشید. تا ساعت ۶:۳۵ صبح به وقت شرقی، آمازون مشکل DNS را برطرف کرد و شرکتها را توصیه کرد که کشهای موقت — فایلهای ذخیرهسازی موقت — خود را پاک کنند تا سرعت بازیابی خدماتشان افزایش یابد.
آمازون گفت که این خاموشی همچنان بر دیگر خدمات AWS، از جمله EC2 — نوعی سرور مجازی که بسیاری از شرکتها برای ساخت برنامههای آنلاین خود استفاده میکنند — تأثیر میگذارد.
احتمالاً این شرکت یک بررسی پس از بحران انجام خواهد داد و در روزهای آینده توضیح خواهد داد چه چیزی در سیستم DNS آن اشتباه رفت.