اینترنت دوباره دچار قطعی جهانی شد. چرا این اتفاق دوباره می‌افتد؟

سرویس‌های وب آمازون (AWS)، پلتفرم محاسبات ابری که بخش زیادی از اینترنت را قدرت می‌دهد، چند ساعت در روز دوشنبه خاموش شد و چندین وب‌سایت و برنامه مهم را غیرقابل استفاده کرد.

از خدمات بانکی گرفته تا شبکه‌های اجتماعی، سایت‌های رزرو هواپیما و خرید آنلاین، هزاران سرویس مختل شدند و میلیون‌ها نفر در سراسر جهان — بسیاری در راه کار در آمریکا شرقی — نتوانستند قهوه سفارش دهند یا به برنامه‌های کلیدی دسترسی پیدا کنند.

آخرین قطعی به عنوان یادآوری است که چگونه ستون فقرات اینترنت می‌تواند شکننده باشد، حتی اگر اختلال کوتاه باشد، و چقدر جهان به این خدمات آنلاین وابسته شده است.

2023-12-01t165935z-361682822-rc29n4al00uc-rtrmadp-3-amazon-com-aws4158238767601216912 اینترنت دوباره دچار قطعی جهانی شد. چرا این اتفاق دوباره می‌افتد؟

اگرچه AWS و رقبای آن عموماً مقاوم هستند، اما اینترنت یک شبکه پیچیده از خدمات همپوشان است که تنها به اندازه ضعیف‌ترین کد آن‌ها قابل اعتماد است. علت اصلی قطعی روز دوشنبه ناشناخته است، اما سرویسی که نام‌های کاربری دوستانه وب را به آدرس‌های IP تبدیل می‌کند، نتوانست با پایگاه‌های داده عظیم شرکت‌های زیادی که توسط آمازون میزبانی می‌شوند، ارتباط برقرار کند.

قطعی‌های قبلی در این مقیاس توسط خطاهای مختلفی از جمله بروزرسانی‌های معیوب، وارد کردن تصادفی کد بد یا تغییری در نرم‌افزارهای شخص ثالث که با سرویس سازگار نیستند، ایجاد شده است. نادر است که برش‌های کابل اینترنت، حملات سایبری یا حملات سرویس انکار مستقیم بتوانند سرورها را که برنامه‌های کلیدی را میزبانی می‌کنند، خاموش یا بارگذاری بیش از حد کنند.

اما فراوانی نسبی این رویدادها نشان دهنده نبود تکرارپذیری‌های لازم و خدمات رقابتی است. اغلب، برخی کارشناسان اینترنت می‌گویند که شرکت‌ها همه تخم‌مرغ‌های خود را در یک سبد خدمات ابری می‌گذارند.

به گفته راب ژاردین، مدیر دیجیتال ارشد در شرکت امنیت سایبری NymVPN، «هیچ نشانه‌ای» مبنی بر اینکه این یک حمله سایبری باشد، وجود ندارد و افزود که «به نظر می‌رسد یک نقص فنی است که یکی از مراکز داده اصلی آمازون را تحت تأثیر قرار داده است».

«اینترنت در اصل طراحی شد تا غیرمتمرکز و مقاوم باشد، اما امروز بخش زیادی از اکوسیستم آنلاین ما در چند منطقه کوچک متمرکز شده است»، او در یادداشتی گفت. «وقتی یکی از این مناطق دچار خطا می‌شود، تأثیر آن فوری و گسترده است.»

ژاردین گفت «این مشکلات می‌توانند زمانی رخ دهند که سیستم‌ها بیش از حد بارگذاری شوند یا بخش کلیدی شبکه خاموش شود؛ و چون بسیاری از وب‌سایت‌ها و برنامه‌ها به AWS وابسته هستند، تأثیر سریع پخش می‌شود.»

AWS اغلب چنین اختلالات عمده‌ای را تجربه نمی‌کند، و آخرین آن در سال ۲۰۲۱ اتفاق افتاد.

«این در مقایسه با دیگر ارائه‌دهندگان بزرگ خدمات ابری است و در واقع، تعجب‌آور است که بدون اختلالات مکرر، در مقیاس بزرگی که دارند، قادر به فعالیت هستند»، مایک چپل، کارشناس امنیت سایبری و استاد فناوری اطلاعات در دانشکده کسب‌وکار مندوز دانشگاه نوتردام، گفت.

«دلیل اینکه این رویدادها توجه بیشتری را جلب می‌کند، اثر آن‌ها است»، او به CNN گفت. «اگر یک شرکت در مرکز داده خود مشکلی داشته باشد، این مشکلات برای محصولات و خدمات آن شرکت ایجاد می‌شود.»

در سال ۲۰۲۴، بزرگ‌ترین قطعی فناوری اطلاعات، بخش‌های بزرگی از اینترنت را خاموش کرد، زمانی که یک اشکال ویرانگر در نرم‌افزار CrowdStrike رایانه‌ها را خراب کرد، منجر به لغو پروازها و اختلال در بیمارستان‌های سراسر جهان شد، و خسارت مستقیم به کسب‌وکار به ارزش ۵ میلیارد دلار وارد کرد. یک اشکال در سیستم آزمایش ابری CrowdStrike، بروزرسانی مشکل‌دار را به رایانه‌های سراسر جهان ارسال کرد.

سال گذشته، شبکه‌ی AT&T چندین بار قطع شد، از جمله یک بحران ۱۱ ساعته که بسیاری از کارگران فریلنسری را از انجام وظایفشان بازداشت. پس، چه چیزی در روز دوشنبه اشتباه رفت؟ AWS یک ارائه‌دهنده‌ی محاسبات ابری است که میزبان بسیاری از پرکاربردترین خدمات آنلاین جهان است. در اوایل تأسیس آمازون، این شرکت نیاز به ظرفیت سرور اضافی داشت تا مطمئن شود توانایی پردازش کافی برای مدیریت حجم عظیم ترافیک وارد شده به سایتش در طول فصل تعطیلات را دارد. آمازون درک کرد که در طول باقی سال، می‌تواند از آن سرورها برای پشتیبانی نیازهای آنلاین سایر شرکت‌ها استفاده کند، و از آنجا AWS متولد شد.

در میان ارائه‌های متعدد AWS، DynamoDB است، یک پایگاه داده که اطلاعات شرکت‌ها، از جمله داده‌های مشتریان، را میزبانی می‌کند. آمازون روز دوشنبه اعلام کرد که مشتریانش نمی‌توانند به داده‌های ذخیره شده در DynamoDB دسترسی پیدا کنند، زیرا سیستم نام دامنه (DNS) — که نوعی دفتر تلفن برای اینترنت است — دچار مشکل شده است.

DNS مانند موتور مکان‌یابی اینترنت است، که آدرس‌های وب کاربرپسند مانند amazon.com را به آدرس‌های آی‌پی — مجموعه‌ای از اعداد که سایر وب‌سایت‌ها و برنامه‌ها می‌توانند درک کنند — تبدیل می‌کند.

«آمازون داده‌ها را به صورت امن ذخیره کرده بود، اما هیچ‌کس دیگر نمی‌توانست آن را پیدا کند، که باعث شد برنامه‌ها برای چند ساعت به طور موقت از داده‌هایشان جدا شوند،» شابل گفت. «انگار بخش‌های بزرگی از اینترنت دچار فراموشی موقت شده بودند.»

مشخص نیست چه چیزی باعث خاموشی DNS شد، اما تنها چند ساعت طول کشید. تا ساعت ۶:۳۵ صبح به وقت شرقی، آمازون مشکل DNS را برطرف کرد و شرکت‌ها را توصیه کرد که کش‌های موقت — فایل‌های ذخیره‌سازی موقت — خود را پاک کنند تا سرعت بازیابی خدماتشان افزایش یابد.

آمازون گفت که این خاموشی همچنان بر دیگر خدمات AWS، از جمله EC2 — نوعی سرور مجازی که بسیاری از شرکت‌ها برای ساخت برنامه‌های آنلاین خود استفاده می‌کنند — تأثیر می‌گذارد.

احتمالاً این شرکت یک بررسی پس از بحران انجام خواهد داد و در روزهای آینده توضیح خواهد داد چه چیزی در سیستم DNS آن اشتباه رفت.