کاهش ردپای مرکز داده RIPE NCC - دنیای آزمایشگاه

سرویس اطلاعات مسیریابی و اطلس RIPE (RIS) خدمات بسیار ارزشمندی است که توسط RIPE NCC به اعضای ما و جامعه در کل ارائه می شود. با توجه به حجم بسیار زیادی از داده‌هایی که جمع‌آوری و ذخیره می‌کنیم، ضروری است که این خدمات بر روی یک پلتفرم مقرون‌به‌صرفه ساخته شوند که به ما امکان می‌دهد تا سال‌های آینده آنها را به شیوه‌ای پایدار از نظر مالی ارائه کنیم.

کمی نگاه تاریخی

از زمان آغاز به کار، هر دو اطلس RIPE و RIS دسترسی به تمام داده های تاریخی جمع آوری شده را فراهم کرده اند. RIPE Atlas در حال حاضر تقریباً یک پتابایت داده دارد، در حالی که RIS تقریباً صد ترابایت دارد. این داده ها برای ذینفعان مختلف ارزش زیادی دارد و بینشی از تاریخچه اینترنت از نظر مسیریابی (از سال 1999 برای RIS) و اتصال به اینترنت و دسترسی (از سال 2011 برای RIPE Atlas) ارائه می دهد.

یک فرض کلیدی در پشت ارائه داده های کامل تاریخی برای این خدمات این بود که هزینه های ذخیره سازی با همان سرعتی که حجم داده ها افزایش می یابد کاهش می یابد. ایده این بود که پس از ایجاد زیرساخت های اساسی، می توانیم ذخیره سازی داده ها را با هزینه ثابت با ارتقاء به سرورهای جدیدتر و قدرتمندتر گسترش دهیم. فناوری اصلی ذخیره داده ها، Hadoop و HBase، با فرض استفاده از سخت افزار ارزان قیمت طراحی شده است. بنابراین، با توجه به دانش ما در آن زمان، این فرض منطقی به نظر می رسید.

با این حال، این فرض در آزمون زمان تاب نیامده است. ما در حال حاضر یک زیرساخت قابل توجه مرکز داده را شامل تقریباً 46 رک که در دو مرکز داده در آمستردام پخش شده اند، اداره می کنیم. نیمی از این زیرساخت، تقریباً 23 رک، به ذخیره سازی داده های RIS و RIPE Atlas اختصاص دارد. این سرورها به ظرفیت کامل خود نزدیک می شوند و در طول چرخه عمر خود نیاز به تعویض دارند. اگر ما به دسترسی به داده های تاریخی کامل ادامه دهیم، سرمایه گذاری اضافی قابل توجهی مورد نیاز خواهد بود. بنابراین، ما با یک انتخاب روبرو شدیم: یا دسترسی به داده‌های تاریخی را متوقف کنیم و راه‌حل ذخیره‌سازی کوچک‌تر و کارآمدتر را انتخاب کنیم، یا به دنبال یک رویکرد فنی جایگزین باشیم که امکان دسترسی پایدار به داده‌های تاریخی را فراهم می‌کند. در حال حاضر در حال اجرای آخرین راه حل هستیم که در قسمت های بعدی به شرح آن خواهم پرداخت.

چشم انداز استفاده از مرکز داده

هزینه‌های مرکز داده ما در حال حاضر نزدیک به یک میلیون یورو در سال است که هزینه‌های مسکن و برق و بدون احتساب هزینه‌های تجهیزات و مهندسی را پوشش می‌دهد. هدف ما کاهش چشمگیر این هزینه ها است: از 46 رک تا پایان سال به 23 و تا پایان سال 2025 به 10 رک. این کاهش بیش از 70 درصد از هزینه های فعلی مرکز داده ما را صرفه جویی می کند.

این صرفه‌جویی‌های پیش‌بینی‌شده نه تنها ناشی از انتقال RIS و RIPE Atlas به خارج از مراکز داده، بلکه از دیگر کارایی‌هایی است که بخش فناوری اطلاعات ما در مدیریت زیرساخت‌های موجود به دست آورده است. در حالی که این مقاله در درجه اول بر روی RIS و RIPE Atlas تمرکز دارد، ما آماده هستیم تا در صورت وجود علاقه، جزئیات این پس انداز اضافی را در یک مقاله جداگانه توضیح دهیم.

با این حال، یک هشدار وجود دارد: برخی از این صرفه جویی ها با افزایش هزینه های ابر جبران می شود، زیرا راه حل پیشنهادی ما که در زیر توضیح داده شده است از این فناوری ها استفاده می کند. با این وجود، انتظار می‌رود هزینه‌های جدید در مجموع به میزان قابل‌توجهی کمتر باشد، کمتر از نیمی از هزینه‌های جاری، در حالی که اثبات آینده است.

چشم انداز ما این است: حفظ زیرساخت مرکز داده برای جواهرات تاج خود مانند داده های ثبت و عضویت، RPKI، DNSSEC و پایگاه داده RIPE. خدمات کمتر مهم، بدون اطلاعات شخصی، حساس یا محرمانه را می توان در فضای ابری ذخیره کرد. انتخاب خاص ارائه‌دهنده ابر به نیازهای هر سرویس بستگی دارد، اما ما در صورت امکان، ارائه‌دهندگان ابر اروپایی را در اولویت قرار می‌دهیم. علاوه بر این، هدف ما پیروی از استانداردهای صنعت (مانند Kubernetes) برای تسهیل انتقال بدون درز بین فروشندگان در صورت ظهور گزینه بهتر است.

مخزن جدید برای RIPE Atlas

در اواسط سال گذشته، ما هدف تعیین کردیم که ردپای مرکز داده خود را تا پایان سال 2024 به نصف برسانیم. برای رسیدن به این هدف، گزینه‌های مختلفی از جمله راه‌حل‌های ابری و داخلی و استفاده از فناوری‌های مختلف را بررسی کردیم. در پایان، ما یک رویکرد ترکیبی را انتخاب کردیم که ذخیره سازی مقرون به صرفه اشیاء در ابر را با ساخت یک خوشه جدید با استفاده از فلز خالی اجاره شده ترکیب می کند. این راه حل دو مزیت اصلی را ارائه می دهد: اول اینکه به ما امکان می دهد بیشتر داده های خود را با هزینه بسیار کمتری ذخیره کنیم و دوم، انعطاف پذیری برای تنظیم پارامترها برای بهینه سازی بیشتر هزینه ها، البته با برخی مصالحه ها، فراهم می کند.

مفهوم پشت این راه‌حل ساده است: پیاده‌سازی ذخیره‌سازی لایه‌ای، که در آن داده‌های با دسترسی مکرر در راه‌حل‌های سریع‌تر و گران‌تر ذخیره می‌شوند، در حالی که داده‌های قدیمی‌تر و کمتر در دسترس در راه‌حل‌های کندتر و اقتصادی‌تر ذخیره می‌شوند. برای ذخیره سازی گرم، ما انتخاب کردیم که یک خوشه جدید با استفاده از فلز خالی اجاره شده بسازیم. برای ذخیره سازی سرد، ما AWS S3 را انتخاب کردیم، یک راه حل مقرون به صرفه ذخیره سازی اشیاء که به ما امکان می دهد حجم زیادی از داده ها را با حداقل هزینه ذخیره کنیم – با انعطاف پذیری برای تغییر به ارائه دهنده دیگری در صورت نیاز. ما همچنین کد RIPE Atlas را برای دسترسی یکپارچه به داده‌ها از هر دو منبع تغییر دادیم بدون اینکه کاربران نیازی به اطلاع از راه‌حل‌های خاص داشته باشند.

همانطور که من این را می نویسم، تمام درخواست های RIPE Atlas که به دنبال داده های قدیمی تر از 2021 هستند توسط حافظه S3 جدید ما ارائه می شوند. اگرچه در برخی موارد کمی کندتر از خوشه فعلی ما است، اما اکثر درخواست‌ها همچنان باید در عرض چند ثانیه حل شوند، حتی در بدترین حالت. در موارد خاص، پاسخ از S3 در واقع سریعتر از راه حل فعلی بود.

بسیاری از پارامترهای راه حل جدید ما به راحتی قابل تنظیم هستند. به عنوان مثال، AWS S3 ردیف‌بندی خودکار داده‌های ذخیره‌شده را ارائه می‌کند که به تدریج داده‌هایی را که کمتر در دسترس هستند به لایه‌های ذخیره‌سازی سردتر منتقل می‌کند. سطوح خاصی که ما استفاده می کنیم را می توان سفارشی کرد. ما این توانایی را داریم که داده‌ها را تا آخر به ذخیره‌سازی Glacier منتقل کنیم، جایی که با هزینه بسیار کم ذخیره می‌شود، اما بازیابی آن ممکن است ساعت‌ها طول بکشد. این چیزی است که ما در حال حاضر ترجیح دادیم انجام ندهیم، اما به عنوان یک گزینه حفظ شد.

هدف ما این است که راه حل جدید تا جولای 2024 به طور کامل اجرا شود و خوشه قدیمی تا اوت از کار خارج شود. این برنامه به ما این امکان را می دهد که به طور قابل توجهی ردپای مرکز داده خود را کاهش دهیم و صرفه جویی قابل توجهی در هزینه ها داشته باشیم.

مراحل بعدی

تمرکز اصلی برای ما در حال حاضر انتقال موفقیت آمیز ذخیره سازی RIPE Atlas از مراکز داده خود به راه حل جدید است. ما در حال حاضر در مرحله نهایی داده کاوی هستیم که شامل کپی کردن داده ها از Hadoop در S3 است. ما انتظار داریم این کار را در چند هفته آینده تکمیل کنیم.

در عین حال، ما سخت کار می کنیم تا خوشه جدید را ایجاد کنیم. پس از تکمیل، می توانیم تولید را به طور کامل از خوشه قدیمی به خوشه جدید منتقل کنیم. این کار فضایی را برای بخش فناوری اطلاعات ما آزاد می‌کند تا با کار سخت پاک‌سازی قفسه‌ها در مراکز داده و سازماندهی مجدد سرورها برای تطبیق با فضاهای مورد نیاز جدید و کاهش‌یافته، مقابله کند.

هنگامی که این مراحل با موفقیت انجام شد، ما به مرحله بعدی خواهیم رفت: انتقال باطن RIS. اگرچه این رویکرد احتمالاً مشابه روش مورد استفاده برای اطلس RIPE است، با توجه به الزامات منحصر به فرد RIS ممکن است تغییرات لازم وجود داشته باشد.

ما مفتخریم که راه حلی را پیدا کرده ایم که کارایی هزینه بسیار بیشتری را بدون به خطر انداختن کیفیت خدمات داده ما ارائه می دهد. ما مشتاقانه منتظر شنیدن نظرات و نظرات شما در مورد این تلاش مهم هستیم.

Source link