سرویس اطلاعات مسیریابی و اطلس RIPE (RIS) خدمات بسیار ارزشمندی است که توسط RIPE NCC به اعضای ما و جامعه در کل ارائه می شود. با توجه به حجم بسیار زیادی از دادههایی که جمعآوری و ذخیره میکنیم، ضروری است که این خدمات بر روی یک پلتفرم مقرونبهصرفه ساخته شوند که به ما امکان میدهد تا سالهای آینده آنها را به شیوهای پایدار از نظر مالی ارائه کنیم.
کمی نگاه تاریخی
از زمان آغاز به کار، هر دو اطلس RIPE و RIS دسترسی به تمام داده های تاریخی جمع آوری شده را فراهم کرده اند. RIPE Atlas در حال حاضر تقریباً یک پتابایت داده دارد، در حالی که RIS تقریباً صد ترابایت دارد. این داده ها برای ذینفعان مختلف ارزش زیادی دارد و بینشی از تاریخچه اینترنت از نظر مسیریابی (از سال 1999 برای RIS) و اتصال به اینترنت و دسترسی (از سال 2011 برای RIPE Atlas) ارائه می دهد.
یک فرض کلیدی در پشت ارائه داده های کامل تاریخی برای این خدمات این بود که هزینه های ذخیره سازی با همان سرعتی که حجم داده ها افزایش می یابد کاهش می یابد. ایده این بود که پس از ایجاد زیرساخت های اساسی، می توانیم ذخیره سازی داده ها را با هزینه ثابت با ارتقاء به سرورهای جدیدتر و قدرتمندتر گسترش دهیم. فناوری اصلی ذخیره داده ها، Hadoop و HBase، با فرض استفاده از سخت افزار ارزان قیمت طراحی شده است. بنابراین، با توجه به دانش ما در آن زمان، این فرض منطقی به نظر می رسید.
با این حال، این فرض در آزمون زمان تاب نیامده است. ما در حال حاضر یک زیرساخت قابل توجه مرکز داده را شامل تقریباً 46 رک که در دو مرکز داده در آمستردام پخش شده اند، اداره می کنیم. نیمی از این زیرساخت، تقریباً 23 رک، به ذخیره سازی داده های RIS و RIPE Atlas اختصاص دارد. این سرورها به ظرفیت کامل خود نزدیک می شوند و در طول چرخه عمر خود نیاز به تعویض دارند. اگر ما به دسترسی به داده های تاریخی کامل ادامه دهیم، سرمایه گذاری اضافی قابل توجهی مورد نیاز خواهد بود. بنابراین، ما با یک انتخاب روبرو شدیم: یا دسترسی به دادههای تاریخی را متوقف کنیم و راهحل ذخیرهسازی کوچکتر و کارآمدتر را انتخاب کنیم، یا به دنبال یک رویکرد فنی جایگزین باشیم که امکان دسترسی پایدار به دادههای تاریخی را فراهم میکند. در حال حاضر در حال اجرای آخرین راه حل هستیم که در قسمت های بعدی به شرح آن خواهم پرداخت.
چشم انداز استفاده از مرکز داده
هزینههای مرکز داده ما در حال حاضر نزدیک به یک میلیون یورو در سال است که هزینههای مسکن و برق و بدون احتساب هزینههای تجهیزات و مهندسی را پوشش میدهد. هدف ما کاهش چشمگیر این هزینه ها است: از 46 رک تا پایان سال به 23 و تا پایان سال 2025 به 10 رک. این کاهش بیش از 70 درصد از هزینه های فعلی مرکز داده ما را صرفه جویی می کند.
این صرفهجوییهای پیشبینیشده نه تنها ناشی از انتقال RIS و RIPE Atlas به خارج از مراکز داده، بلکه از دیگر کاراییهایی است که بخش فناوری اطلاعات ما در مدیریت زیرساختهای موجود به دست آورده است. در حالی که این مقاله در درجه اول بر روی RIS و RIPE Atlas تمرکز دارد، ما آماده هستیم تا در صورت وجود علاقه، جزئیات این پس انداز اضافی را در یک مقاله جداگانه توضیح دهیم.
با این حال، یک هشدار وجود دارد: برخی از این صرفه جویی ها با افزایش هزینه های ابر جبران می شود، زیرا راه حل پیشنهادی ما که در زیر توضیح داده شده است از این فناوری ها استفاده می کند. با این وجود، انتظار میرود هزینههای جدید در مجموع به میزان قابلتوجهی کمتر باشد، کمتر از نیمی از هزینههای جاری، در حالی که اثبات آینده است.
چشم انداز ما این است: حفظ زیرساخت مرکز داده برای جواهرات تاج خود مانند داده های ثبت و عضویت، RPKI، DNSSEC و پایگاه داده RIPE. خدمات کمتر مهم، بدون اطلاعات شخصی، حساس یا محرمانه را می توان در فضای ابری ذخیره کرد. انتخاب خاص ارائهدهنده ابر به نیازهای هر سرویس بستگی دارد، اما ما در صورت امکان، ارائهدهندگان ابر اروپایی را در اولویت قرار میدهیم. علاوه بر این، هدف ما پیروی از استانداردهای صنعت (مانند Kubernetes) برای تسهیل انتقال بدون درز بین فروشندگان در صورت ظهور گزینه بهتر است.
مخزن جدید برای RIPE Atlas
در اواسط سال گذشته، ما هدف تعیین کردیم که ردپای مرکز داده خود را تا پایان سال 2024 به نصف برسانیم. برای رسیدن به این هدف، گزینههای مختلفی از جمله راهحلهای ابری و داخلی و استفاده از فناوریهای مختلف را بررسی کردیم. در پایان، ما یک رویکرد ترکیبی را انتخاب کردیم که ذخیره سازی مقرون به صرفه اشیاء در ابر را با ساخت یک خوشه جدید با استفاده از فلز خالی اجاره شده ترکیب می کند. این راه حل دو مزیت اصلی را ارائه می دهد: اول اینکه به ما امکان می دهد بیشتر داده های خود را با هزینه بسیار کمتری ذخیره کنیم و دوم، انعطاف پذیری برای تنظیم پارامترها برای بهینه سازی بیشتر هزینه ها، البته با برخی مصالحه ها، فراهم می کند.
مفهوم پشت این راهحل ساده است: پیادهسازی ذخیرهسازی لایهای، که در آن دادههای با دسترسی مکرر در راهحلهای سریعتر و گرانتر ذخیره میشوند، در حالی که دادههای قدیمیتر و کمتر در دسترس در راهحلهای کندتر و اقتصادیتر ذخیره میشوند. برای ذخیره سازی گرم، ما انتخاب کردیم که یک خوشه جدید با استفاده از فلز خالی اجاره شده بسازیم. برای ذخیره سازی سرد، ما AWS S3 را انتخاب کردیم، یک راه حل مقرون به صرفه ذخیره سازی اشیاء که به ما امکان می دهد حجم زیادی از داده ها را با حداقل هزینه ذخیره کنیم – با انعطاف پذیری برای تغییر به ارائه دهنده دیگری در صورت نیاز. ما همچنین کد RIPE Atlas را برای دسترسی یکپارچه به دادهها از هر دو منبع تغییر دادیم بدون اینکه کاربران نیازی به اطلاع از راهحلهای خاص داشته باشند.
همانطور که من این را می نویسم، تمام درخواست های RIPE Atlas که به دنبال داده های قدیمی تر از 2021 هستند توسط حافظه S3 جدید ما ارائه می شوند. اگرچه در برخی موارد کمی کندتر از خوشه فعلی ما است، اما اکثر درخواستها همچنان باید در عرض چند ثانیه حل شوند، حتی در بدترین حالت. در موارد خاص، پاسخ از S3 در واقع سریعتر از راه حل فعلی بود.
بسیاری از پارامترهای راه حل جدید ما به راحتی قابل تنظیم هستند. به عنوان مثال، AWS S3 ردیفبندی خودکار دادههای ذخیرهشده را ارائه میکند که به تدریج دادههایی را که کمتر در دسترس هستند به لایههای ذخیرهسازی سردتر منتقل میکند. سطوح خاصی که ما استفاده می کنیم را می توان سفارشی کرد. ما این توانایی را داریم که دادهها را تا آخر به ذخیرهسازی Glacier منتقل کنیم، جایی که با هزینه بسیار کم ذخیره میشود، اما بازیابی آن ممکن است ساعتها طول بکشد. این چیزی است که ما در حال حاضر ترجیح دادیم انجام ندهیم، اما به عنوان یک گزینه حفظ شد.
هدف ما این است که راه حل جدید تا جولای 2024 به طور کامل اجرا شود و خوشه قدیمی تا اوت از کار خارج شود. این برنامه به ما این امکان را می دهد که به طور قابل توجهی ردپای مرکز داده خود را کاهش دهیم و صرفه جویی قابل توجهی در هزینه ها داشته باشیم.
مراحل بعدی
تمرکز اصلی برای ما در حال حاضر انتقال موفقیت آمیز ذخیره سازی RIPE Atlas از مراکز داده خود به راه حل جدید است. ما در حال حاضر در مرحله نهایی داده کاوی هستیم که شامل کپی کردن داده ها از Hadoop در S3 است. ما انتظار داریم این کار را در چند هفته آینده تکمیل کنیم.
در عین حال، ما سخت کار می کنیم تا خوشه جدید را ایجاد کنیم. پس از تکمیل، می توانیم تولید را به طور کامل از خوشه قدیمی به خوشه جدید منتقل کنیم. این کار فضایی را برای بخش فناوری اطلاعات ما آزاد میکند تا با کار سخت پاکسازی قفسهها در مراکز داده و سازماندهی مجدد سرورها برای تطبیق با فضاهای مورد نیاز جدید و کاهشیافته، مقابله کند.
هنگامی که این مراحل با موفقیت انجام شد، ما به مرحله بعدی خواهیم رفت: انتقال باطن RIS. اگرچه این رویکرد احتمالاً مشابه روش مورد استفاده برای اطلس RIPE است، با توجه به الزامات منحصر به فرد RIS ممکن است تغییرات لازم وجود داشته باشد.
ما مفتخریم که راه حلی را پیدا کرده ایم که کارایی هزینه بسیار بیشتری را بدون به خطر انداختن کیفیت خدمات داده ما ارائه می دهد. ما مشتاقانه منتظر شنیدن نظرات و نظرات شما در مورد این تلاش مهم هستیم.