...
راه اندازی مانیتورینگ اتاق سرور

چشم بینای دیتاسنتر شما در ۲۴ ساعت شبانه‌ روز

بسیاری از حوادث اتاق سرور (مانند آتش‌سوزی یا خرابی سرورها) ناشی از تغییرات ناگهانی دما، نشتی آب کولر یا نوسانات برق است که اگر به موقع شناسایی شوند، قابل پیشگیری هستند. سامانه مانیتورینگ محیطی (EMS) طراحی شده توسط DCI24، مانند یک نگهبان هوشمند عمل می‌کند. این سیستم با جمع‌آوری داده‌ها از سنسورهای مختلف، وضعیت اتاق سرور را تحلیل کرده و در صورت عبور از آستانه‌های مجاز، بلافاصله از طریق **SMS، تماس صوتی، ایمیل و آژیر** به مدیران شبکه هشدار می‌دهد.

سنسورهای حیاتی اتاق سرور

دما و رطوبت

کنترل دقیق دما (۲۰-۲۴)

نشتی آب

تشخیص نشتی زیر کولرها و کف کاذب (طنابی/نقطه‌ای)

دود و حریق

تشخیص اولیه دود قبل از فعال شدن سیستم اطفاء

وضعیت برق

نظارت بر ولتاژ، جریان و وضعیت باطری UPS

تردد و درب

هشدار باز ماندن درب و ورود افراد غیرمجاز

حرکت

سنسور PIR برای تشخیص حضور در ساعات غیرکاری

ویژگی‌های نرم‌افزار مانیتورینگ DCI24

مشخصات فنی دستگاه کنترلر

پروتکل‌های ارتباطی SNMP v1/v2/v3, Modbus TCP/RTU, MQTT
روش‌های هشدار GSM (SMS/Call), Email (SMTP), Siren, Telegram Bot
ورودی/خروجی 8 ورودی دیجیتال، 4 ورودی آنالوگ، 4 خروجی رله‌ای (قابل ارتقا)
منبع تغذیه 12V/24V DC با باطری پشتیبان داخلی (تا 6 ساعت)

سلام، من میلاد توکلی هستم. بگذارید بحث را با بدترین خاطره دوران کاری‌ام شروع کنم. حدود ۸ سال پیش، ساعت ۳ بامداد موبایلم زنگ خورد. نگهبان ساختمان بود. با صدایی لرزان گفت: «مهندس! از زیر در اتاق سرور داره دود میاد بیرون!»

تا من خودم را برسانم، کار از کار گذشته بود. ماجرا چه بود؟ کولر اسپلیت اصلی سوخته بود، دمای اتاق به بالای ۶۰ درجه رسیده بود و یکی از پاورهای سرور آتش گرفته بود. آن شب ما فقط سخت‌افزار از دست ندادیم؛ ما اعتبارمان را جلوی مشتری‌ها از دست دادیم چون سرویس‌ها ۳ روز قطع بود.

آن شب درس بزرگی گرفتم: «اتاق سرور بدون مانیتورینگ، مثل رانندگی در جاده مه‌آلود با چراغ خاموش است.»

امروز می‌خواهم به عنوان کسی که ۱۵ سال است مسئولیت نگهداری دیتاسنترهای مختلف را دارم، با شما بی‌پرده صحبت کنم. اگر فکر می‌کنید مانیتورینگ محیطی یک کالای لوکس است، سخت در اشتباهید. این سیستم، بیمه عمر کسب‌وک‌ار شماست.

سیستم مانیتورینگ اتاق سرور (EMS) دقیقاً چیست؟

بیایید یک سوءتفاهم بزرگ را حل کنیم. خیلی از مدیران به من می‌گویند: “مهندس توکلی! ما که سولارویندز (SolarWinds) داریم، وضعیت شبکه را می‌بینیم، چه نیازی به این دستگاه‌هاست؟”

ببینید دوستان، ما دو نوع مانیتورینگ داریم:

  1. مانیتورینگ شبکه (نرم‌افزاری): مثل کیلومترشمار ماشین است. به شما می‌گوید سرعت اینترنت چقدر است، پینگ تایم چقدر است یا سرور روشن است یا نه.

  2. مانیتورینگ محیطی یا EMS (سخت‌افزاری): مثل آمپر آب ماشین است. به شما می‌گوید که موتور (سرور) دارد جوش می‌آورد!

سیستم مانیتورینگ اتاق سرور (Environmental Monitoring System)، مجموعه‌ای از سنسورها و دستگاه‌هاست که شرایط فیزیکی اتاق (دما، رطوبت، برق، دود، تردد) را لحظه‌به‌لحظه چک می‌کند. اگر شرایط از حالت نرمال خارج شود، قبل از اینکه فاجعه رخ دهد، با اس‌ام‌اس، تماس یا آژیر به شما خبر می‌دهد تا به دادش برسید.

چرا اتاق سرور به مانیتورینگ نیاز دارد؟ (۴ قاتل خاموش)

بر اساس تجربه‌ی من، تجهیزات شبکه ۴ دشمن خونی دارند که اگر حواستان نباشد، بی‌سروصدا سرمایه شما را نابود می‌کنند:

۱. دما (قاتل بی‌رحم)

تجهیزات الکترونیکی از گرما متنفرند. یک قانون نانوشته داریم که می‌گوید: «به ازای هر ۱۰ درجه افزایش دما بالای استاندارد، عمر سرور شما ۵۰٪ کم می‌شود.»

تصور کنید کولر گازی درست زمانی که شرکت تعطیل است خراب شود (مثلاً پنجشنبه عصر). بدون سیستم مانیتورینگ، دما در عرض یک ساعت جهنمی می‌شود و هارد دیسک‌ها و CPUها عملاً کباب می‌شوند. سیستم مانیتورینگ، دقیقاً همان لحظه‌ای که دما ۲ درجه از حد مجاز بالاتر رفت، به شما پیامک می‌دهد.

۲. رطوبت (دشمن دو‌چهره)

رطوبت هم کم‌اش دردسر است، هم زیادش:

  • رطوبت خیلی کم (خشکی): باعث ایجاد الکتریسیته ساکن (ESD) می‌شود. دیده‌اید وقتی دستگیره در را می‌گیرید جرقه می‌زند؟ همین جرقه کوچک می‌تواند مادربرد سرور چند صد میلیونی را بسوزاند.

  • رطوبت خیلی زیاد: باعث میعان آب، زنگ‌زدگی پین‌ها و در نهایت اتصال کوتاه می‌شود.

۳. نشت آب (خطر از بالا و پایین)

شاید بگویید اتاق سرور ما که لوله آب ندارد! اما تجربه به من ثابت کرده همیشه خطر هست. ترکیدن لوله طبقه بالا، نشت آب از خودِ پنل کولر گازی یا حتی نفوذ آب باران. سنسور نشت آب، حتی یک قطره آب را هم روی زمین تشخیص می‌دهد و قبل از اینکه کف کاذب تبدیل به استخر شود، خبرتان می‌کند.

۴. برق و UPS (توهم امنیت)

بارها دیده‌ام برق شهری قطع شده، اما UPS عمل نکرده چون باتری‌هایش فاسد شده بودند و کسی خبر نداشت. سیستم مانیتورینگ هوشمند، ولتاژ ورودی و خروجی و سلامت باتری‌ها را دائماً چک می‌کند تا در لحظه حساس قطع برق، دستتان در پوست گردو نماند.

استانداردهای حیاتی (اعداد طلایی ASHRAE)

من همیشه در پروژه‌ها طبق استاندارد جهانی ASHRAE (بخوانید اَشرِی – انجمن مهندسان گرمایش و سرمایش آمریکا) عمل می‌کنم. لازم نیست خودتان را درگیر جداول پیچیده کنید، فقط این اعداد طلایی را به خاطر بسپارید:

  • دمای ایده‌آل: بین ۲۰ تا ۲۴ درجه سانتی‌گراد. (زیر ۱۸ درجه پول برق را دور می‌ریزید، بالای ۲۷ درجه ریسک خرابی را می‌پذیرید).

  • رطوبت ایده‌آل: بین ۴۰ تا ۵۵ درصد.

  • نقطه شبنم (Dew Point): حداکثر ۱۵ درجه سانتی‌گراد (برای جلوگیری از قطرات آب).

اگر سیستم مانیتورینگ شما دمایی خارج از این محدوده را نشان داد، یعنی زنگ خطر به صدا درآمده است.

اجزای سیستم: برای خرید چه چیزهایی نیاز داریم؟

اگر فردا تصمیم گرفتید این سیستم را راه بیندازید، لیست خرید شما شامل این موارد است (این سیستم مثل آناتومی بدن انسان عمل می‌کند):

  1. دستگاه کنترلر مرکزی (مغز): یک جعبه کوچک که معمولاً داخل رک نصب می‌شود. تمام سنسورها به این دستگاه وصل می‌شوند و سیم‌کارت داخل آن قرار می‌گیرد.

  2. سنسور دما و رطوبت (پوست): معمولاً ۲ یا ۳ عدد نیاز دارید (یکی جلوی رک برای هوای ورودی، یکی پشت رک برای هوای خروجی، و یکی وسط اتاق).

  3. سنسور دود و نشت آب (حواس ایمنی): سنسور دود را حتماً روی سقف و سنسور نشت آب را زیر کف کاذب یا زیر کولر نصب کنید.

  4. ماژول GSM (زبان): این حیاتی‌ترین بخش است. وقتی برق می‌رود یا شبکه قطع می‌شود، این ماژول با استفاده از شبکه موبایل به شما SMS می‌دهد.

  5. آژیر و فلاشر: برای اینکه اگر نگهبانی در محل بود، متوجه خطر شود.

فراتر از مانیتورینگ: هوشمندسازی و اتوماسیون (BMS)

سیستم‌های جدید فقط “خبرچین” نیستند، بلکه “مجری” هم هستند. ما به این می‌گوییم BMS (Building Management System) در مقیاس اتاق سرور.

یعنی چه؟ یعنی سیستم آنقدر هوشمند است که اگر دما بالا رفت، معطلِ آمدنِ شما نمی‌شود.

  • مثال: دمای اتاق به ۲۸ درجه می‌رسد -> سیستم به طور خودکار کولر گازی رزرو (Backup) را روشن می‌کند.

  • مثال: برق شهر قطع می‌شود -> سیستم سرورهای غیرضروری را خاموش می‌کند تا باتری UPS برای سرورهای حیاتی بیشتر دوام بیاورد.

این یعنی آرامش مطلق؛ حتی وقتی شما در مسافرت هستید.

راهنمای خرید: نکات مهمی که فروشنده‌ها نمی‌گویند

به عنوان مهندسی که با برندهای مختلف (ایرانی و خارجی) کار کرده‌ام، موقع خرید حتماً این ۳ مورد را چک کنید:

  1. پشتیبانی از پروتکل SNMP: اگر شبکه بزرگی دارید، دستگاه مانیتورینگ شما باید زبان شبکه (SNMP) را بلد باشد تا بتوانید آن را به نرم‌افزارهایی مثل Zabbix یا SolarWinds وصل کنید و همه چیز را یکجا ببینید. (همانطور که در نقشه‌های شبکه می‌بینید، یکپارچگی اجزا بسیار مهم است).

  2. دیتالاگر (Data Logger) داخلی: دستگاه باید حافظه داشته باشد تا دمای یک سال گذشته را ذخیره کند. این نمودارها موقع خرابی تجهیزات یا ممیزی‌ها (Audit) طلا هستند.

  3. قابلیت کار با باتری داخلی: دستگاه مانیتورینگ باید باتری داخلی داشته باشد. خنده‌دار است اگر برق برود و خودِ دستگاه مانیتورینگ خاموش شود و نتواند به شما خبر بدهد که برق رفته!

سخن آخرِ مهندس توکلی

دوست من، مدیر عزیز!

هزینه راه‌اندازی یک سیستم مانیتورینگ کامل و استاندارد، شاید به اندازه قیمت یک عدد هارد دیسک سرور شما باشد. اما نبودنش می‌تواند کل دیتاسنتر، دیتای مشتریان و آبروی شرکت را یک‌شبه به باد بدهد.

به عنوان کسی که بارها دیده‌ام مدیران بعد از حادثه با چه حسرتی به تجهیزات سوخته نگاه می‌کنند، توصیه برادرانه‌ام این است:

تا چراغی قرمز نشده و دودی بلند نشده، برای نصب این “بیمه عمر” اقدام کنید.

اگر سوالی در مورد انتخاب برند یا استانداردها دارید، در بخش نظرات بپرسید؛ خودم شخصاً پاسخ می‌دهم.

سوالات متداول

اگر اینترنت قطع شود، سیستم چگونه هشدار می‌دهد؟
دستگاه مانیتورینگ دارای ماژول GSM داخلی (سیم‌کارت) است که مستقل از شبکه اینترنت عمل می‌کند. در صورت قطع شبکه، هشدارها از طریق پیامک (SMS) و تماس تلفنی مستقیم ارسال می‌شوند.

بله، تمامی سنسورها و کنترلرهای ما از پروتکل استاندارد SNMP پشتیبانی می‌کنند. شما می‌توانید به راحتی OIDهای دستگاه را در نرم‌افزارهای مانیتورینگ شبکه مثل Zabbix یا PRTG اضافه کنید.

بله، تمامی سنسورها و کنترلرهای ما از پروتکل استاندارد SNMP پشتیبانی می‌کنند. شما می‌توانید به راحتی OIDهای دستگاه را در نرم‌افزارهای مانیتورینگ شبکه مثل Zabbix یا PRTG اضافه کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *