چشم بینای دیتاسنتر شما در ۲۴ ساعت شبانه روز
بسیاری از حوادث اتاق سرور (مانند آتشسوزی یا خرابی سرورها) ناشی از تغییرات ناگهانی دما، نشتی آب کولر یا نوسانات برق است که اگر به موقع شناسایی شوند، قابل پیشگیری هستند. سامانه مانیتورینگ محیطی (EMS) طراحی شده توسط DCI24، مانند یک نگهبان هوشمند عمل میکند. این سیستم با جمعآوری دادهها از سنسورهای مختلف، وضعیت اتاق سرور را تحلیل کرده و در صورت عبور از آستانههای مجاز، بلافاصله از طریق **SMS، تماس صوتی، ایمیل و آژیر** به مدیران شبکه هشدار میدهد.
سنسورهای حیاتی اتاق سرور
دما و رطوبت
کنترل دقیق دما (۲۰-۲۴)
نشتی آب
تشخیص نشتی زیر کولرها و کف کاذب (طنابی/نقطهای)
دود و حریق
تشخیص اولیه دود قبل از فعال شدن سیستم اطفاء
وضعیت برق
نظارت بر ولتاژ، جریان و وضعیت باطری UPS
تردد و درب
هشدار باز ماندن درب و ورود افراد غیرمجاز
حرکت
سنسور PIR برای تشخیص حضور در ساعات غیرکاری
ویژگیهای نرمافزار مانیتورینگ DCI24
-
داشبورد تحت وب و موبایل
دسترسی به وضعیت لحظهای دیتاسنتر از هر نقطه جهان با رابط کاربری گرافیکی. -
گزارشگیری (Data Logging)
ذخیره نمودار دما و رطوبت تا ۱ سال جهت تحلیل عملکرد کولرها. -
کنترلر هوشمند (Automation)
قابلیت فرمان دادن به کولر رزرو در صورت خرابی کولر اصلی یا افزایش دما.
مشخصات فنی دستگاه کنترلر
| پروتکلهای ارتباطی | SNMP v1/v2/v3, Modbus TCP/RTU, MQTT |
| روشهای هشدار | GSM (SMS/Call), Email (SMTP), Siren, Telegram Bot |
| ورودی/خروجی | 8 ورودی دیجیتال، 4 ورودی آنالوگ، 4 خروجی رلهای (قابل ارتقا) |
| منبع تغذیه | 12V/24V DC با باطری پشتیبان داخلی (تا 6 ساعت) |
سلام، من میلاد توکلی هستم. بگذارید بحث را با بدترین خاطره دوران کاریام شروع کنم. حدود ۸ سال پیش، ساعت ۳ بامداد موبایلم زنگ خورد. نگهبان ساختمان بود. با صدایی لرزان گفت: «مهندس! از زیر در اتاق سرور داره دود میاد بیرون!»
تا من خودم را برسانم، کار از کار گذشته بود. ماجرا چه بود؟ کولر اسپلیت اصلی سوخته بود، دمای اتاق به بالای ۶۰ درجه رسیده بود و یکی از پاورهای سرور آتش گرفته بود. آن شب ما فقط سختافزار از دست ندادیم؛ ما اعتبارمان را جلوی مشتریها از دست دادیم چون سرویسها ۳ روز قطع بود.
آن شب درس بزرگی گرفتم: «اتاق سرور بدون مانیتورینگ، مثل رانندگی در جاده مهآلود با چراغ خاموش است.»
امروز میخواهم به عنوان کسی که ۱۵ سال است مسئولیت نگهداری دیتاسنترهای مختلف را دارم، با شما بیپرده صحبت کنم. اگر فکر میکنید مانیتورینگ محیطی یک کالای لوکس است، سخت در اشتباهید. این سیستم، بیمه عمر کسبوکار شماست.
سیستم مانیتورینگ اتاق سرور (EMS) دقیقاً چیست؟
بیایید یک سوءتفاهم بزرگ را حل کنیم. خیلی از مدیران به من میگویند: “مهندس توکلی! ما که سولارویندز (SolarWinds) داریم، وضعیت شبکه را میبینیم، چه نیازی به این دستگاههاست؟”
ببینید دوستان، ما دو نوع مانیتورینگ داریم:
مانیتورینگ شبکه (نرمافزاری): مثل کیلومترشمار ماشین است. به شما میگوید سرعت اینترنت چقدر است، پینگ تایم چقدر است یا سرور روشن است یا نه.
مانیتورینگ محیطی یا EMS (سختافزاری): مثل آمپر آب ماشین است. به شما میگوید که موتور (سرور) دارد جوش میآورد!
سیستم مانیتورینگ اتاق سرور (Environmental Monitoring System)، مجموعهای از سنسورها و دستگاههاست که شرایط فیزیکی اتاق (دما، رطوبت، برق، دود، تردد) را لحظهبهلحظه چک میکند. اگر شرایط از حالت نرمال خارج شود، قبل از اینکه فاجعه رخ دهد، با اساماس، تماس یا آژیر به شما خبر میدهد تا به دادش برسید.
چرا اتاق سرور به مانیتورینگ نیاز دارد؟ (۴ قاتل خاموش)
بر اساس تجربهی من، تجهیزات شبکه ۴ دشمن خونی دارند که اگر حواستان نباشد، بیسروصدا سرمایه شما را نابود میکنند:
۱. دما (قاتل بیرحم)
تجهیزات الکترونیکی از گرما متنفرند. یک قانون نانوشته داریم که میگوید: «به ازای هر ۱۰ درجه افزایش دما بالای استاندارد، عمر سرور شما ۵۰٪ کم میشود.»
تصور کنید کولر گازی درست زمانی که شرکت تعطیل است خراب شود (مثلاً پنجشنبه عصر). بدون سیستم مانیتورینگ، دما در عرض یک ساعت جهنمی میشود و هارد دیسکها و CPUها عملاً کباب میشوند. سیستم مانیتورینگ، دقیقاً همان لحظهای که دما ۲ درجه از حد مجاز بالاتر رفت، به شما پیامک میدهد.
۲. رطوبت (دشمن دوچهره)
رطوبت هم کماش دردسر است، هم زیادش:
رطوبت خیلی کم (خشکی): باعث ایجاد الکتریسیته ساکن (ESD) میشود. دیدهاید وقتی دستگیره در را میگیرید جرقه میزند؟ همین جرقه کوچک میتواند مادربرد سرور چند صد میلیونی را بسوزاند.
رطوبت خیلی زیاد: باعث میعان آب، زنگزدگی پینها و در نهایت اتصال کوتاه میشود.
۳. نشت آب (خطر از بالا و پایین)
شاید بگویید اتاق سرور ما که لوله آب ندارد! اما تجربه به من ثابت کرده همیشه خطر هست. ترکیدن لوله طبقه بالا، نشت آب از خودِ پنل کولر گازی یا حتی نفوذ آب باران. سنسور نشت آب، حتی یک قطره آب را هم روی زمین تشخیص میدهد و قبل از اینکه کف کاذب تبدیل به استخر شود، خبرتان میکند.
۴. برق و UPS (توهم امنیت)
بارها دیدهام برق شهری قطع شده، اما UPS عمل نکرده چون باتریهایش فاسد شده بودند و کسی خبر نداشت. سیستم مانیتورینگ هوشمند، ولتاژ ورودی و خروجی و سلامت باتریها را دائماً چک میکند تا در لحظه حساس قطع برق، دستتان در پوست گردو نماند.
استانداردهای حیاتی (اعداد طلایی ASHRAE)
من همیشه در پروژهها طبق استاندارد جهانی ASHRAE (بخوانید اَشرِی – انجمن مهندسان گرمایش و سرمایش آمریکا) عمل میکنم. لازم نیست خودتان را درگیر جداول پیچیده کنید، فقط این اعداد طلایی را به خاطر بسپارید:
دمای ایدهآل: بین ۲۰ تا ۲۴ درجه سانتیگراد. (زیر ۱۸ درجه پول برق را دور میریزید، بالای ۲۷ درجه ریسک خرابی را میپذیرید).
رطوبت ایدهآل: بین ۴۰ تا ۵۵ درصد.
نقطه شبنم (Dew Point): حداکثر ۱۵ درجه سانتیگراد (برای جلوگیری از قطرات آب).
اگر سیستم مانیتورینگ شما دمایی خارج از این محدوده را نشان داد، یعنی زنگ خطر به صدا درآمده است.
اجزای سیستم: برای خرید چه چیزهایی نیاز داریم؟
اگر فردا تصمیم گرفتید این سیستم را راه بیندازید، لیست خرید شما شامل این موارد است (این سیستم مثل آناتومی بدن انسان عمل میکند):
دستگاه کنترلر مرکزی (مغز): یک جعبه کوچک که معمولاً داخل رک نصب میشود. تمام سنسورها به این دستگاه وصل میشوند و سیمکارت داخل آن قرار میگیرد.
سنسور دما و رطوبت (پوست): معمولاً ۲ یا ۳ عدد نیاز دارید (یکی جلوی رک برای هوای ورودی، یکی پشت رک برای هوای خروجی، و یکی وسط اتاق).
سنسور دود و نشت آب (حواس ایمنی): سنسور دود را حتماً روی سقف و سنسور نشت آب را زیر کف کاذب یا زیر کولر نصب کنید.
ماژول GSM (زبان): این حیاتیترین بخش است. وقتی برق میرود یا شبکه قطع میشود، این ماژول با استفاده از شبکه موبایل به شما SMS میدهد.
آژیر و فلاشر: برای اینکه اگر نگهبانی در محل بود، متوجه خطر شود.
فراتر از مانیتورینگ: هوشمندسازی و اتوماسیون (BMS)
سیستمهای جدید فقط “خبرچین” نیستند، بلکه “مجری” هم هستند. ما به این میگوییم BMS (Building Management System) در مقیاس اتاق سرور.
یعنی چه؟ یعنی سیستم آنقدر هوشمند است که اگر دما بالا رفت، معطلِ آمدنِ شما نمیشود.
مثال: دمای اتاق به ۲۸ درجه میرسد -> سیستم به طور خودکار کولر گازی رزرو (Backup) را روشن میکند.
مثال: برق شهر قطع میشود -> سیستم سرورهای غیرضروری را خاموش میکند تا باتری UPS برای سرورهای حیاتی بیشتر دوام بیاورد.
این یعنی آرامش مطلق؛ حتی وقتی شما در مسافرت هستید.
راهنمای خرید: نکات مهمی که فروشندهها نمیگویند
به عنوان مهندسی که با برندهای مختلف (ایرانی و خارجی) کار کردهام، موقع خرید حتماً این ۳ مورد را چک کنید:
پشتیبانی از پروتکل SNMP: اگر شبکه بزرگی دارید، دستگاه مانیتورینگ شما باید زبان شبکه (SNMP) را بلد باشد تا بتوانید آن را به نرمافزارهایی مثل Zabbix یا SolarWinds وصل کنید و همه چیز را یکجا ببینید. (همانطور که در نقشههای شبکه میبینید، یکپارچگی اجزا بسیار مهم است).
دیتالاگر (Data Logger) داخلی: دستگاه باید حافظه داشته باشد تا دمای یک سال گذشته را ذخیره کند. این نمودارها موقع خرابی تجهیزات یا ممیزیها (Audit) طلا هستند.
قابلیت کار با باتری داخلی: دستگاه مانیتورینگ باید باتری داخلی داشته باشد. خندهدار است اگر برق برود و خودِ دستگاه مانیتورینگ خاموش شود و نتواند به شما خبر بدهد که برق رفته!
سخن آخرِ مهندس توکلی
دوست من، مدیر عزیز!
هزینه راهاندازی یک سیستم مانیتورینگ کامل و استاندارد، شاید به اندازه قیمت یک عدد هارد دیسک سرور شما باشد. اما نبودنش میتواند کل دیتاسنتر، دیتای مشتریان و آبروی شرکت را یکشبه به باد بدهد.
به عنوان کسی که بارها دیدهام مدیران بعد از حادثه با چه حسرتی به تجهیزات سوخته نگاه میکنند، توصیه برادرانهام این است:
تا چراغی قرمز نشده و دودی بلند نشده، برای نصب این “بیمه عمر” اقدام کنید.
اگر سوالی در مورد انتخاب برند یا استانداردها دارید، در بخش نظرات بپرسید؛ خودم شخصاً پاسخ میدهم.
سوالات متداول
اگر اینترنت قطع شود، سیستم چگونه هشدار میدهد؟
آیا میتوانم نرمافزار مانیتورینگ Zabbix یا SolarWinds را به این سیستم متصل کنم؟
بله، تمامی سنسورها و کنترلرهای ما از پروتکل استاندارد SNMP پشتیبانی میکنند. شما میتوانید به راحتی OIDهای دستگاه را در نرمافزارهای مانیتورینگ شبکه مثل Zabbix یا PRTG اضافه کنید.
سنسور نشتی آب چگونه نصب میشود؟
بله، تمامی سنسورها و کنترلرهای ما از پروتکل استاندارد SNMP پشتیبانی میکنند. شما میتوانید به راحتی OIDهای دستگاه را در نرمافزارهای مانیتورینگ شبکه مثل Zabbix یا PRTG اضافه کنید.