Мониторинг активного сетевого оборудования средствами The Dude. Part1. Установка и настройка
По долгу службы много и плотно работаю с активным сетевым оборудованием. В частности, одна из задач — мониторинг >7000 устройств различных вендоров: Cisco, Juniper, D-Link, Huawei, Edge-core, etc.
У каждой компании, имеющей в своем арсенале парк серверов + активное сетевое оборудование стоит задача отслеживать его работоспособность, минимизировать время простоя при аварии и решать прочие моменты. Помимо хорошего сетевого инженера, а если компания большая, то и СПД, нужен удобный инструмент для автоматического траблшутинга большинства стандартных проблем и их решения, эскалации.
В связи с этим, хочу рассказать вам (А возможно и начать цикл статей, если хабрасообщество одобрит) о бесплатном и полнофункциональном решении для мониторинга от компании Mikrotik — The Dude. Или как ее называют в русскоязычном сегменте — Дуда.
Какие задачи могут выполняться посредством The Dude? Да любые, которые подразумевают под собой мониторинг и траблшутинг оборудования. Это могут быть обычные win и nix хосты, сервера, оргтехника, коммутаторы, рутеры… Список можно продолжать бесконечно. Мониторинг сервисов согласно SLA, если вы (I)SP? Не вопрос! Оповещение по почте, или SMS? Тоже не проблема. Обычный ICMP-поллинг, или алгоритмы, направленные на выявление какой-то особой проблемы? Не вопрос.
Основные возможности
- ICMP-polling
- TCP/UDP-polling
- Syslog-server
- Syslog-sender
- SNMP-polling
- Карты сети
- Распределенный мониторинг
- Встроенный язык для написания функций опроса
- Запуск программ на удаленной машине с передачей контекстных параметров.
Почему не Nagios, Zabbix, NetView, Cacti, или Enterprise решение? (как пример — Equipment Manager от компании Orange Systems).
Простота первоначальной настройки, интуитивный интерфейс, минимум временнЫх и денежных затрат на внедрение(для офиса в полсотни компов и пары-тройки коммутаторов затраты вообще минимальны как по времени, так и по деньгам), кроссплатформа, расширяемый функционал, масштабируемость, типизация устройств на основе автоопроса и нетребовательность к ресурсам. Для сетки в 200-300 устройств будет достаточно p3-800MHz 512Mb RAM.
В качестве примера приведу случай из жизни:
Физически вышел из строя сервер с TheDude, который мониторил 2 с лишним тысячи устройств. За 10(!) минут был развернут бекап на моей виртуальной машине с Win2k, ограниченной 512Mb оперативной памяти и дежурные службы, после того как перебили IP в клиенте, продолжили работу в штатном режиме до момента восстановления (~4ч).
Сервер даже не подтормаживал.
Кто заинтересовался — добро пожаловать под хабракат
Установка:
Поддерживаемые ОС
- Windows(клиент, сервер)
- RouterOS(сервер)
Это также означает, что TheDude устанавливается на RouterBoard’ы - Linux(клиент, сервер). Только через wine. Работу из под wine в качестве сервера не тестировал, но он запускается и поллит. Если кому-то интересно, могу протестировать и предоставить подробный отчет.
Последовательность действий при установке:
- RouterOS:
Я рассмотрю здесь вариант, когда у нас нет машины с windows, чтобы для установки пакета на RouterOS воспользоваться графической утилитой winbox. Она, конечно, работает под wine, но не дает возможности из под wine установить пакет на RouterOS. Воспользуемся для этого SCP и RouterOS CLI.
Основные настройки (Глобальные)
Когда мы установили наш сервер с The Dude — нам его нужно настроить.
Для этого в клиенте есть кнопка… Правильно, «Настройки».
Вкладки:
- Общий
Здесь указываются DNS сервера, которые могут/будут резолвить адреса устройств, а так же SMTP-сервер, через который будут посылаться оповещения о событиях, при необходимости - SNMP
Здесь мы указываем профили SNMP, с помощью которых будут поллится наши устройства. Профиль включает комьюнити, порт и версию - Опроc
Настройки поллинга устройств (интервал, таймаут, количество циклов), настройки оповещений, логирования при изменении статуса сервиса, повешенного на устройство( для заббикса аналогом будет «триггер») - Сервер
Здесь мы конфигурим файрволл. Также здесь включается WEB-интерфейс мониторинга, натраивается время обновления информации в нем, таймаут сессии, указывается SSL-сертификат. - Агенты
Распределенный мониторинг. В качестве агента указывается Dude-сервер с такой же версией, как и настраиваемый. - Syslog
Здесь все банально. настройка syslog-сервера. - Карта
Настройка визуального отображения объектов (размер, шрифт, форма, время обновления текстовой информации, цвет). - Диаграмма
Настройка RDD-хранилища и цветов на графиках - Отчет
- Обнаружение
Настройка автообнаружения и расположения устройств на карте в автоматическом режиме - RouterOS
Настройки сессий для устройств на базе RouterOS, находящихся на мониторинге в The Dude - Разное
Здесь находятся настройки коммита в базу, прыжков отмены, определение вендора по найденному маку, интервал сканирования мак-адресов устройств.
IP демо-сервера 159.148.147.209
Тип коннекта: Защищенный
Логин: admin