{{tag>[loki docker swarm promtail grafana monitoring fluentd fluent-bit prometheus}}

====== Мониторинг ======

{{:software:67567.jpg?600|}}

Мониторинг IT-инфраструктуры (ИТ-мониторинг) — это процесс постоянного сбора, обработки и анализа данных о состоянии элементов ИТ-среды: серверов, сетевых устройств, приложений, каналов связи и других компонентов. Цель — обеспечить стабильность, безопасность и эффективность инфраструктуры, своевременно выявлять и устранять проблемы. 

  * Минимизация времени простоя — быстрая реакция на проблемы (перезапуск служб, уведомление администраторов, автоматизированные действия) сокращает время простоя.
  * Снижение операционных расходов — автоматизация контроля сети, серверов, приложений уменьшает нагрузку на сотрудников, сокращает число ручных проверок.
  * Улучшение пользовательского опыта — стабильная работа систем влияет на удовлетворённость клиентов и сотрудников, мониторинг помогает обеспечивать оптимальное время ответа приложений и сервисов.
  * Планирование развития инфраструктуры — анализ исторических данных и трендов позволяет прогнозировать будущие потребности в ресурсах и планировать развитие ИТ-инфраструктуры.

===== Программы =====

Grafana, Promtail, Loki, Prometheus, Fluent Bit, Fluentd, Kibana, Logstah, Elasticsearch, ELK, Zabbix, Alloy.

==== Рекомендации ====

  * Использовать Fluentd или Fluent Bit, которые умеют отправлять данные в Loki. В отличие от Promtail они имеют готовые парсеры практически для любого вида лога и справляются в том числе с multiline-логами.

===== Программные средства =====


  * [[system:universal]]
  * [[.monitoring:promtail-loki-grafana]]
  * [[.monitoring:fluent-bit-loki-grafana]]
  * [[.monitoring:fluent-bit-fluentd-loki-grafana]]
  * [[.monitoring:prometheus]]
  * [[system:ctop]]
  * [[system:htop]]
  * [[system:iotop]]
  * [[software:iperf3]]
  * [[:lsof]]
  * [[system:elasticsearch:logstash]]
  * [[:lm-sensors]]
  * [[mysql:mytop]]
  * [[network:netstat]]
  * [[system:rsyslog]]
  * [[:tcpdump]]
  * [[system:top]]
  * [[system:watch]]
  * [[ping:zabbix]]
  * [[system:vmstat]]
  * [[:software:monitoring:promtail]]
  * [[software:monitoring:fluent-bit]]
  * [[system:syslog]]