Исправление проблем Docker:
crash loop, OOM, exit codes
Контейнер падает с ошибкой 137 или перезапускается каждые 3 минуты? Senior DevOps-инженер диагностирует и исправляет корневую причину сегодня.
С чем мы работаем?
Exit code 137 / OOMKilled — Linux убивает контейнер за превышение лимитов памяти
Crash loop — контейнер рестартует бесконечно из-за ошибок ENTRYPOINT или зависимостей
Permission denied на volume mount — несовпадение UID/GID между хостом и контейнером
Конфликты портов и сетевые ошибки — контейнер не видит другие сервисы или внешний мир
Что входит в услугу
Глубокая диагностика
Анализ логов, событий и системного журнала для поиска реальной причины сбоя.
Heap Dump & Профилирование
Для Node.js, Java или Python находим утечки памяти, вызывающие OOMKilled.
Code & Config Fix
Исправление Dockerfile, docker-compose.yml или .env файлов для стабильной работы.
Тюнинг лимитов
Настройка корректных лимитов CPU и RAM для предотвращения деградации системы.
Telegram Мониторинг
Настройка мгновенного алерта в ваш Telegram при следующем падении контейнера.
Документация
Отчёт о проделанной работе и рекомендации по предотвращению подобных ошибок в будущем.
Кейс: Утечка памяти в Node.js
Crash loop устранён за 47 минут
Приложение падало каждые 3 минуты. Диагностика выявила утечку в WebSocket-хендлере (340к накопленных listeners). Исправили код и лимиты.