Monitoring/Prometheus
[Prometheus] Docker 메트릭 수집하기
박만자
2022. 7. 28. 21:36
Promtheus에서 Docker 메트릭을 수집하여 모니터링할 수 있습니다. 다만 Docker에서 기본적으로 제공하지는 않으므로 추가적인 설정이 필요합니다.
Docker 메트릭 수집
아래 예제는 AWS EC2(Amazon Linux 2)에서 진행하였습니다.
JSON 파일 설정
다음과 같이 vi 편집기로 daemon.json 파일을 열어줍니다.
$ sudo vi /etc/docker/daemon.json
아래와 같이 코드를 작성한 후 저장합니다. 공식 문서에서는 9323포트를 권장하지만 다른 포트를 사용하셔도 무방합니다.
{
"metrics-addr" : "0.0.0.0:9323",
"experimental" : true
}
docker를 재실행 합니다.
$ systemctl restart docker
/metrics 경로로 요청을 보내 정상적으로 작동하는지 확인합니다.
$ curl localhost:9323/metrics
# HELP builder_builds_failed_total Number of failed image builds
# TYPE builder_builds_failed_total counter
builder_builds_failed_total{reason="build_canceled"} 0
builder_builds_failed_total{reason="build_target_not_reachable_error"} 0
builder_builds_failed_total{reason="command_not_supported_error"} 0
builder_builds_failed_total{reason="dockerfile_empty_error"} 0
builder_builds_failed_total{reason="dockerfile_syntax_error"} 0
builder_builds_failed_total{reason="error_processing_commands_error"} 0
builder_builds_failed_total{reason="missing_onbuild_arguments_error"} 0
builder_builds_failed_total{reason="unknown_instruction_error"} 0
# HELP builder_builds_triggered_total Number of triggered image builds
# TYPE builder_builds_triggered_total counter
builder_builds_triggered_total 0
# HELP engine_daemon_container_actions_seconds The number of seconds it takes to process each container action
# TYPE engine_daemon_container_actions_seconds histogram
engine_daemon_container_actions_seconds_bucket{action="changes",le="0.005"} 1
engine_daemon_container_actions_seconds_bucket{action="changes",le="0.01"} 1
.
.
.
# HELP swarm_store_write_tx_latency_seconds Raft store write tx latency.
# TYPE swarm_store_write_tx_latency_seconds histogram
swarm_store_write_tx_latency_seconds_bucket{le="0.005"} 0
swarm_store_write_tx_latency_seconds_bucket{le="0.01"} 0
swarm_store_write_tx_latency_seconds_bucket{le="0.025"} 0
swarm_store_write_tx_latency_seconds_bucket{le="0.05"} 0
swarm_store_write_tx_latency_seconds_bucket{le="0.1"} 0
swarm_store_write_tx_latency_seconds_bucket{le="0.25"} 0
swarm_store_write_tx_latency_seconds_bucket{le="0.5"} 0
swarm_store_write_tx_latency_seconds_bucket{le="1"} 0
swarm_store_write_tx_latency_seconds_bucket{le="2.5"} 0
swarm_store_write_tx_latency_seconds_bucket{le="5"} 0
swarm_store_write_tx_latency_seconds_bucket{le="10"} 0
swarm_store_write_tx_latency_seconds_bucket{le="+Inf"} 0
swarm_store_write_tx_latency_seconds_sum 0
swarm_store_write_tx_latency_seconds_count 0
위와 같이 Docker 엔진(daemon)에 관한 메트릭부터 Docker Swarm에 관한 메트릭까지 제공합니다.
이제 Prometheus에서 해당 메트릭을 수집해 모니터링 환경을 구성할 수 있습니다.
Prometheus 타겟 설정
다음과 같이 Prometheus YAML파일을 구성합니다. 위에서 설정한 Docker 데몬을 타겟으로 지정합니다.
global:
scrape_interval: 15s
evaluation_interval: 15s
scrape_configs:
- job_name: "Docker"
static_configs:
- targets: ["localhost:9323"]
Prometheus를 실행한 후 메트릭을 잘 불러오는지 확인합니다.
참고