카카오클라우드의 Monitoring 서비스에서 제공하는 메트릭을 설명합니다.
Virtual Machine, GPU, Bare Metal Server에서 공통으로 수집되는 주요 시스템 리소스 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: 커스텀 대시보드, 메트릭 탐색기, Metric Export
- Alert Center: 메트릭 기반 알림 정책 설정
- CPU 및 메모리
- 디스크 I/O 및 용량
- 네트워크
- GPU 전용 메트릭
| 메트릭 이름 | 설명 | 단위 | 권장 용도 |
|---|
| cpu_usage | 전체 CPU 사용률 | % | 주요 성능 지표 |
| cpu_usage_user | CPU 사용률 (사용자 프로세스) | % | 사용자 프로세스 부하 확인 |
| cpu_usage_system | CPU 사용률 (시스템 커널) | % | 커널/시스템 부하 확인 |
| cpu_usage_iowait | CPU 사용률 (I/O 대기) | % | I/O 병목 현상 진단 |
| cpu_usage_per_core | 코어별 CPU 사용률 | % | 코어별 부하 불균형 확인 |
| mem_usage | 자체 메모리 사용률 | % | 주요 메모리 경고 |
| mem_used | 사용 중인 메모리 크기 | bytes(IEC) | 절대적 사용량 확인 |
| mem_buffered | 메모리 사용량 (버퍼) | bytes(IEC) | 리눅스 전용 |
| mem_cached | 메모리 사용량 (캐시) | bytes(IEC) | 리눅스 전용 |
| 메트릭 이름 | 설명 | 단위 | 권장 용도 |
|---|
| disk_used_percent | 디스크 사용률 | % | 용량 부족 알림 |
| disk_used | 디스크 사용량 | bytes(IEC) | 절대적 사용량 확인 |
| disk_read_bytes_persec | 초당 디스크 읽기 바이트 크기 | bytes/s(IEC) | 읽기 성능 지연 확인 |
| disk_write_bytes_persec | 초당 디스크 쓰기 바이트 크기 | bytes/s(IEC) | 쓰기 성능 지연 확인 |
| disk_read_iops | 초당 디스크 읽기 작업 완료 수 (IOPS) | count/s | 읽기 작업 부하 확인 |
| disk_write_iops | 초당 디스크 쓰기 작업 완료 수 (IOPS) | count/s | 쓰기 작업 부하 확인 |
| disk_inodes_usage | 디스크 inode 사용률 | % | inode 부족 경고 (Linux) |
| disk_free | 사용 가능한 디스크 용량 | bytes(IEC) | 참고 정보 |
| disk_total | 디스크 총 용량 | bytes(IEC) | 참고 정보 |
| disk_inodes_free | 사용 가능한 inode 수 | count | 참고 정보 |
| disk_inodes_total | 총 예약된 inode 수 | count | 참고 정보 |
| disk_inodes_used | inode 사용량 | count | 참고 정보 |
| 메트릭 이름 | 설명 | 단위 | 권장 용도 |
|---|
| network_rx_bytes_persec | 네트워크 인터페이스에서 받은 초당 바이트 크기 | bytes/s(IEC) | 수신 트래픽 확인 |
| network_tx_bytes_persec | 네트워크 인터페이스에서 보낸 초당 바이트 크기 | bytes/s(IEC) | 송신 트래픽 확인 |
| network_rx_packets_persec | 네트워크 인터페이스에서 받은 초당 패킷 수 | packets/s | 수신 패킷 부하 확인 |
| network_tx_packets_persec | 네트워크 인터페이스에서 보낸 초당 패킷 수 | packets/s | 송신 패킷 부하 확인 |
| 메트릭 이름 | 설명 | 단위 | 권장 용도 |
|---|
| nvidia_smi_utilization_gpu | GPU 코어별 사용률 | % | GPU 성능 부하 확인 |
| nvidia_smi_memory_used | GPU 코어별 사용 중인 메모리 | MiB(IEC) | GPU 메모리 사용량 확인 |
| nvidia_smi_memory_free | GPU 코어별 사용 가능한 메모리 | MiB(IEC) | GPU 메모리 여유분 확인 |
| nvidia_smi_memory_total | GPU 코어별 전체 메모리 | MiB(IEC) | GPU 메모리 총량 확인 |
| nvidia_smi_power_draw | GPU 코어별 전력 소비량 | watt | 전력 사용량 확인 |
mem_buffered, mem_cached, disk_inodes_usage 메트릭은 Linux OS가 설치된 서버에서만 수집 및 제공됩니다.
nvidia_smi 메트릭은 GPU가 장착된 서버에서만 수집됩니다.
- GPU 인스턴스 라이브러리 호환성: GPU 인스턴스의 NVIDIA 라이브러리를 업데이트할 경우, CUDA 버전과 호환성을 반드시 확인하세요. 호환되지 않는 경우, 모니터링 에이전트가 NVIDIA 메트릭을 수집하지 못할 수 있습니다.
- 네트워크 알림 정책:
network_rx_bytes_persec 메트릭으로 Alert Center 알림 정책을 설정할 경우, 해당 정책은 모든 네트워크 인터페이스에 적용됩니다. 다중 NIC 인스턴스에서는 연결된 인터페이스 중 하나라도 설정된 임계치를 초과하면 알림이 발송됩니다.
Libvirt 메트릭
Libvirt 환경에서 수집되는 가상화 기반 서버의 주요 리소스 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: Metric Export
- Alert Center: 메트릭 기반 알림 정책 설정
- CPU 및 메모리
- 디스크 I/O 및 용량
- 네트워크
| 메트릭 이름 | 설명 | 단위 |
|---|
| libvirt_domain_info_cpu_time_seconds_total | 사용한 총 CPU 시간 | count |
| libvirt_domain_info_virtual_cpus | CPU 코어 수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| libvirt_domain_block_stats_read_bytes_total | 디스크에서 읽은 바이트 크기 | bytes(IEC) |
| libvirt_domain_block_stats_write_bytes_total | 디스크에서 쓴 바이트 크기 | bytes(IEC) |
| 메트릭 이름 | 설명 | 단위 |
|---|
| libvirt_domain_interface_stats_receive_bytes_total | 네트워크 인터페이스에서 받은 바이트 크기 | bytes(IEC) |
| libvirt_domain_interface_stats_transmit_bytes_total | 네트워크 인터페이스에서 보낸 바이트 크기 | bytes(IEC) |
| libvirt_domain_interface_stats_receive_packets_total | 네트워크 인터페이스에서 받은 패킷 수 | packets |
| libvirt_domain_interface_stats_transmit_packets_total | 네트워크 인터페이스에서 보낸 패킷 수 | packets |
| libvirt_domain_interface_stats_receive_drops_total | 네트워크 인터페이스에서 받지 못한 패킷 수 | packets |
버스터블 인스턴스 전용 메트릭
다음 메트릭은 버스터블(Burstable) 옵션이 적용된 t1i 계열 인스턴스에서만 수집됩니다. (단, t1i.medium.dns.default 타입은 제외)
| 메트릭 이름 | 설명 | 단위 |
|---|
| cpu_credit_usage | 누적된 CPU 크레딧 사용량으로 기준 성능을 초과하여 CPU를 사용할 때 소비된 크레딧 양 | count |
| cpu_credit_balance | 현재 인스턴스에 남아 있는 CPU 크레딧 잔여량으로 기준 성능 이하로 동작할 때 적립 | count |
Kubernetes Engine 메트릭
Kubernetes Engine 환경에서 수집되는 주요 클러스터, 노드, 파드 리소스 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: Metric Export
| 메트릭 이름 | 설명 | 단위 |
|---|
| cluster_autoscaler_node_group_min_count | 노드 그룹의 오토스케일링 시 최소 노드 수 | count |
| cluster_autoscaler_node_group_max_count | 노드 그룹의 오토스케일링 시 최대 노드 수 | count |
| cluster_autoscaler_node_group_target_count | 노드 그룹의 오토스케일링 시 목표 노드 수 | count |
| node_count | 현재 노드 수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| kube_node_status_allocatable | 노드에서 파드에 할당할 수 있는 리소스 양 | none |
| kube_node_status_capacity | 노드의 총 리소스 용량 | none |
| node_cpu_seconds_total | 노드 CPU의 각 모드에서 사용된 시간 | count |
| node_filesystem_avail_bytes | 노드의 루트가 아닌 사용자 영역에서 사용 가능한 파일 시스템 용량 | bytes(IEC) |
| node_filesystem_size_bytes | 노드 파일 시스템의 전체 크기 | bytes(IEC) |
| node_memory_Active_bytes | 현재 사용 중이나 재사용 가능한 메모리(Active) | bytes(IEC) |
| node_memory_Buffers_bytes | 커널의 디스크 I/O 버퍼로 사용되는 메모리 | bytes(IEC) |
| node_memory_Cached_bytes | 파일 시스템 캐시로 사용되는 메모리 | bytes(IEC) |
| node_memory_MemAvailable_bytes | 새 프로세스를 위해 즉시 사용 가능한 메모리 | bytes(IEC) |
| node_memory_MemFree_bytes | 현재 아무런 할당도 되지 않은 메모리 | bytes(IEC) |
| node_memory_MemTotal_bytes | 노드의 총 메모리 용량 | bytes(IEC) |
| node_memory_SReclaimable_bytes | Slab 캐시 중 회수 가능한(Reclaimable) 메모리 | bytes(IEC) |
| node_network_receive_bytes_total | 네트워크 디바이스에서 받은 총 바이트 크기 | bytes(IEC) |
| node_network_transmit_bytes_total | 네트워크 디바이스에서 보낸 총 바이트 크기 | bytes(IEC) |
| 메트릭 이름 | 설명 | 단위 |
|---|
| kube_pod_container_info | 파드 내 컨테이너의 기본 정보 | none |
| kube_pod_container_resource_limits | 컨테이너가 요청한 리소스의 상한값(Limit) | none |
| kube_pod_container_resource_requests | 컨테이너가 요청한 리소스 값(Request) | none |
| kube_pod_container_status_running | 컨테이너의 상태가 Running인지 여부 | count |
| kube_pod_container_status_terminated | 컨테이너의 상태가 Terminated인지 여부 | count |
| kube_pod_info | 파드에 대한 정보 | none |
| container_cpu_usage_seconds_total | 컨테이너가 소비한 총 CPU 시간 | count |
| container_memory_working_set_bytes | 컨테이너가 사용 중이며 OS가 회수할 수 없는 메모리 | bytes(IEC) |
| container_network_receive_bytes_total | 컨테이너가 받은 네트워크 총 바이트 | bytes(IEC) |
| container_network_transmit_bytes_total | 컨테이너가 보낸 네트워크 총 바이트 | bytes(IEC) |
Load Balancing 메트릭
Load Balancer 리소스의 트래픽 및 연결 상태를 모니터링하기 위한 주요 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: 커스텀 대시보드, 메트릭 탐색기, Metric Export
- Alert Center: 메트릭 기반 알림 정책 설정
| 메트릭 이름 | 설명 | 단위 |
|---|
| lb_bytes_in_persec | 초당 인바운드 트래픽(수신 바이트) | bytes/s(IEC) |
| lb_bytes_out_persec | 초당 아웃바운드 트래픽(송신 바이트) | bytes/s(IEC) |
| lb_connections_persec | 초당 연결(Connection) 생성 수 | count/s |
| lb_current_connections | 현재 유지 중인 연결(Connection) 수 | count |
| lb_healthy_host_count | 연결 가능한 정상 대상(Healthy host) 수 | count |
| lb_unhealthy_host_count | 연결 불가능한 비정상 대상(Unhealthy host) 수 | count |
MySQL 메트릭
MySQL 인스턴스의 스토리지, 네트워크, 쿼리, 연결 상태를 모니터링하기 위한 주요 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: 커스텀 대시보드, 메트릭 탐색기, Metric Export
- Alert Center: 메트릭 기반 알림 정책 설정
- 메모리
- 디스크 I/O 및 용량
- 네트워크
- 쿼리
- 커넥션 및 인스턴스
- InnoDB 및 Binary Log
| 메트릭 이름 | 설명 | 단위 |
|---|
| mem_swap_total | 총 swap 메모리 | bytes(IEC) |
| mem_swap_cached | 캐시된 swap 메모리 | bytes(IEC) |
| mem_swap_free | 사용 가능한 swap 메모리 | bytes(IEC) |
| 메트릭 이름 | 설명 | 단위 |
|---|
| mysql_logstorage_disk_write_bytes_persec | 로그 스토리지 디스크에서 초당 쓴 바이트 크기 | bytes/s(IEC) |
| mysql_defaultstorage_disk_write_bytes_persec | 기본 스토리지 디스크에서 초당 쓴 바이트 크기 | bytes/s(IEC) |
| mysql_logstorage_disk_read_bytes_persec | 로그 스토리지 디스크에서 초당 읽은 바이트 크기 | bytes/s(IEC) |
| mysql_defaultstorage_disk_read_bytes_persec | 기본 스토리지 디스크에서 초당 읽은 바이트 크기 | bytes/s(IEC) |
| mysql_logstorage_disk_write_iops | 로그 스토리지 디스크에서 초당 쓰기 작업 완료 수 | count/s |
| mysql_defaultstorage_disk_write_iops | 기본 스토리지 디스크에서 초당 쓰기 작업 완료 수 | count/s |
| mysql_logstorage_disk_read_iops | 로그 스토리지 디스크에서 초당 읽기 작업 완료 수 | count/s |
| mysql_defaultstorage_disk_read_iops | 기본 스토리지 디스크에서 초당 읽기 작업 완료 수 | count/s |
| mysql_logstorage_disk_used | 로그 스토리지 디스크 사용량 | bytes(IEC) |
| mysql_defaultstorage_disk_used | 기본 스토리지 디스크 사용량 | bytes(IEC) |
| mysql_logstorage_disk_used_percent | 로그 스토리지 디스크 사용률 | % |
| mysql_defaultstorage_disk_used_percent | 기본 스토리지 디스크 사용률 | % |
| mysql_logstorage_disk_inodes_usage | 로그 스토리지 inode 사용률 | % |
| mysql_defaultstorage_disk_inodes_usage | 기본 스토리지 inode 사용률 | % |
| mysql_defaultstorage_disk_free | 기본 스토리지 디스크에서 사용 가능한 용량 | bytes(IEC) |
| mysql_defaultstorage_disk_total | 기본 스토리지 디스크 총 용량 | bytes(IEC) |
| mysql_logstorage_disk_free | 로그 스토리지 디스크에서 사용 가능한 용량 | bytes(IEC) |
| mysql_logstorage_disk_total | 로그 스토리지 디스크 총 용량 | bytes(IEC) |
| mysql_defaultstorage_disk_inodes_free | 기본 스토리지 디스크에서 사용 가능한 inode 수 | count |
| mysql_defaultstorage_disk_inodes_total | 기본 스토리지 디스크 총 inode 수 | count |
| mysql_defaultstorage_disk_inodes_used | 기본 스토리지 디스크 inode 사용량 | count |
| mysql_logstorage_disk_inodes_free | 로그 스토리지 디스크에서 사용 가능한 inode 수 | count |
| mysql_logstorage_disk_inodes_total | 로그 스토리지 디스크 총 inode 수 | count |
| mysql_logstorage_disk_inodes_used | 로그 스토리지 디스크 inode 사용량 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| mysql_network_rx_bytes_persec | 네트워크 인터페이스에서 받은 초당 바이트 크기 | bytes/s(IEC) |
| mysql_network_tx_bytes_persec | 네트워크 인터페이스에서 보낸 초당 바이트 크기 | bytes/s(IEC) |
| mysql_network_rx_packets_persec | 네트워크 인터페이스에서 받은 초당 패킷 수 | packets/s |
| mysql_network_tx_packets_persec | 네트워크 인터페이스에서 보낸 초당 패킷 수 | packets/s |
| 메트릭 이름 | 설명 | 단위 |
|---|
| mysql_query_persec | 초당 쿼리 횟수(QPS) | count/s |
| mysql_com_insert_count | 5분 동안 INSERT 쿼리 수행 횟수 | count |
| mysql_com_select_count | 5분 동안 SELECT 쿼리 수행 횟수 | count |
| mysql_com_update_count | 5분 동안 UPDATE 쿼리 수행 횟수 | count |
| mysql_com_delete_count | 5분 동안 DELETE 쿼리 수행 횟수 | count |
| mysql_com_commit_count | 5분 동안 COMMIT 쿼리 수행 횟수 | count |
| mysql_slow_query_count | 5분 동안 수행된 Slow 쿼리 수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| mysql_connections_count | 현재 연결된 Connection 수 | count |
| mysql_max_connections_count | 최대 연결 가능한 Connection 수 | count |
| mysql_connection_usage_percent | 최대 Connection 대비 현재 연결 비율 | % |
| mysql_instance_status | 인스턴스 상태 | count |
| mysql_instance_group_status | 인스턴스 그룹 상태 | count |
| mysql_uptime | 인스턴스 기동 시간 | duration |
| 메트릭 이름 | 설명 | 단위 |
|---|
| mysql_innodb_buffer_pool_read_requests | Buffer Pool 전체 요청 수 | count |
| mysql_innodb_buffer_pool_reads | Buffer Pool에서 직접 읽은 요청 수 | count |
| mysql_innodb_buffer_cache_hit_ratio | Buffer Pool 캐시 히트율 | % |
| mysql_innodb_row_lock_current_waits | 현재 행 잠금 수 | count |
| mysql_innodb_row_lock_time | 행 잠금에 소요된 시간 | milliseconds |
| mysql_binary_size_bytes | Binary Log 크기 | bytes(IEC) |
| mysql_binary_files_count | Binary Log 파일 수 | count |
| mysql_variables_max_binlog_size | 최대 Binary Log 크기 설정값 | bytes(IEC) |
| mysql_replication_lag | Binlog 복제 지연 시간 | seconds |
PostgreSQL 메트릭
PostgreSQL 인스턴스의 디스크, 네트워크, 연결, 트랜잭션 상태를 모니터링하기 위한 주요 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: 커스텀 대시보드, 메트릭 탐색기, Metric Export
- Alert Center: 메트릭 기반 알림 정책 설정
- 디스크 I/O 및 용량
- 네트워크
- 커넥션 및 운영 상태
- 복제 및 트랜잭션
- 성능 및 캐시
| 메트릭 이름 | 설명 | 단위 |
|---|
| pg_defaultstorage_disk_read_bytes_persec | 기본 스토리지 디스크에서 초당 읽은 바이트 크기 | bytes/s(IEC) |
| pg_defaultstorage_disk_write_bytes_persec | 기본 스토리지 디스크에서 초당 쓴 바이트 크기 | bytes/s(IEC) |
| pg_defaultstorage_disk_read_iops | 기본 스토리지 디스크에서 초당 읽기 작업 완료 수 | count/s |
| pg_defaultstorage_disk_write_iops | 기본 스토리지 디스크에서 초당 쓰기 작업 완료 수 | count/s |
| pg_defaultstorage_disk_used | 기본 스토리지 디스크 사용량 | bytes(IEC) |
| pg_defaultstorage_disk_used_percent | 기본 스토리지 디스크 사용률 | % |
| pg_defaultstorage_disk_inodes_usage | 기본 스토리지 inode 사용률 | % |
| pg_defaultstorage_disk_free | 기본 스토리지 디스크에서 사용 가능한 용량 | bytes(IEC) |
| pg_defaultstorage_disk_total | 기본 스토리지 디스크 총 용량 | bytes(IEC) |
| pg_defaultstorage_disk_inodes_free | 기본 스토리지 디스크에서 사용 가능한 inode 수 | count |
| pg_defaultstorage_disk_inodes_total | 기본 스토리지 디스크 총 inode 수 | count |
| pg_defaultstorage_disk_inodes_used | 기본 스토리지 디스크 inode 사용량 | count |
| pg_logstorage_disk_read_bytes_persec | 로그 스토리지 디스크에서 초당 읽은 바이트 크기 | bytes/s(IEC) |
| pg_logstorage_disk_write_bytes_persec | 로그 스토리지 디스크에서 초당 쓴 바이트 크기 | bytes/s(IEC) |
| pg_logstorage_disk_read_iops | 로그 스토리지 디스크에서 초당 읽기 작업 완료 수 | count/s |
| pg_logstorage_disk_write_iops | 로그 스토리지 디스크에서 초당 쓰기 작업 완료 수 | count/s |
| pg_logstorage_disk_used | 로그 스토리지 디스크 사용량 | bytes(IEC) |
| pg_logstorage_disk_used_percent | 로그 스토리지 디스크 사용률 | % |
| pg_logstorage_disk_inodes_usage | 로그 스토리지 inode 사용률 | % |
| pg_logstorage_disk_free | 로그 스토리지 디스크에서 사용 가능한 용량 | bytes(IEC) |
| pg_logstorage_disk_total | 로그 스토리지 디스크 총 용량 | bytes(IEC) |
| pg_logstorage_disk_inodes_free | 로그 스토리지 디스크에서 사용 가능한 inode 수 | count |
| pg_logstorage_disk_inodes_total | 로그 스토리지 디스크 총 inode 수 | count |
| pg_logstorage_disk_inodes_used | 로그 스토리지 디스크 inode 사용량 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| pg_network_rx_bytes_persec | 네트워크 인터페이스에서 받은 초당 바이트 크기 | bytes/s(IEC) |
| pg_network_tx_bytes_persec | 네트워크 인터페이스에서 보낸 초당 바이트 크기 | bytes/s(IEC) |
| pg_network_rx_packets_persec | 네트워크 인터페이스에서 받은 초당 패킷 수 | packets/s |
| pg_network_tx_packets_persec | 네트워크 인터페이스에서 보낸 초당 패킷 수 | packets/s |
| 메트릭 이름 | 설명 | 단위 |
|---|
| pg_total_connections | 전체 커넥션 개수 | count |
| pg_active_connections | 활성 커넥션 개수 | count |
| pg_active_transactions | 활성 트랜잭션 개수 | count |
| pg_lock_sessions | Lock이 발생한 세션 개수 | count |
| pg_total_deadlocks | 데드락 발생 개수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| pg_replication_lag | 복제 지연 시간 | seconds |
| pg_temp_file_ratio | 전체 트랜잭션 대비 임시 파일 비율 | % |
| pg_temp_file_ratio_per_group | 인스턴스 그룹별 임시 파일 비율 | % |
| pg_xid_age | 특정 프로세스의 XID Age | count |
| pg_xid_age_per_group | 인스턴스 그룹별 Vacuum XID Age | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| pg_buffer_hit_ratio | Buffer hit 비율 | % |
MemStore 메트릭
MemStore 인스턴스의 메모리, 네트워크, 복제 및 CPU 사용 상태를 모니터링하기 위한 주요 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: 커스텀 대시보드, 메트릭 탐색기, Metric Export
- Alert Center: 메트릭 기반 알림 정책 설정
- CPU 및 메모리
- 디스크 I/O 및 용량
- 네트워크
- 커넥션 및 동작 상태
- 키 및 캐시 통계
| 메트릭 이름 | 설명 | 단위 |
|---|
| memstore_used_cpu_sys | 전체 시스템 CPU 사용량 | count |
| memstore_used_cpu_sys_main_thread | 메인 스레드의 시스템 CPU 사용량 | count |
| memstore_used_cpu_user | 전체 사용자 CPU 사용량 | count |
| memstore_used_cpu_user_main_thread | 메인 스레드의 사용자 CPU 사용량 | count |
| memstore_memory_usage | 전체 메모리 사용률 | % |
| memstore_used_memory | MemStore가 사용 중인 메모리 크기 | bytes(IEC) |
| memstore_used_memory_peak | 사용한 최대 메모리 | bytes(IEC) |
| memstore_used_memory_peak_perc | 전체 메모리 대비 최대 사용 비율 | % |
| memstore_used_memory_dataset | 실제 데이터 저장에 사용되는 메모리 | bytes(IEC) |
| memstore_used_memory_dataset_perc | 실제 데이터 저장에 사용되는 메모리 비율 | % |
| memstore_used_memory_overhead | 내부 데이터 구조 관리에 필요한 오버헤드 메모리 | bytes(IEC) |
| memstore_used_memory_lua | Lua 스크립트 실행에 사용된 메모리 | bytes(IEC) |
| memstore_allocator_allocated | allocator에 할당된 메모리(내부 단편 포함) | bytes(IEC) |
| memstore_allocator_active | allocator에서 활성화된 메모리(외부 단편 포함) | bytes(IEC) |
| memstore_allocator_resident | allocator에서 관리 중인 resident 메모리 | bytes(IEC) |
| memstore_allocator_rss_bytes | RSS 메모리 크기 | bytes(IEC) |
| memstore_allocator_frag_bytes | 활성 메모리와 할당 메모리의 차이 | bytes(IEC) |
| memstore_allocator_frag_ratio | 활성 메모리 대비 할당 메모리 비율 | % |
| memstore_allocator_rss_ratio | resident 메모리 대비 활성 메모리 비율 | % |
| memstore_mem_fragmentation_bytes | 사용 중인 resident 메모리와 할당된 메모리의 차이 | bytes(IEC) |
| memstore_mem_fragmentation_ratio | 사용 중인 resident 메모리와 할당된 메모리의 비율 | % |
| memstore_rss_overhead_bytes | 프로세스 RSS와 allocator resident 메모리 간의 차이 | bytes(IEC) |
| memstore_rss_overhead_ratio | 프로세스 RSS와 allocator resident 메모리 간의 비율 | % |
| memstore_total_system_memory | MemStore가 실행 중인 시스템의 총 메모리 | bytes(IEC) |
| 메트릭 이름 | 설명 | 단위 |
|---|
| disk_free | 사용 가능한 디스크 용량 | bytes(IEC) |
| disk_total | 디스크 총 용량 | bytes(IEC) |
| disk_inodes_free | 사용 가능한 inode 수 | count |
| disk_inodes_used | 사용 중인 inode 수 | count |
| disk_inodes_total | 총 예약된 inode 수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| memstore_instantaneous_input_kbps | 초당 네트워크 입력 속도 | KiB/s(IEC) |
| memstore_instantaneous_output_kbps | 초당 네트워크 출력 속도 | KiB/s(IEC) |
| memstore_total_net_input_bytes | 총 네트워크 입력 바이트 | bytes(IEC) |
| memstore_total_net_output_bytes | 총 네트워크 출력 바이트 | bytes(IEC) |
| memstore_instantaneous_ops_per_sec | 초당 처리 명령어 수 | count |
| memstore_cmdstat_calls_persec | 초당 명령어 호출 횟수 | count/s |
| memstore_total_commands_processed | 총 처리된 명령어 수 | count |
| memstore_total_reads_processed | 총 처리된 읽기 이벤트 수 | count |
| memstore_total_writes_processed | 총 처리된 쓰기 이벤트 수 | count |
| memstore_io_threaded_reads_processed | I/O 스레드에서 처리된 읽기 이벤트 수 | count |
| memstore_io_threaded_writes_processed | I/O 스레드에서 처리된 쓰기 이벤트 수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| memstore_connected_slaves | 연결된 Replica 수 | count |
| memstore_replication_lag | Replica 복제 지연 시간 | s |
| memstore_clients | 현재 연결된 클라이언트 수 | count |
| memstore_maxclients | 최대로 연결 가능한 클라이언트 수 | count |
| memstore_client_ratio | 최대 클라이언트 대비 현재 연결 비율 | % |
| memstore_blocked_clients | 대기 중인 클라이언트 수(BLPOP 등 명령) | count |
| memstore_cluster_connections | 클러스터 버스에서 사용 중인 소켓 수 | count |
| memstore_cluster_enabled | 클러스터 활성화 여부 | count |
| memstore_pubsub_channels | Pub/Sub 채널 수 | count |
| memstore_pubsub_patterns | Pub/Sub 패턴 수 | count |
| memstore_uptime | 인스턴스 기동 시간 | s |
| 메트릭 이름 | 설명 | 단위 |
|---|
| memstore_keyspace_hits | 적중한 키 수 | count |
| memstore_keyspace_misses | 적중 실패한 키 수 | count |
| memstore_keyspace_hitrate_percent | 키 적중률 | % |
| memstore_evicted_keys | 메모리 제한으로 인해 제거된 키 수 | count |
| memstore_expired_keys | 만료된 키 수 | count |
| memstore_lazyfree_pending_objects | Lazy Free로 해제 대기 중인 객체 수 | count |
| memstore_lazyfreed_objects | Lazy Free로 해제된 객체 수 | count |
| memstore_lru_clock | LRU 알고리즘을 위한 내부 시간 값 | count |
버스터블 인스턴스 전용 메트릭
다음 메트릭은 버스터블(Burstable) 옵션이 적용된 t1i 계열 인스턴스에서만 수집됩니다.
| 메트릭 이름 | 설명 | 단위 |
|---|
| cpu_credit_usage | CPU 크레딧 사용량 | count |
| cpu_credit_balance | CPU 크레딧 잔여량 | count |
Hadoop Eco 메트릭
Hadoop Eco 환경에서 수집되는 주요 HBase, HDFS, Yarn, Kafka 관련 시스템 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: Metric Export
- HBase
- HDFS (NameNode)
- Yarn (ResourceManager)
- Kafka
| 메트릭 이름 | 설명 | 단위 |
|---|
| HBase_Master_JvmMetrics_MemHeapMaxM | HBase Master의 JVM 힙 메모리 최대 크기 | MB |
| HBase_Master_JvmMetrics_MemHeapUsedM | HBase Master의 JVM 힙 메모리 사용량 | MB |
| HBase_Master_Server_numDeadRegionServers | 비정상(Dead) 상태의 Region Server 수 | count |
| HBase_Master_Server_numRegionServers | 정상 동작 중인 Region Server 수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| Hadoop_NameNode_JvmMetrics_MemHeapMaxM | NameNode의 JVM 힙 메모리 최대 크기 | MB |
| Hadoop_NameNode_JvmMetrics_MemHeapUsedM | NameNode의 JVM 힙 메모리 사용량 | MB |
| Hadoop_NameNode_JvmMetrics_GcTimeMillis | NameNode JVM의 GC 수행 시간 | count |
| Hadoop_NameNode_FSNamesystem_CapacityTotal | 전체 HDFS 저장소 용량 | bytes(IEC) |
| Hadoop_NameNode_FSNamesystem_CapacityUsed | 사용 중인 HDFS 저장소 용량 | bytes(IEC) |
| Hadoop_NameNode_FSNamesystem_CapacityRemaining | 사용 가능한 HDFS 저장소 용량 | bytes(IEC) |
| Hadoop_NameNode_FSNamesystem_CapacityUsedNonDFS | 비 DFS 용도로 사용된 용량 (로그, 임시 파일 등) | bytes(IEC) |
| Hadoop_NameNode_FSNamesystem_NumLiveDataNodes | 정상 동작 중인 DataNode 수 | count |
| Hadoop_NameNode_FSNamesystem_NumDeadDataNodes | 비정상(Dead) 상태의 DataNode 수 | count |
| Hadoop_NameNode_FSNamesystem_StaleDataNodes | 상태 갱신이 중단된 DataNode 수 | count |
| Hadoop_NameNode_FSNamesystem_CorruptBlocks | 손상된 블록 수 | count |
| Hadoop_NameNode_FSNamesystem_TotalLoad | 현재 활성 클라이언트 연결 수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| Yarn_ResourceManager_JvmMetrics_MemHeapMaxM | ResourceManager의 JVM 힙 메모리 최대 크기 | MB |
| Yarn_ResourceManager_JvmMetrics_MemHeapUsedM | ResourceManager의 JVM 힙 메모리 사용량 | MB |
| Yarn_ResourceManager_JvmMetrics_GcTimeMillis | ResourceManager JVM의 GC 수행 시간 | count |
| Yarn_ResourceManager_ClusterMetrics_NumActiveNMs | 정상 동작 중인 NodeManager 수 | count |
| Yarn_ResourceManager_ClusterMetrics_NumShutdownNMs | 종료된 NodeManager 수 | count |
| Yarn_ResourceManager_QueueMetrics_AllocatedMB | 할당된 메모리 크기 | MB |
| Yarn_ResourceManager_QueueMetrics_AvailableMB | 사용 가능한 메모리 크기 | MB |
| Yarn_ResourceManager_QueueMetrics_PendingMB | 대기 중인 메모리 크기 | MB |
| Yarn_ResourceManager_QueueMetrics_ReservedMB | 예약된 메모리 크기 | MB |
| Yarn_ResourceManager_QueueMetrics_AllocatedVCores | 할당된 vCore 개수 | count |
| Yarn_ResourceManager_QueueMetrics_AvailableVCores | 사용 가능한 vCore 개수 | count |
| Yarn_ResourceManager_QueueMetrics_PendingVCores | 대기 중인 vCore 개수 | count |
| Yarn_ResourceManager_QueueMetrics_ReservedVCores | 예약된 vCore 개수 | count |
| Yarn_ResourceManager_QueueMetrics_AppsRunning | 실행 중인 애플리케이션 수 | count |
| Yarn_ResourceManager_QueueMetrics_AppsCompleted | 완료된 애플리케이션 수 | count |
| Yarn_ResourceManager_QueueMetrics_AppsFailed | 실패한 애플리케이션 수 | count |
| Yarn_ResourceManager_QueueMetrics_AppsKilled | 강제 종료된 애플리케이션 수 | count |
| Yarn_ResourceManager_QueueMetrics_AppsPending | 대기 중인 애플리케이션 수 | count |
| Yarn_ResourceManager_QueueMetrics_AppsSubmitted | 제출된 애플리케이션 수 | count |
| 메트릭 이름 | 설명 | 단위 |
|---|
| Kafka_Active_Brokers | 정상 동작 중인 Broker 수 | count |
| Kafka_Total_Topics | 운영 중인 Topic 개수 | count |
Pub/Sub 메트릭
Pub/Sub 서비스의 메시지 게시, 구독, 저장 상태를 모니터링하기 위한 주요 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: 커스텀 대시보드, 메트릭 탐색기
- Alert Center: 메트릭 기반 알림 정책 설정
- 게시 (Publish)
- 구독 (Subscription)
- 저장 및 내보내기 (Export)
| 메트릭 이름 | 설명 | 단위 |
|---|
| pubsub_published_message_count_persec | 초당 게시된 메시지 개수 | count/s |
| pubsub_published_message_bytes_persec | 초당 게시된 메시지 크기 | bytes/s(IEC) |
| pubsub_publish_request_count_persec | 초당 게시 요청 횟수 | count/s |
| pubsub_topic_storage_used_bytes | 토픽 보관 데이터 크기 | bytes(IEC) |
| 메트릭 이름 | 설명 | 단위 |
|---|
| pubsub_ack_request_count_persec | 초당 확인 처리 요청 횟수 | count/s |
| pubsub_acked_message_count_persec | 초당 확인 처리된 메시지 개수 | count/s |
| pubsub_unprocessed_messages | 미처리 메시지 개수 | count |
| pubsub_pulled_message_count_persec | 초당 pull된 메시지 개수 | count/s |
| pubsub_streaming_pull_response_count_persec | 초당 streaming pull 응답 개수 | count/s |
| pubsub_push_count_persec | 초당 push 요청 횟수 | count/s |
| pubsub_pushed_message_count_persec | 초당 push된 메시지 개수 | count/s |
| pubsub_subscription_storage_used_bytes | 서브스크립션 보관 데이터 크기 | bytes(IEC) |
| pubsub_seek_request_count_permin | 분당 시점 되돌리기(Seek) 요청 횟수 | count/m |
| 메트릭 이름 | 설명 | 단위 |
|---|
| pubsub_exported_message_count_persec | 초당 Object Storage로 내보내기 처리된 메시지 개수 | count/s |
| pubsub_object_storage_api_call_count_permin | 분당 Object Storage API 호출 횟수 | count/m |
Direct Connect 메트릭
Direct Connect 가상 인터페이스의 트래픽 및 연결 상태를 모니터링하기 위한 주요 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: Metric Export
| 메트릭 이름 | 설명 | 단위 |
|---|
| dx_virtual_interface_input_bits_persec | 가상 인터페이스에서 받은 초당 비트 크기 | bits/s(IEC) |
| dx_virtual_interface_output_bits_persec | 가상 인터페이스에서 보낸 초당 비트 크기 | bits/s(IEC) |
| dx_virtual_interface_input_packets_persec | 가상 인터페이스에서 받은 초당 패킷 수 | packets/s |
| dx_virtual_interface_output_packets_persec | 가상 인터페이스에서 보낸 초당 패킷 수 | packets/s |
| 메트릭 이름 | 설명 | 단위 |
|---|
| dx_virtual_intrerface_state | Direct Connect 가상 인터페이스의 연결 상태 | count |
Gateway Load Balancer 메트릭
Gateway Load Balancer 및 Endpoint Service의 트래픽, 연결, 헬스 상태를 모니터링하기 위한 주요 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: Metric Export
| 메트릭 이름 | 설명 | 단위 |
|---|
| gwlb_bytes_in_persec | Gateway Load Balancer에서 받은 총 바이트 | bytes/s(IEC) |
| gwlb_bytes_out_persec | Gateway Load Balancer에서 보낸 총 바이트 | bytes/s(IEC) |
| eps_bytes_in_persec | Endpoint Service에서 받은 총 바이트 | bytes/s(IEC) |
| eps_bytes_out_persec | Endpoint Service에서 보낸 총 바이트 | bytes/s(IEC) |
| ep_bytes_in_persec | Endpoint에서 받은 총 바이트 | bytes/s(IEC) |
| ep_bytes_out_persec | Endpoint에서 보낸 총 바이트 | bytes/s(IEC) |
| 메트릭 이름 | 설명 | 단위 |
|---|
| gwlb_current_connections | Gateway Load Balancer의 활성 connection 수 | count |
| gwlb_healthy_host_count | Gateway Load Balancer의 healthy 상태 host 수 | count |
| gwlb_unhealthy_host_count | Gateway Load Balancer의 unhealthy 상태 host 수 | count |
| eps_current_connections | Endpoint Service의 활성 connection 수 | count |
| eps_endpoint_count | Endpoint Service에 연결된 endpoint 수 | count |
| ep_current_connections | Endpoint의 활성 connection 수 | count |
Private Endpoint 메트릭
Private Endpoint의 트래픽 및 연결 상태를 모니터링하기 위한 주요 메트릭으로, 다음 서비스 영역에서 활용할 수 있습니다.
- Monitoring: Metric Export
| 메트릭 이름 | 설명 | 단위 |
|---|
| ep_bytes_in_persec | Endpoint에서 받은 총 바이트 | bytes/s(IEC) |
| ep_bytes_out_persec | Endpoint에서 보낸 총 바이트 | bytes/s(IEC) |
| 메트릭 이름 | 설명 | 단위 |
|---|
| ep_current_connections | Endpoint의 활성 connection 수 | count |