모니터링(Monitoring) VS 가시성(Observability)
모니터링(Monitoring)
- 목적:
시스템의 상태,성능 지표,이벤트등을실시간으로추적하고 모니터링하여 시스템이 정상적으로 동작하는지 확인하는 데 사용 - 주로 사전에
정의 된 지표를 사용해서 시스템의 현재 상태를실시간으로 감시하고알림을 생성하는 데 중점을 둔다. - 예시: 배포한 애플리케이션이 잘 동작하는지?, 시스템 자원을 잘 관리 되고 있는지?
가시성(Observability)
- 목적:
시스템 내부의 작동 원리를 이해하고,문제의 원인을 식별하며, 이를 해결하기 위해시스템을 자세히 살펴보는 것에 중점을 둔다. - 다양한
원시 데이터를 수집하고, 이를종합하여시스템 내부 작동을 이해하려고 하며, 주로문제 해결과 성능 최적화에 중점을 둠 - 기존의 모니터링에 비해 넒은 개념 (모니터링은
수동적, 가시성은능동적) - 예시: 알려지지 않은
미지의 문제를 쉽게해결하고 처리하는데 목적을 둔다.왜 이런 일이 일어나고 있는가?라는 질문에 답을 찾을 수 있다.
가시성 확보를 위해서는 넓은 범위의 데이터를 수집하여야 한다.
가시성과 관련된 세 가지 축 (어떤 정보를 확인하면 되는지?)
문제 원인을 분석하고성능 개선을 위한데이터를 수집해야하는데, 아래세 가지가 해당된다.
메트릭(Metrics): 수치로 표현되는 정형적인 데이터
로그(Logs): 텍스트로 표현되는 애플리케이션이나 시스템의 주요 데이터
트레이스(Traces): 하나의 요청에 대해 세부적 단계를 알수 있는 데이터
이와 같은 세 가지 유형의 데이터를 텔레메트리 데이터(Telemetry data)라 부르며, 이러한 데이터를 수집하는 환경을 텔레메트리(Telemetry) 구축 환경이라 한다.
텔레메트리 환경 구축을 위한 도구
- 오픈소스 기반 솔루션
- Cloud 벤더사 솔루션
- SaaS 솔루션
가격은오픈소스 솔루션에서SaaS 솔루션으로 갈수록비싸진다.안전성과편의성은오픈소스 솔루션에서SaaS 솔루션으로 갈수록좋아진다.안전성이 중요한 이유는 트래픽이 몰릴때트러블슈팅을 하기위해 텔레메트릭 환경에 접근했을 때텔레메트릭 환경역시 장애가 발생하면 제대로 된 분석이 힘들다. (처치 곤란;;)- 위와 같은 이유로 해당 도구를 시스템에 상황에 고려해 적절하게 선택해야 한다.
가트너 제공 2023년 모니터링과 가시성에 관련된 제품군
- 가트너의 보고에 따르면
SaaS 제품군이복잡도가 높은 시스템에서리더 그룹에 속해 있다. 클라우드 벤더사 솔루션은 지속적으로 개선되고 있는도전자 그룹에 속해있다.- 완성도가 높지만 애플리케이션이나 모니터링과 관련해서는 SaaS 솔루션에 비해 기능이 떨어진다.
- 일반적인
오픈소스 솔루션에서는그라파나 랩스같은 기업이혁신가 그룹에 속해 있다.