Home Telemetry
Post
Cancel

Telemetry

모니터링(Monitoring) VS 가시성(Observability)

모니터링(Monitoring)

  • 목적: 시스템의 상태, 성능 지표, 이벤트 등을 실시간으로 추적하고 모니터링하여 시스템이 정상적으로 동작하는지 확인하는 데 사용
  • 주로 사전에 정의 된 지표를 사용해서 시스템의 현재 상태를 실시간으로 감시하고 알림을 생성하는 데 중점을 둔다.
  • 예시: 배포한 애플리케이션이 잘 동작하는지?, 시스템 자원을 잘 관리 되고 있는지?

가시성(Observability)

  • 목적: 시스템 내부의 작동 원리를 이해하고, 문제의 원인을 식별하며, 이를 해결하기 위해 시스템을 자세히 살펴보는 것에 중점을 둔다.
  • 다양한 원시 데이터를 수집하고, 이를 종합하여 시스템 내부 작동을 이해하려고 하며, 주로 문제 해결과 성능 최적화에 중점을 둠
  • 기존의 모니터링에 비해 넒은 개념 (모니터링은 수동적, 가시성은 능동적)
  • 예시: 알려지지 않은 미지의 문제를 쉽게 해결하고 처리하는데 목적을 둔다. 왜 이런 일이 일어나고 있는가?라는 질문에 답을 찾을 수 있다.

가시성 확보를 위해서는 넓은 범위의 데이터를 수집하여야 한다.

가시성과 관련된 세 가지 축 (어떤 정보를 확인하면 되는지?)

  • 문제 원인을 분석하고 성능 개선을 위한 데이터를 수집해야하는데, 아래 세 가지가 해당된다.

메트릭(Metrics): 수치로 표현되는 정형적인 데이터

로그(Logs): 텍스트로 표현되는 애플리케이션이나 시스템의 주요 데이터

트레이스(Traces): 하나의 요청에 대해 세부적 단계를 알수 있는 데이터

이와 같은 세 가지 유형의 데이터를 텔레메트리 데이터(Telemetry data)라 부르며, 이러한 데이터를 수집하는 환경을 텔레메트리(Telemetry) 구축 환경이라 한다.

텔레메트리 환경 구축을 위한 도구

  1. 오픈소스 기반 솔루션
  2. Cloud 벤더사 솔루션
  3. SaaS 솔루션
  • 가격오픈소스 솔루션에서 SaaS 솔루션으로 갈수록 비싸진다.
  • 안전성편의성오픈소스 솔루션에서 SaaS 솔루션으로 갈수록 좋아진다.
  • 안전성이 중요한 이유는 트래픽이 몰릴때 트러블슈팅을 하기위해 텔레메트릭 환경에 접근했을 때 텔레메트릭 환경 역시 장애가 발생하면 제대로 된 분석이 힘들다. (처치 곤란;;)
  • 위와 같은 이유로 해당 도구를 시스템에 상황에 고려해 적절하게 선택해야 한다.

가트너 제공 2023년 모니터링과 가시성에 관련된 제품군

image

  • 가트너의 보고에 따르면 SaaS 제품군복잡도가 높은 시스템에서 리더 그룹에 속해 있다.
  • 클라우드 벤더사 솔루션은 지속적으로 개선되고 있는 도전자 그룹에 속해있다.
    • 완성도가 높지만 애플리케이션이나 모니터링과 관련해서는 SaaS 솔루션에 비해 기능이 떨어진다.
  • 일반적인 오픈소스 솔루션에서는 그라파나 랩스 같은 기업이 혁신가 그룹에 속해 있다.

1월 회고록

모던 자바 (3) 함수형 프로그래밍