프로젝트
좋은 모니터링을 해보자
이 글을 쓰게 된 배경이번에 회사에서 소소하지는 않았던 사실상 전면 장애가 났었는데요이 과정에서 모두가 확인할 수 있는 모니터링 대시보드를 만들고, 여기만 보자는 의견을 내게 되었고, 미팅을 주최해 결국 모니터링 대시보르를 만들었던 경험을 한 번쯤 정리해 두면 앞으로도 도움이 많이 될 것 같아서 이번에 정리를 해두려고 합니다 전면 장애가 나면 보통 이렇게 대응을 하고, 후속 처리를 하게 됩니다가장 먼저 장애가 난 원인을 파악합니다1. 현재 서버의 에러 로그를 확인합니다대부분의 경우에 여기서 모든 것이 드러나는 경우가 많습니다만약 여기서 잡히지 않는다면 그때부터는 이제 장애의 원인을 확인해봅니다특정 api의 응답이 없는지, 혹은 엄청 느려졌는지, 아니면 전체적으로 다 문제인지를 확인합니다특정 api 만 문..