반갑습니다.
인프라 서버로 근무하며 아날로그를 디지털로 바꾸는 효율적 업무 변환을 추구하고 자동화에 관심 많습니다.
이해 쉽게 심플한 강의로 여러분에게 다가가겠습니다. 늘 감사합니다.
강의
수강평
- GZS - 우리도 자빅스(Zabbix) - 그라파나, 슬랙 연동
- GZS - 우리도 자빅스(Zabbix) - 그라파나, 슬랙 연동
- GZS - 우리도 자빅스(Zabbix) - 그라파나, 슬랙 연동
- GZS - 우리도 자빅스(Zabbix) - 그라파나, 슬랙 연동
- GZS - 우리도 자빅스(Zabbix) - 그라파나, 슬랙 연동
게시글
질문&답변
ZABBIX와 Grafana 연동
안녕하세요 좋은 질문입니다!아마 지금쯤이면 모두 이해하셨을 것 같은데 답변이 늦어서 죄송합니다. 예를 들어본다면 만약 아래와 같이 대쉬보드를 구성했다고 가정해보겠습니다.25년도 7월 한 달만 조회한다면 트래픽은 전체 사용률을 나타내고 아래 CPU, MEM 테이블은 한 달 중 최근 값(last)을 테이블에 표시할겁니다.이때 특정 사용자가 2년치의 트래픽 그래프가 보고 싶어서 무심결에 기간을 늘렸다고 해보겠습니다.(사진) 그럼 트래픽 뿐만이 아니라 CPU, MEM 테이블에서 2년 치의 select query가 뽑힌 다음에 거기서 최근값(last)를 보여줍니다. 이때 실제 서버 메모리 사용률을 보면 grafana-server 프로세스가 100%까지 차버립니다. 그랬을 때 만약 zabbix 서버에 grafana 서비스를 같이 올렸다면 서버가 hang이 걸려버리고 재부팅을 해야만 하는 상황이 발생합니다. (사진) 여기서 만약 API 로 zabbix와 grafana 간의 통신이 아닌 DB Direct로 연결하면 훨씬 빠른 통신이 가능하여 위와 같은 이슈 상황을 피할 수 있습니다. 다만 DB Direct로 실습을 진행하지 않은 이유는 인터넷의 쉽게 찾을 수 있는 레퍼런스에서는 대다수 API로 되어있기 때문입니다. 해당 강의를 수강하시는 분들이 차후에 Zabbix 운영 중에 몇 년뒤에 이슈가 발생했을 때 쉽게 자료를 찾을 수 있도록 강의 구성을 고민했던 것 같습니다. 추가 질문 있으시면 말씀 부탁 드립니다! 감사합니다.
- 0
- 2
- 37
질문&답변
값 출력 오류
안녕하세요 확인하느라 답이 좀 늦었습니다. 아래와 같이 last가 아닌 last*(non-null value)로 선택해주실 수 있으실까요?설정 이후에 공유해주시면 감사하겠습니다. 그리고 새로 추가한 마운트 경로에 대해 자빅스 - 모니터링에는 값들은 디스커버리로 자동 추가 이후 정상 수집되고 있는 상태인 지 궁금합니다. (사진) 감사합니다.
- 0
- 2
- 23
질문&답변
history/problems
안녕하세요 해당 대쉬보드에서 Zabbix History 및 Problems는 트리거(오류)가 발생하면 연동되어 보입니다. 혹시 자빅스에서 장애 트리거가 발생하도록 윈도우/리눅스를 종료해보시고 10분 이상 기다리면 어떻게 되실까요? 감사합니다.
- 0
- 2
- 23
질문&답변
zabbix를 설치하고 이후 설정에 문의 드립니다.
안녕하세요 네 맞습니다. Zabbix 서버와 Client 서버는 에어전트 통신을 위해 TCP 10050, 10051 등 세션을 맺어 원하는 값을 주고 받습니다. 그렇기에 천대, 만대 넘어가는 서버를 모니터링 하기 위해서는 프록시 서버를 두어 부하 분산을 적절히 하거나 서버 성능 및 DB 캐시 용량을 늘려야 합니다. 이때 자빅스 웹페이지(nginx)는 별도로 관리자만 접속하기에 따로 설정해주실 필요는 없습니다. 저는 실무 경험하면서 한번도 웹페이지가 중단된 적은 없습니다. 걱정은 안하셔도 될 듯 합니다! 다만 그라파나를 이용하실 경우 조심해주셔야 하는데요. 가끔 DB 셀렉트 쿼리로 인해 다량의 테이블 조회로 그라파나 서버가 Hang 걸리실 수 있습니다. 감사합니다.
- 0
- 2
- 61
질문&답변
클라이언트 호스트 설정과 관련한 질문을 드립니다.
안녕하세요 답변이 늦었습니다. 공유해주셔서 감사합니다.
- 0
- 2
- 27
질문&답변
메모리 사용률
안녕하세요 Total : 15GiFree : 1.3Gi계산식 = 1-(Free/Total)*100 = 1-(1.3/15)*100=91%으로 대략적으로 91%가 사용 중인 메모리 인듯 합니다! 감사합니다.
- 0
- 2
- 24
질문&답변
zabbix_get 에 대한 강의가 있었는데, 다시 확인하고자 질문 드립니다.
네 아이템마다 개별적으로 키-값 JSON 형태로 받아옵니다. { "cpu utilization": 80, } { "buff/cached memory": 689310, } 네 맞습니다. zabbix_get은 이미 등록된 아이템으로 실행하기에 동일하다고 보시면 됩니다.
- 0
- 2
- 32
질문&답변
서버를 관리하는 툴에 대해 정보를 더 알려 주실 수 있을까요?
안녕하세요벤치마킹/보안 관련 답변 드립니다. 저의 포지션의 경우 직접 테스트는 진행하지 않지만 건너 보았던 내용 공유 드립니다. [벤치마킹]규모에 따라 사용자 수가 예상되신다면 프로젝트 오픈 이전에 WEB, WAS, DB에 일정 과부화를 주어서 접속 가능 여부를 테스트 하시면 됩니다. Apache Bench를 사용했던 걸로 기억합니다. Docker 환경에서는 실제로 레플리카셋을 일부 삭제하거나, Docker 호스트를 강제로 종료하는 시나리오로 이중화(HA) 환경과 서비스 복구 능력을 점검했습니다. CPU/MEM/HDD 초기 선정의 경우 기업 및 서비스 특성에 따라 다르지만 과거 가이드를 참고하여 생성하기도 했습니다. 참고 자료정보시스템 하드웨어 규모산정 지침(TTAK.KO-10.0292_R1) 그럼에도 저는 성능 지표보다는 더 낮은 최소한으로 스펙을 선정하여 드리고 자빅스/그라파나/슬랙으로 모니터링한 이후에 부족한 자원을 증설합니다. 요즘은 실시간으로 자원을 늘릴 수 있어 큰 장점인 듯 합니다. [보안]해당 경우에도 기업 특성과 기존 운영 방식에 따라 다른 듯 합니다. 저라면 Ansible이라는 툴을 이용하여 보안 취약점 스크립트를 돌려볼 듯 합니다. 즉 서버를 생성하면 자동화 도구를 이용하여 보안 스크립트를 실행하여 취약 환경을 알아채고 설정할 듯합니다 감사합니다
- 0
- 1
- 28
질문&답변
다중 커스텀 파라미터의 데이터형에 대해 문의 드립니다.
안녕하세요 유저파라미터를 생성하실 때 사용하시는 명령어에 명령어에 따라 다르게 타입 지정하시면 됩니다. grep이나 awk은 문자열을 리턴합니다.예를 들면 UserParameter=mem.buff_cache,free -k | awk '/^Mem:/ {print $(NF-1)}'위와 같은 버퍼/캐시를 숫자 킬로바이트만 추출하는 명령어의 경우에는 숫자로 리턴하지 않고 awk 명령어이기에 문자열을 리턴합니다. 저같은 경우에는 일반적으로는 String으로 받고 안되면 숫자(Unsigned)로 변경합니다. 저 위에 인프런 AI 인턴에 얘기한 것 처럼 echo 숫자를 반환하면 숫자 타입으로 받으시면 될 듯 합니다. 감사합니다.
- 0
- 2
- 31
질문&답변
프로메테우스 에이전트에서 제공하는 메트릭 수집이 가능할까요?
안녕하세요. 먼저 큰 도움이 되지 못할 듯 하여 죄송하다는 말씀 전해드립니다. 제가 프로메테우스 모니터링을 해보지 않아서 최대한 확인한 내용 공유 드립니다.이해한 바로는 http://프로메테우스/metrics 와 같은 엔드포인트(데이터)를 제공하는 듯 합니다. 이때 HTTP Agent 타입으로 원본 데이터를 먼저 저장하고,필요한 데이터를 전처리하는 방식으로 원하는 데이터만 추출하는 방식을 사용하는 듯 합니다. 즉 엔드포인트에서 제공하는 모든 결과 값을 먼저 받아오고 이후에 필요한 데이터만 파싱하여 아이템으로 저장하는 방법이 있습니다. 참고한 URL 전달 드립니다.https://www.zabbix.com/documentation/current/en/manual/config/items/itemtypes/prometheus 감사합니다.
- 0
- 1
- 28