프로메테우스
221
작성한 질문수 4
강사님, 안녕하세요. 이전에 프로메테우스 질문 글 남겼는데
추가적으로 질문하고 싶어 댓글을 달았다가 새로 글을 작성합니다.
질문이 두서가 없고 정신없지만 양해부탁드립니다... 늘 감사합니다.
현재 미니큐브 인스턴스에 프로메테우스와 그라파나를 올린 상황입니다. 그래서 다른 mongodb 인스턴스를 모니터링하고, alert manager로 슬랙 알림을 주고 싶습니다.
1. alertmanager로 슬랙을 연동시키고자 강사님이 작성하신 values-prometheus.yaml 파일을 수정하였습니다. 헬름 차트 깃허브에 있는 야믈 파일을 참고했습니다.
cat <<EOF > values-prometheus.yaml
alertmanager: # 30~33
enabled: true
persistentVolume:
## If true, alertmanager will create/use a Persistent Volume Claim
## If false, use emptyDir
enabled: true
accessModes:
- ReadWriteOnce
size: 2Gi
replicaCount: 1
service:
type: LoadBalancer
## alertmanager ConfigMap entries # 1360
alertmanagerFiles:
alertmanager.yml:
global:
resolve_timeout: 5m
slack_api_url: 'https://hooks.slack.com/services/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'
route:
group_by: ['monitoring']
group_wait: 30s
repeat_interval: 1h
receiver: default-receiver
routes:
- match:
alertname: DeadMansSwitch
receiver: 'null'
- match:
receiver: 'slack'
continue: true
receivers:
- name: 'null'
- name: 'slack'
slack_configs:
- channel: 'test'
username: 'prometheus'
send_resolved: true
icon_url: https://avatars3.githubusercontent.com/u/3380462
title: |-
[{{ .Status | toUpper }}{{ if eq .Status "firing" }}:{{ .Alerts.Firing | len }}{{ end }}] {{ .CommonLabels.alertname }} for {{ .CommonLabels.job }}
text: >-
{{ range .Alerts -}}
*Alert:* {{ .Annotations.title }}{{ if .Labels.severity }} - {{ end }}
*Description:* {{ .Annotations.description }}
*Details:*
{{ range .Labels.SortedPairs }} • *{{ .Name }}:*
{{ end }}
{{ end }}
server:
enabled: true
persistentVolume:
enabled: true
accessModes:
- ReadWriteOnce
mountPath: /data
size: 100Gi
replicaCount: 1
## Prometheus data retention period (default if not specified is 15 days)
retention: "15d" # 15일간 데이터를 보존함
serverFiles:
alerting_rules.yml:
groups:
- name: example
rules:
- alert: HighRequestLatency
expr: sum(rate(container_network_receive_bytes_total{namespace="kube-logging"}[5m]))>20000
for: 1m
labels:
severity: page
annotations:
summary: High request latency
prometheus.yml:
rule_files:
- /etc/config/alerting_rules.yml
- /etc/config/alerts
EOF

문제는 helm install 하였더니 alertmanager 파드에서 Crash Loop BackOff 오류가 납니다...
(exit code : 1) 이미지가 이미 존재한다는데 구글링을 했음에도 명확한 해결책을 찾지 못했습니다.
제가 야믈파일을 작성하는 과정에서 문제가 생긴 것 같은데 잘 모르겠어서 질문 드립니다..
2. mongoDB인스턴스를 타겟으로 설정해주고자 헬름차트 깃허브에 있었던 mongodb-exporter.yaml 파일을 그대로 가져왔습니다.
cat <<EOF > mongodb.yaml
mongodb:
uri: "mongodb://mongodb0.example.com:27017"
existingSecret:
name: "MONGO_INITDB_ROOT_PASSWORD"
key: "secret"
port: "80"
readinessProbe:
httpGet:
path: /
port: metrics
initialDelaySeconds: 10
metrics:
enabled: true
serviceMonitor:
enabled: true
interval: 30s
scrapeTimeout: 10s
namespace:
additionalLabels: {}
targetLabels: []
metricRelabelings: []
EOF
저장 후
helm install mongodb prometheus-community/prometheus-mongodb-exporter -f mongodb.yaml -n prometheus
해주었는데 이렇게 하는 것이 과연 맞을지 궁금합니다...
답변 0
cilium install 오류
0
109
2
external-ip로 지정된 ip주소로 접속되지 않습니다.
0
82
1
Google cloud에서 클러스터를 만드는 중에 다음과 같은 오류가 발생합니다.
0
150
2
강의가 중간에 끊긴 느낌이 듭니다.
0
77
1
이론 강의 pdf 자료 다운로드 문의
0
151
2
vmware 로 가상서버 여러 대 띄울때 고정ip 로 각각 할당하는 법 알려주세요
0
1448
2
강의해주시는 별도의 강의 자료는 없나요 ??
0
212
1
스토리지 클래스
0
230
1
버전관리
0
185
1
강의 흐름 이상
0
266
1
4 쿠버네티스 워크로드에서부터 갑자기
0
269
1
영상이 나오지 않습니다.
1
228
1
kubeadm init 실패(+join할 때도 참고)
2
1530
0
2024년 3월 4일 기준 설치
3
1598
2
loadbalancer 문의 드립니다.
0
238
1
NodePord local 환경에서 안됨
0
418
2
kubectl apply 와 create 차이점
0
913
1
서비스 DNS 연습문제 중 마지막 요청 실패 질문있습니다 (feat. 서비스 생성 실패 해결방법)
0
315
1
master init error
0
561
2
gasbugs/http-go 이미지 에러
1
378
2
GKE 질문입니다
0
304
1
worker에서 join할 때 오류발생
0
575
2
포트포워딩 및 nfs 관련
0
604
1
sessionAffinity 작동관련 질문
0
517
2





