[Triton μš΄μ˜ν˜• μ„œλΉ™ ν”Œλž«νΌ (GitOps Β· 검증 Β· Alerting) - Alerting 운영 ν‘œμ€€ 맀뉴얼]

이 κΈ€μ—μ„œ λ‹€λ£¨λŠ” 것 Triton μ„œλΉ™ ν™˜κ²½μ—μ„œ dev/prod μ•ŒλŸΏμ„ μ™„μ „νžˆ λΆ„λ¦¬ν•˜κ³ , PrometheusRule/Alertmanager/Grafanaλ₯Ό ν•˜λ‚˜μ˜ νŒλ‹¨ νλ¦„μœΌλ‘œ κ³ μ •ν•˜λŠ” GitOps 기반 Alerting 운영 ν‘œμ€€ 섀계 μ„ μˆ˜μ§€μ‹ Triton μ„œλΉ™ ν”Œλž«νΌ - MLflow β†’ Triton μžλ™ 배포 νŒŒμ΄ν”„λΌμΈ 이 λ‹¨κ³„μ—μ„œ ν•΄κ²°ν•˜λ €λŠ” 문제 ObservabilityλŠ” λŒ€μ‹œλ³΄λ“œκ°€ μ•„λ‹ˆλΌ, 사고λ₯Ό λ§‰λŠ” 운영 μ •μ±…μž…λ‹ˆλ‹€. 이 λ¬Έμ„œλŠ” dev/prod μ•ŒλŸΏμ„ μ™„μ „νžˆ λΆ„λ¦¬ν•˜κ³ , 라벨 μ‹€μˆ˜λ‘œ μΈν•œ ꡐ차 μ „μ†‘κΉŒμ§€ ꡬ쑰적으둜 μ°¨λ‹¨ν•˜λ©°, Triton μ„œλΉ™ ν’ˆμ§ˆμ„ λͺ¨λΈ μ‹€ν–‰ κ΄€μ μ—μ„œ κ°μ§€ν•˜λ„λ‘ μ„€κ³„λœ GitOps 기반 Alerting μš΄μ˜μž…λ‹ˆλ‹€. ...

January 2, 2026 Β· 7 min

[MLOps ν”Œλž«νΌ Observability & Data Pipeline - 2단계 : Alertmanager Slack & νŠΈλŸ¬λΈ”μŠˆνŒ…]

이 κΈ€μ—μ„œ λ‹€λ£¨λŠ” 것 Alertmanager 섀정을 SealedSecret으둜 κ΄€λ¦¬ν•˜κ³ , dev/prod 각각의 Slack μ±„λ„λ‘œ μ•ŒλžŒμ΄ μ •ν™•νžˆ 흐λ₯΄λŠ” κ΄€μΈ‘ νŒŒμ΄ν”„λΌμΈμ„ μ™„μ„±ν•˜λŠ” 과정을 λ‹€λ£Ήλ‹ˆλ‹€. μ„ μˆ˜μ§€μ‹ Observability 1단계: kube-prometheus-stack + GitOps ꡬ좕 이 λ‹¨κ³„μ—μ„œ ν•΄κ²°ν•˜λ €λŠ” 문제 λͺ¨λΈμ΄ 잘 ν•™μŠ΅λ˜κ³  잘 λ°°ν¬λ˜λŠ” 것보닀, λ¬Έμ œκ°€ 생겼을 λ•Œ μ¦‰μ‹œ κ°μ§€λ˜λŠ” 것이 더 μ€‘μš”ν•  λ•Œκ°€ λ§Žλ‹€. dev/prod κ°κ°μ—μ„œ μ•ŒλžŒμ΄ μ •ν™•ν•œ Slack μ±„λ„λ‘œ, 깨짐 없이 흐λ₯΄λŠ” κ΄€μΈ‘ νŒŒμ΄ν”„λΌμΈμ„ λ¨Όμ € μ™„μ„±ν•΄μ•Ό ν•œλ‹€. 이 기반이 κ°–μΆ°μ Έμ•Ό 이후 FastAPI μ§€μ—°, ν•«μŠ€μ™‘ μ‹€νŒ¨, DAG μ—λŸ¬ 같은 μš΄μ˜ν˜• MLOps 이벀트λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ 감지할 수 μžˆλ‹€. ...

October 18, 2025 Β· 5 min