MLOps / ML Platform Engineer
Production-grade ML Platform์ ์ค๊ณํ๊ณ ์ด์ํ๋ ํ๋ซํผ ์์ง๋์ด์ ๋๋ค.
DevOps 2๋ 3๊ฐ์(๊ฐ๋น์) ์ด์ ๊ฒฝํ์ ๊ธฐ๋ฐ์ผ๋ก,
GitOps ๊ธฐ๋ฐ dev/prod ๋ถ๋ฆฌํ Production-grade E2E ML Platform์ ์ง์ ์ค๊ณยท๊ตฌ์ถยท๊ฒ์ฆํ์ต๋๋ค.
๋จ์ํ ๋ชจ๋ธ์ ๋ฐฐํฌํ๋ ์์คํ ์ด ์๋๋ผ,
Data โ Feature โ Training โ Registry โ Deploy โ Inference โ Monitoring
์ ๊ณผ์ ์ ์๋ํํ๊ณ ,
์ด์ ํ๊ฒฝ์์ ํ์ํ ๋กค๋ฐฑ ์ ๋ต, ํ์ฅ์ฑ, ๊ด์ธก ์ฒด๊ณ, ์ฅ์ ๋์ ๊ตฌ์กฐ๊น์ง ํฌํจํ ML Platform ์ํคํ ์ฒ๋ฅผ ๊ตฌํํ์ต๋๋ค.
๐ Platform Snapshot (์์ฝ)
- GitOps: ArgoCD ๊ธฐ๋ฐ dev/prod ์์ ๋ถ๋ฆฌ ํ๊ฒฝ
- Orchestration: Airflow DAG ๊ธฐ๋ฐ E2E ์๋ํ
- Model Registry: MLflow Registry + alias ๊ธฐ๋ฐ Hot Swap / Rollback
- Serving: Triton Inference Server + FastAPI reload ๊ตฌ์กฐ
- Observability: Prometheus / Grafana / Alertmanager ๊ธฐ๋ฐ ์ด์ ๊ด์ธก
- Reproducibility: Feature Store-lite(๋ฒ์ ํ + latest ๊ณ ์ ), Feast ๊ฒ์ฆ
- Deployment Strategy: Promotion / Shadow ๋ถ๊ธฐ + Mirror/Split ํธ๋ํฝ ๋ผ์ฐํ + Triton RollingUpdate zero-downtime
- Security & Resilience: NetworkPolicy(4์๋น์ค) + ResourceQuota + Fail-open ์์ค์ปฌ๋ ์ด์ + Contract Testing
- Architecture: Core / Baseline / Optional ๋ถ๋ฆฌํ ํ๋ซํผ ๊ตฌ์กฐ
- Proof System: GitOps ๊ฒฝ๊ณ / runtime / optional attach-detach / observability ๊ฒ์ฆ ๋ฌธ์ํ
- ๋ถํ ํ ์คํธ: 136 RPS, p95 553ms, ์๋ฌ์จ 0% (k6, 100 VU, 3๋ ธ๋ ํด๋ฌ์คํฐ)
๐ ๋ชจ๋ ๊ตฌ์ฑ์ GitHub ๋ฐ ๋ธ๋ก๊ทธ์ Proof ํํ๋ก ๊ณต๊ฐ๋์ด ์์ต๋๋ค.
๐ ๋ํ ํ๋ก์ ํธ
Production-grade E2E ML Platform
GitOps ๊ธฐ๋ฐ dev/prod ํ๊ฒฝ ๋ถ๋ฆฌ์
AirflowโMLflowโTritonโFastAPIโObservability๋ฅผ ํฌํจํ ํตํฉ ML Platform ํ๋ก์ ํธ์ ๋๋ค.
์ด ํ๋ก์ ํธ๋ ๋จ์ ๊ตฌํ์ด ์๋๋ผ,
- GitOps ๊ฒฝ๊ณ ๊ตฌ์กฐ
- Optional attach / detach ๊ตฌ์กฐ
- Serving Runtime ์ํ
- Observability ์์คํ
- ์ด์ ๋ฌธ์ ๋ฐ Proof ์ฒด๊ณ
๋ฅผ ์ค์ ์คํ ๊ฒฐ๊ณผ์ ์บก์ฒ ๊ธฐ๋ฐ์ผ๋ก ๊ฒ์ฆํ ํ๋ซํผ์ ๋๋ค.
๐ ํ๋ก์ ํธ ๋ณด๊ธฐ
https://keonhoban.github.io/mlops-journey/projects/mlops_pipeline_e2e/01/
๐ฌ ๊ธฐ์ ์ค๊ณ ํ์ ๋ฐ ๊ฒ์ฆ ๊ธฐ๋ก
์๋ ๊ธ๋ค์ ํ์ฌ ML Platform์ ๊ตฌ์ฑํ๊ธฐ๊น์ง ์งํํ๋
๊ธฐ์ ์ค๊ณ ํ์ ๋ฐ ๊ฒ์ฆ ๊ธฐ๋ก์ ๋๋ค.
Observability ์ค๊ณ
Prometheus / Grafana / Alertmanager ๊ธฐ๋ฐ
ML Platform ๊ด์ธก ์ฒด๊ณ ์ค๊ณ ๋ฐ ์ด์ ๊ตฌ์กฐ
https://keonhoban.github.io/mlops-journey/projects/mlops_pipeline_observability/01/
Triton Serving ๊ตฌ์กฐ
Triton Inference Server ๊ธฐ๋ฐ
๋ชจ๋ธ ์๋น ๋ฐ alias ๊ธฐ๋ฐ hot swap ๊ตฌ์กฐ ์ค๊ณ
https://keonhoban.github.io/mlops-journey/projects/triton/01/
Feature Store (Lite + Feast ๊ฒ์ฆ)
Feature Store-lite ๊ตฌ์กฐ์
Feast ๊ธฐ๋ฐ Feature Store ๊ฒ์ฆ ๊ธฐ๋ก
https://keonhoban.github.io/mlops-journey/projects/feature_store/01/
๐ GitHub
GitOps Repository
GitOps ๊ธฐ๋ฐ ML Platform ์ธํ๋ผ ์ฝ๋
https://github.com/keonhoban/mlops-infra-gitops
Airflow DAG
ML Pipeline Orchestration ์ฝ๋
https://github.com/keonhoban/airflow-dags-dev
MLOps Experiments
ML Platform ์คํ ๋ฐ ๊ฒ์ฆ ์ฝ๋
https://github.com/keonhoban/mlops-infra-labs
๐๏ธ Architecture Philosophy
์ ๊ฐ ๊ตฌ์ถํ ํ๋ซํผ์ ์คํ์ฉ ๊ตฌ์ฑ์ด ์๋๋ผ,
์ด์ ํ๊ฒฝ์ ์ ์ ๋ก ์ค๊ณ๋ ML Platform์ ๋๋ค.
- Kubernetes ๊ธฐ๋ฐ ML Platform
- GitOps ๊ธฐ๋ฐ ๋ฐฐํฌ ๋ฐ ํ๊ฒฝ ๋ถ๋ฆฌ ์ ๋ต
- MLflow Tracking + Registry ์ด์ ๊ตฌ์กฐ
- MLflow alias ๊ธฐ๋ฐ ๋ชจ๋ธ ๊ต์ฒด ๋ฐ runtime reload
- DAG ๊ธฐ๋ฐ ์๋ ํ์ตยท๋ฐฐํฌ ํ์ดํ๋ผ์ธ
- ์ฅ์ ๋์์ ๊ณ ๋ คํ ๋กค๋ฐฑ ๋ฐ ์ํ ์ ์ด ์ค๊ณ
- Promotion/Shadow ๋ถ๊ธฐ + NetworkPolicy ๊ธฐ๋ฐ ๋คํธ์ํฌ ๊ฒฉ๋ฆฌ
- ๋ฉํธ๋ฆญยท๋ก๊ทธยท์๋ ๊ธฐ๋ฐ ์ด์ ๊ด์ธก ์ฒด๊ณ
โ๋ชจ๋ธ์ ์ฌ๋ฆฐ๋คโ๊ฐ ์๋๋ผ,
์ง์์ ์ผ๋ก ์ด์ ๊ฐ๋ฅํ ํ๋ซํผ์ ๋ง๋ ๋ค๋ ๊ด์ ์ผ๋ก ์ค๊ณํ์ต๋๋ค.
๐ผ DevOps / SRE Experience
๊ฐ๋น์ DevOpsํ (System Engineer)
2023.01 ~ 2025.03
๋๊ท๋ชจ ๋ฉ์ผยท์ธํ๋ผ ์ด์ ๋ฐ ์๋ํ๋ฅผ ๋ด๋นํ์ต๋๋ค.
์ฃผ์ ๊ฒฝํ
๋ฌด์ค๋จ ๋ฉ์ผ ๋ง์ด๊ทธ๋ ์ด์
- ์ ๊ท ์๋ฒ ํ๋ก๋น์ ๋
- DNS / MX / SPF / DKIM ์ ํ
- ์๋ณต ์๋๋ฆฌ์ค ์ค๊ณ
- ์ฆ๋ถ ์ด์ ์๋ํ
SMTP ๋ฐ์ก ์ฐํ ์๋ํ
- Loop ๋ฐฉ์ง ๋ก์ง ์ค๊ณ
- ์ค๋ณต ์ฐํ ๊ฐ์ง
- Ansible ๊ธฐ๋ฐ ์๋ํ
- ๋ก๊ทธ ์๋ ๊ด๋ฆฌ ์ฒด๊ณ
CI/CD ๋ฐ ๋ฐฐํฌ ์ด์
- GitLab CI + Docker + Helm
- Health Check ํ์คํ
- CloudFront / Route53 ๊ธฐ๋ฐ ํธ๋ํฝ ์ ํ
Kubernetes ์ด์
- ๋ ธ๋ ์ฆ์ค ๋ฐ ์์ ํฌ์ ์ ์ฐจ
- Cordon / ๊ฒ์ฆ ๊ธฐ๋ฐ ์ด์ ์ ๋ต
์ด์ ์๋ํ์ ์์ ์ฑ์ ์ค์ฌ์ผ๋ก ๊ฒฝํ์ ์ถ์ ํ์ต๋๋ค.
๐ Tech Stack
ML Platform
MLflow / Airflow / Triton / FastAPI
Feature Store-lite / Feast
Prometheus / Grafana / Alertmanager
Infrastructure
Kubernetes / ArgoCD / Docker
AWS (Route53, CloudFront ๋ฑ)
๐ Certifications
- AWS Solutions Architect โ Professional
- AWS Solutions Architect โ Associate
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ
- ๋ฆฌ๋ ์ค ๋ง์คํฐ 2๊ธ
- ๋คํธ์ํฌ ๊ด๋ฆฌ์ฌ
๐ Education
์ปดํจํฐ๊ณตํ ํ์ฌ (ํ์ ์ํ์ , 4.2 / 4.5)
๋์๊ณผํ๋ํ๊ต ์๋ฌดํ์ ๊ณผ ์กธ์
๐ฏ Direction
๋จ์ ๋ชจ๋ธ ๋ฐฐํฌ ์์ง๋์ด๊ฐ ์๋๋ผ,
Production-grade ML Platform์ ์ค๊ณํ๊ณ ์ด์ ์์ ์ฑ์ ๊ฐ์ ํ๋ ํ๋ซํผ ์์ง๋์ด๋ฅผ ์งํฅํฉ๋๋ค.
๐ฌ Contact
Email: keonho0510@naver.com
GitHub: https://github.com/keonhoban