[MLOps ν”Œλž«νΌ Observability & Data Pipeline - 8단계 : Data Pipeline 고도화]

이 κΈ€μ—μ„œ λ‹€λ£¨λŠ” 것 κΈ°μ‘΄ v1 데이터 νŒŒμ΄ν”„λΌμΈμ— 버전 디렉터리 ꡬ쑰, schema.json, metadata.json, KST νƒ€μž„λΌμΈμ„ μ–Ήμ–΄ ML Feature Store에 κ°€κΉŒμš΄ v2 νŒŒμ΄ν”„λΌμΈμœΌλ‘œ κ³ λ„ν™”ν•œ κ³Όμ • μ„ μˆ˜μ§€μ‹ Observability 7단계: Data Pipeline ꡬ좕 이 λ‹¨κ³„μ—μ„œ ν•΄κ²°ν•˜λ €λŠ” 문제 이전 λ‹¨κ³„μ—μ„œ S3 Rawμ—μ„œ Feature CSVκΉŒμ§€ λ™μž‘ν•˜λŠ” μ—”λ“œνˆ¬μ—”λ“œ 데이터 νŒŒμ΄ν”„λΌμΈ(v1)을 λ§Œλ“€μ—ˆλ‹€. ν•˜μ§€λ§Œ 싀무 ML ν”Œλž«νΌ μž…μž₯μ—μ„œλŠ” β€œκ·Έλ•Œ κ·Έ μ‹€ν–‰μ—μ„œ μ–΄λ–€ 데이터λ₯Ό, μ–΄λ–€ ν’ˆμ§ˆλ‘œ, μ–΄λŠ 버전에 μ €μž₯ν–ˆλŠ”μ§€"κ°€ μ‹œκ°„/버전/μŠ€ν‚€λ§ˆ/λ©”νƒ€λ°μ΄ν„°κΉŒμ§€ ν•œ λ²ˆμ— 남아야 ν•œλ‹€. 이번 λ‹¨κ³„μ—μ„œλŠ” κΈ°μ‘΄ v1 νŒŒμ΄ν”„λΌμΈμ„ 버리지 μ•Šκ³ , κ·Έ μœ„μ— 버전 디렉터리 ꡬ쑰 + schema.json + metadata.json + KST νƒ€μž„λΌμΈμ„ μ–Ήμ–΄ μ‹€μ œ ML Feature Store에 더 κ°€κΉŒμš΄ v2 νŒŒμ΄ν”„λΌμΈμœΌλ‘œ κ³ λ„ν™”ν–ˆλ‹€. ...

November 15, 2025 Β· 6 min

[MLOps ν”Œλž«νΌ Observability & Data Pipeline - 7단계 : Data Pipeline ꡬ좕]

이 κΈ€μ—μ„œ λ‹€λ£¨λŠ” 것 S3 Raw 데이터λ₯Ό Airflow DAG둜 μΆ”μΆœ/검증/가곡/μ €μž₯ν•˜λŠ” μ—”λ“œνˆ¬μ—”λ“œ 데이터 νŒŒμ΄ν”„λΌμΈμ„ κ΅¬μΆ•ν•˜μ—¬ ML ν•™μŠ΅ μžλ™ν™”μ˜ 데이터 λ ˆμ΄μ–΄λ₯Ό ν™•λ³΄ν•œ κ³Όμ • μ„ μˆ˜μ§€μ‹ Observability 6단계: FastAPI Dashboard & Alert Library 이 λ‹¨κ³„μ—μ„œ ν•΄κ²°ν•˜λ €λŠ” 문제 λͺ¨λΈμ˜ μ„±λŠ₯은 κ²°κ΅­ 데이터 ν’ˆμ§ˆμ—μ„œ κ²°μ •λœλ‹€. 그런데 데이터λ₯Ό μ–΄λ–»κ²Œ μΆ”μΆœν•˜κ³ , κ²€μ¦ν•˜κ³ , κ°€κ³΅ν•˜κ³ , μ €μž₯ν•˜λŠ”μ§€κΉŒμ§€ μžλ™ν™”ν•˜μ§€ μ•ŠμœΌλ©΄ MLOpsλŠ” μ™„μ„±λ˜μ§€ μ•ŠλŠ”λ‹€. 이번 λ‹¨κ³„μ—μ„œλŠ” Raw S3μ—μ„œ μ „μ²˜λ¦¬, Feature 생성, μ €μž₯κΉŒμ§€ μ΄μ–΄μ§€λŠ” μ—”λ“œνˆ¬μ—”λ“œ 데이터 νŒŒμ΄ν”„λΌμΈμ„ 직접 ꡬ좕해 이후 MLflow ν•™μŠ΅ μžλ™ν™”μ™€ λ°”λ‘œ 연결될 데이터 λ ˆμ΄μ–΄λ₯Ό λ‹€μ‘Œλ‹€. ...

November 10, 2025 Β· 3 min