Skip to content

1 #2

@Generoustandard

Description

@Generoustandard
flowchart TD
  %% =========================
  %% Top-level E2E Flow
  %% =========================
  A[불량 문제 정의<br/>(불량 유형/목표/비용(미탐·오탐)/적용 범위)] --> B[E2E Template 선택/생성<br/>(전처리~리포트 포함)]
  B --> C[데이터 전처리(완료본 입력)<br/>Template 기반 설정 적용]
  C --> D[데이터 QA/편향/누설 자동 점검<br/>(기간·라인·장비·제품군)]
  D --> E[분할 전략 자동 생성<br/>(Random + TimeSplit + GroupSplit + Subset)]
  E --> F[모델/탐색공간 자동 구성<br/>(카테고리별 10+ 모델, 프리셋+고급공간)]
  F --> G{기본 탐색 결과 양호?}

  %% =========================
  %% Training / Tuning Branch
  %% =========================
  G -- 예 --> H[기본 탐색(자동)<br/>Stage1 랜덤 탐색(짧은 예산)]
  G -- 아니오 --> I[고급 탐색(확장 + 수동개입 가능)<br/>모델 추가/제외, 탐색공간 수정, 예산 확대]

  H --> J[정교화(자동)<br/>Stage2 베이지안/Optuna 스타일]
  I --> J

  J --> K[최종 재학습(자동)<br/>Stage3 best params로 train+valid 재학습]
  K --> L[평가/검증 자동화<br/>리더보드 + subset 성능 + 시간 일반화]
  L --> M[Champion–Challenger 선정(자동)<br/>성능+안정성+비용+해석성 점수화]

  %% =========================
  %% Explanation / Control Limits
  %% =========================
  M --> N[해석 자동화<br/>중요도(perm/SHAP), PDP/ICE, 임베딩(PCA/UMAP/t-SNE)]
  N --> O[관리선 추천(룰 추출)<br/>트리룰/서로게이트 트리<br/>coverage·lift·기간/라인 안정성]
  O --> P[아티팩트 저장(자동)<br/>runs/{run_id}/ config·split·metrics·plots·model]
  P --> Q[Registry 등록(선택/승인)<br/>models/{model_id}/ signature·schema·기간·지표·룰]

  %% =========================
  %% New Data Validation Entry Points
  %% =========================
  Q --> R{신규 데이터 검증 진입점}
  P --> R

  R -- Champion List에서 선택 --> S[Champion 모델 선택]
  R -- 분석 히스토리에서 선택 --> T[과거 Run 선택(재현/복제)]

  S --> U[신규 데이터 업로드/선택]
  T --> U

  %% =========================
  %% New Data Validation Checks
  %% =========================
  U --> V[호환성 검사(자동)<br/>피처 스키마/타입/카테고리 레벨<br/>전처리 signature 일치]
  V --> W[드리프트/품질 점검(자동)<br/>X drift(분포), P(ŷ) drift, 결측/극단치]
  W --> X{라벨(Y) 존재?}
  X -- 예 --> Y[성능 재평가(자동)<br/>동일 지표 + subset 성능 + CM/PR/ROC]
  X -- 아니오 --> Z[무라벨 검증(자동)<br/>스코어 분포/드리프트/룰 coverage 변화]

  Y --> AA[관리선/룰 유지 검증(자동)<br/>coverage·lift·기간/라인 안정성]
  Z --> AA

  AA --> AB{재학습/재튜닝 필요?}
  AB -- 예 --> AC[재학습 제안/실행(템플릿 기반)<br/>새 기간 포함하여 재탐색/갱신]
  AB -- 아니오 --> AD[현 Champion 유지<br/>(운영 적용 가능 상태)]

  %% =========================
  %% Reporting
  %% =========================
  AC --> AE[보고서 자동 생성(LLM Ready)<br/>전체 과정 요약 + 근거 링크]
  AD --> AE
  M --> AE
  AE --> AF[결과 공유/전달<br/>전문가 그룹 재분석 지원]

  %% =========================
  %% Styling (optional)
  %% =========================
  classDef decision fill:#fff,stroke:#333,stroke-width:1px;
  class G,R,X,AB decision;
Loading

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions