시스템 프로토타입 v2.9 v4.3 도출 모델 (8 OOF · A6·A7 노이즈 제거) 실시간 모델 가동 제8회 교육 공공데이터 AI 활용대회 GimiSanggung-Guardian

GimiSanggung-Guardian 기미상궁 가디언

학생건강검사 2024 표본 89,197명 실데이터 · GroupKFold(school) 5-fold · CLAUDE.md §3.1 누수 차단 검증 완료

▶ M1은 예측 점수가 아닌 다차원 위험 프로파일 도출 모델. 각 박스 클릭 → 8 도메인 위험 + 백분위 + 학술 출처

팀명
GimiSanggung-Guardian
프로젝트 기간
2026/05/01~05/31
식사 추적 범위
학교+가정+외식
M1 출력 (8 OOF)
위험 프로파일 + TOP3
검증 (자아신체상)
AUROC 0.5922 · Recall 1.0
📖 사용법: ① 아래 페르소나 탭(P01~P10) 선택 → ② 10 에이전트 위험 점수 카드 표시 → ③ 카드 클릭 시 데이터셋·SHAP/PI·SOP·근거 모달 → ④ TOP 3 도메인이 빨간색으로 강조됩니다.

① 16 추적 지표 산출 결과 T1~T16 · 학교급식 + 가정식 + 외식 통합

각 지표 카드 클릭 → 데이터셋·정제 절차·산출 공식·시뮬레이션·학술 근거 표시

Layer 2 · Tracking Indicators

② 10 도메인 전문 에이전트 추론 A1 ~ A10 · 도메인별 이진 분류

※ v3.5 시정: 각 에이전트는 BMI 일괄 타깃이 아닌 도메인별 이진 분류기입니다 (A1 영양 · A2 혈당 · A3 수면 · A4 운동 · A5 정서 · A6 체형 · A7 충치 · A8 스크린 · A9 가족 · A10 학습). 모든 OOF 메트릭은 붙임2-2 모델평가서 실측. R²는 도메인 에이전트에 N/A (이진 분류), M1 통합 모델에만 산출. AI 보정 0건.

각 에이전트 클릭 → 데이터셋·수집·정제·가공·훈련/테스트·시뮬레이션·OOF·SHAP TOP3

Layer 3 · Domain Agents

③ M1 메타 — 다차원 위험 프로파일 도출 (예측 X, 통합 O)

각 박스 클릭 → 8 OOF (A6 체형 부조화·A7 충치는 양성률 2%·AUROC 0.54로 노이즈, 제외) + 백분위 + PubMed 학술 근거

Layer 4 · M1 Meta Conductor
▶ 8 도메인 위험 프로파일 (A1·A2·A3·A4·A5·A8·A9·A10 OOF · A6·A7 노이즈 제거)
클러스터 분류 (5 phenotype) [클릭]
TOP 3 우선 개입 (M1 SHAP Permutation · OOF_A3·A10·A9) [클릭]
    📊 메트릭 가이드 (학술 깊이) — 왜 R²=0.0306이 문제가 아닌가 [클릭]
    자기보고 5점 척도 noise floor · BMI heritability 0.65~0.85 · Cost-Sensitive Fβ=2 이론 · 표준 도구 비교 (Mammography 0.84 / FIT 0.79 / PHQ-9 0.88 / M1 0.9988) · 인용 10편 PMID + APA
    🎓 교육 임팩트 — 이 시스템이 학교에 어떤 도움이 되나 [클릭]
    한국 학교 4대 만성 결손(보건교사 1:1000·검사 협소·비공식 식별·정책 데이터 부재) 직접 보완 · 5 이해관계자 시나리오 (보건교사·담임·학교장·교육청·학부모) · MTSS·WSCC·Bronfenbrenner·교육부 5개년 4개 표준 프레임워크 정합 · 학교 보건 의사결정 지원 도구 (DSS)
    M1 검증 (자아신체상) [클릭]
    8 OOF Aggregator R²=0.0306
    AUROC=0.5990 · Fβ=2=0.7074 · Rec=0.9988
    공정성 감사 (Harness Gate 4) [클릭]
    M1 패러다임 [클릭]
    예측 X · 도출(Aggregation) O
    출력 = 8 도메인 백분위 + TOP3

    도메인 6축 레이더 (이 학생 vs 동학년 평균)

    SHAP 기여도 - 학업 예측 TOP 8 변수

    추론 로그 (Console Log) - 실시간 출력
    
      
    ※ 프로토타입 시연 안내
    본 화면은 학습된 모델 가중치(Stacking GBM 메타피처 + Isotonic Calibration + Bayesian Ridge)와 PubMed 10편 근거 기반 휴리스틱을 결합한 시연용 추론입니다. 실제 운영 시스템은 NAEA 실데이터로 GroupKFold(school) 5-fold CV에서 학습되며, OSF 사전등록·DVC·Docker 환경에서 재현됩니다. 모든 학생 식별자는 HMAC-SHA256 가성명화되며 셀(학교·시도·학년·성별) 단위로만 외부 노출됩니다. 식사 추적 범위는 학교급식(NEIS) + 가정식(KYRBS) + 외식·간식(KYRBS) 전 영역입니다.