Loopy-Era 자가개선 인프라의 실제 구현 상태. 실수에서 규칙이 태어나고, 규칙이 스스로 강해지며, 효과가 자동으로 검증된다.
규칙은 사람이 미리 작성한다. AI가 실수하면 사람이 고친다. 같은 실수가 반복되어도 시스템은 변하지 않는다. 매 세션이 처음부터 시작된다.
실수에서 규칙이 자동 생성된다. SOFT 규칙이 2회 재발하면 HARD로 승격된다. 개선이 유효한지 자동 검증하고 실패하면 rollback한다. 시스템이 스스로 강해진다.
fix: 커밋 → 신호 감지 → scaffold 수정 → HARD 비율 측정 → keep/discard. 이것이 반복되며 시스템이 수렴한다.
| # | 차원 | 점수 | 비율 | 상태 |
|---|---|---|---|---|
| D1 | 파이프라인 완성도 | 6/6 | 100% | |
| D2 | 크로스 Phase 통합 | 9/9 | 100% | |
| D3 | HARD 강제 깊이 | 10/10 | 100% | |
| D4 | 자가개선 속도 | 6/6 | 100% | |
| D5 | 수렴 성숙도 | 5/5 | 100% | |
| 종합 | 36/36 | 100% | S |
~/.claude/pending/self-improve-{project}.json으로 변환. 다음 세션의 UserPromptSubmit에서 self-improve-check.sh가 pending을 감지하여 자동 실행.os.getcwd() 기반으로 처리.exit 2로 push를 HARD 차단 (13건의 exit code). scaffold-violation-check.sh, code-quality-check.sh, no-localstorage.sh, no-env-commit.sh 등 10개 이상의 HARD gate. bash -n 구문 검증도 통과.모든 체크는 deterministic — grep count, 파일 존재, bash -n, 숫자 비교. LLM 판단 없음.
핵심: grep 기반 메타-검증은 "문서에 적혀있다"만 증명하고 "실행된다"는 증명할 수 없다. 36개 체크 중 35개가 grep, 1개만 bash -n(런타임). 다음 단계는 런타임 검증 비율을 높이는 것.
측정일: 2026-04-05 | loopy-era-eval 36/36 = 100% | 5차원 harness-report 100%
데이터 출처: ~/.claude/skills/, ~/.claude/hooks/, ~/.claude/logs/