Planning Generation Harness Loop
요구사항, 도메인/팀 맥락, 소스/API/DB 증거를 에이전트 팀 리뷰로 연결해 실행 가능한 기획 초안을 만드는 오케스트레이션 루프.
기획 문서의 실행 간극
핵심 질문은 "AI가 기획서를 써줄 수 있나?"가 아닙니다. 진짜 질문은 기획 문서를 생성할 때 실제 근거, 화면 상태, 데이터/API, 사람 검토 기준까지 같은 버전 관리 루프에 남는가에 있습니다.
탄탄한 기획은 페이지가 많은 기획서가 아니라 개발/QA/운영 입장에서 재질문이 줄어드는 실행 기준입니다.
문서량보다 실행 신뢰도
AI TF 과정에서 기획-개발 Gap, 문서화 부채, 반복 작업 비효율이 함께 확인됐습니다. AI는 초안을 빨리 만들 수 있었지만, 근거와 결정이 관리되지 않으면 보안 취약점, API 불일치, 엣지 케이스 누락이 그대로 재작업이 됐습니다.
| 관찰한 문제 | 영향 | 루프에서 남기는 것 |
|---|---|---|
| 기획-개발 Gap | 문서 해석이 모호해 재질문, 재작업, 변경 영향도 파악 지연이 반복됩니다. | scope / decision log |
| 문서화 부채 | API 명세와 실제 구현이 어긋나고 신규 인원은 암묵지에 의존하게 됩니다. | spec-code drift report |
| 반복 작업 비효율 | CRUD, 보일러플레이트, QA 초안이 프로젝트마다 다른 품질로 반복됩니다. | template / replay fixture |
| AI 생성물 리스크 | 보안 조건, API 응답 형식, 엣지 케이스가 빠지면 생성 속도가 그대로 재작업이 됩니다. | validator / blocker queue |
요구사항에서 기획 초안까지
요구사항 정의, 도메인/팀 특성화, 소스/API/DB 분석을 하나의 evidence pack으로 묶고, 에이전트 팀이 누락과 충돌을 제안한 뒤 기획 초안 번들로 정리합니다.
회의 메모와 기존 문서에서 목표, 범위, 핵심 기능, Out of scope, 성공 기준을 분리합니다.
도메인 규칙, 사용자 권한, 팀 구성, 기술 스택, 릴리즈 속도, QA 성숙도를 해석 기준으로 둡니다.
라우트, 컴포넌트, API 후보, DB 스키마, 데이터 소유 관계를 읽어 구현 가능성과 drift를 잡습니다.
전문 에이전트들이 누락, 충돌, 보안 리스크, QA 공백을 제안하고 기획 초안 번들로 합칩니다.
분석할 입력 표면
회의 메모, 도메인 맥락, 팀 특성, 화면, 소스, API, DB는 모두 해석 기준이 다릅니다. 각 입력은 출처와 신뢰도, 실패 처리 방식을 가진 증거로 남아야 합니다.
| 입력 | 역할 | 실패 시 처리 |
|---|---|---|
| 요구사항 / 회의 메모 | 문제 정의, 목표, 기능 후보, Out of scope 추출 | 원천 맥락이 약하면 open question |
| 도메인 / 팀 맥락 | 정책, 용어, 이해관계자, 팀 역량, QA 성숙도 프로파일링 | 맥락 미정이면 planning assumption |
| 화면 / 와이어프레임 | 화면 목적, 필드, 버튼, empty/loading/error 상태 확인 | 상태가 안 보이면 screen-state blocker |
| 소스 / API / DB | 라우트, 컴포넌트, API 후보, 스키마, 데이터 소유 관계 연결 | BE 검토 전 FE 전달 금지 |
| QA / 운영 피드백 | 성공, 실패, 예외 케이스와 릴리즈 후 발견된 drift 반영 | 다음 버전 TODO로 승격 |
전문 에이전트 리뷰
하나의 모델이 모든 판단을 대신하지 않습니다. PM, 도메인, UX, FE/BE, QA/Security 관점을 분리해 같은 증거를 검토하고 합의가 필요한 지점을 남깁니다.
Project Card / Scope Decision
Domain Rule Notes
Flow & State Map
API / Data Impact
REQ / QA Matrix
개발이 바로 쓰는 기획 초안
최종 산출물은 긴 문서 하나가 아니라 프로젝트 카드, 플로우, REQ/QA, API 영향, 결정 로그가 묶인 실행 번들입니다.
목적, 사용자, 핵심 기능, Out of scope, 성공 기준을 한 장으로 고정
사용자 흐름, 상태 전환, 권한별 화면 행동을 연결
REQ ID, 우선순위, 수용 기준, 성공/실패/예외 QA 초안 정리
API 후보, 데이터 항목, 소유 관계, 민감도, 연동 리스크 기록
선택 이유, 포기한 범위, trade-off, human review 항목 보존
문서와 구현의 재동기화
개발 이후 화면 소스는 별도 산출물이 아니라 다음 기획의 입력입니다. 라우트, 컴포넌트, API 호출, UI 상태를 읽어 기획안과 구현 사이의 drift를 다음 버전의 질문으로 분리합니다.
implemented-but-undocumented / planned-but-missing / ambiguous-evidence
점수보다 남은 질문
검증 리포트는 문장의 완성도보다 개발/QA/운영이 다시 물어봐야 하는 지점을 먼저 드러내는 표입니다.
| 평가 축 | 확인 질문 | 대표 blocker |
|---|---|---|
| Scope Clarity | 누가, 어떤 문제를, 어디까지 해결하는가 | Out of scope 없음, MVP/Later 혼재 |
| State Visibility | 플로우와 상태 전환이 화면 단위로 보이는가 | empty/error/retry/권한 상태 누락 |
| Role & Data | 역할별 행동과 데이터 민감도, 소유 관계가 있는가 | 권한 매트릭스 없음, 개인정보 판단 누락 |
| Spec to QA | REQ, API 후보, 수용 기준, QA 시나리오가 이어지는가 | 개발/QA가 다시 질문해야 하는 표 |
| Decision History | 선택 이유와 trade-off가 기록됐는가 | 왜 포기했는지 몰라 같은 논쟁 반복 |
반복 실패의 규칙화
API 불일치, 보안 프롬프트 누락, 엣지 케이스 미정의처럼 반복되는 실패는 generator template, validator rule, scorecard 후보로 승격합니다.
api_spec_driftAI가 만든 API 초안과 실제 응답이 달라짐
FE-BE cross-check rulesecurity_prompt_gap보안 조건이 빠져 JWT 저장 같은 위험 패턴 생성
security checklist templateedge_case_missing권한, 삭제, 신고, 예외 상태 같은 도메인 케이스 누락
edge-case matrix validatordoc_debt_backlog문서와 코드가 따로 움직여 온보딩이 암묵지에 의존
source backfeed fixtureAI Planning Orchestration
AI 도구는 기획 초안, 화면, 코드, QA 시나리오를 빠르게 만들 수 있습니다. 하지만 TF 과정에서 확인한 핵심은 생성 속도가 아니라 생성물이 실제 구현과 보안, 데이터, 운영 기준에 계속 맞춰지는가였습니다.
AI가 마구 생성한 초안을 사람이 선별하고 수정하는 구조를 넘어, 근거와 화면과 API와 검토 결정을 같은 버전 관리 루프에 남기는 것이 이 하네스의 목적입니다.