Keystone Agent Team Playbook
04 에이전트 Markdown

Agent Team Playbook

planner, builder, reviewer, QA, security가 함께 움직이는 에이전트 운영 플레이북

Source
src/content/docs/agent-team-playbook.md
Order
32

한눈에 보기

Agent Team Playbook은 AI agent를 개별 도구가 아니라 역할, 상태, 승인, 증거를 가진 팀으로 운영하는 방법을 설명합니다. 계획, 설계, 구현, QA, 리뷰, 보안, 배포 판단이 어디서 나뉘고 어디서 다시 합쳐지는지 보여줍니다.

이 문서에서 확인할 것

  • planner, architect, builder, QA, reviewer, security의 역할 카드
  • 작업 규모와 위험도에 따른 라우팅 기준
  • 이벤트 원장과 운영 리듬으로 상태를 남기는 방식

에이전트를 도구가 아니라 팀으로 운영하기

에이전트 운영의 목표는 모든 일을 자동화하는 것이 아닙니다. 반복 작업은 자동화하고, 위험한 판단은 사람에게 남기며, 상태와 검증을 구조화하는 것입니다.

flowchart TD
  U["사용자 요청"] --> I["Intake<br/>목표와 경계"]
  I --> P["Planner<br/>범위와 종료 조건"]
  P --> A["Architect<br/>설계와 계약"]
  A --> B["Builder<br/>구현"]
  B --> Q["QA<br/>테스트와 재현"]
  Q --> R["Reviewer<br/>회귀와 품질"]
  R --> S{"보안/배포 영향?"}
  S -->|있음| SEC["Security / Release Lead"]
  S -->|없음| D["Done with evidence"]
  SEC --> D

  subgraph State["State Plane"]
    LOG["WORKLOG"]
    EVT["agent-events.jsonl"]
    HAND["handoff"]
  end

  P -.-> LOG
  B -.-> EVT
  Q -.-> EVT
  D -.-> HAND

역할 카드

역할책임종료 조건
Planner의도, 범위, 승인 레벨 정리작업 단위와 검증 기준이 명확함
Architect상태 전이, API, 데이터 흐름 설계구현자가 추측하지 않아도 됨
Builder코드, 문서, 테스트 구현변경이 범위 안에 있음
QA테스트, 재현, 브라우저 검증실패/성공 증거가 남음
Reviewer회귀, 품질, 범위 드리프트 점검승인 또는 수정 요청이 명확함
Security인증, 권한, 결제, 비밀값 점검위험과 완화책이 분리됨
Release Lead배포 가능성, 롤백 포인트 판단ship/no-ship 근거가 있음

규모별 라우팅

작업 규모라우팅이유
1~3개 파일Builder 직행계획 비용이 구현 비용보다 크지 않게 유지
4~15개 파일Planner -> Builder -> QA범위와 검증 기준을 먼저 고정
16개 이상 또는 다중 도메인Orchestrator -> 병렬 subagent역할별 책임과 결과 통합 필요
반복 오류 2회 이상Investigator 투입같은 전략으로 재시도하지 않음
인증/권한/결제/DBSecurity gate 추가위험이 기능 구현보다 큼

승인 모델

flowchart LR
  P0["P0 Observe<br/>읽기, 요약, lint"] --> P1["P1 Scoped Auto<br/>docs, tests, 작은 수정"]
  P1 --> P2["P2 Batch Approval<br/>브랜치, 티켓, 스프린트"]
  P2 --> P3["P3 Explicit Approval<br/>DB, auth, deploy, push"]

승인은 매번 묻는 방식보다 범위 단위로 관리하는 것이 낫습니다. 단, P1 자동 실행은 이미 범위가 확정된 저위험 후속 작업에만 적용합니다.

이벤트 원장

대화만으로 운영 상태를 추적하면 대시보드와 자동화가 약해집니다. 작업 상태는 사람이 읽는 문서와 기계가 읽는 이벤트를 같이 남기는 편이 좋습니다.

이벤트의미
task_created작업이 큐에 들어옴
task_started담당 에이전트가 실행 시작
task_blocked외부 판단이나 정보가 필요
approval_needed사람 승인 대기
qa_passed / qa_failed검증 결과
security_required보안 검토 필요
release_ready배포 후보 상태

운영 리듬

  1. Daily Scrum은 상태를 요약하고 blocker를 드러낸다.
  2. Build Flow는 계획, 구현, 검증, 리뷰를 분리한다.
  3. Blocked Flow는 사람 판단이 필요한 항목을 승인 큐로 올린다.
  4. Retrospective는 반복 실패를 rule, skill, hook 후보로 보낸다.

공개용 설명 방식

에이전트 운영을 공개 문서로 쓸 때는 “어떤 모델을 썼다”보다 “어떤 역할이 어떤 증거를 남겼다”가 중요합니다. 역할, 상태, 승인 기준, 검증 결과가 보이면 내부 시스템을 공개하지 않아도 운영 수준을 설명할 수 있습니다.

Source Notes

이 문서는 ai-rules의 Agent Operating Model, agents guide와 keystone-hub의 manager/orchestrator, team, self-improve 운영 문서를 공개용 플레이북으로 재구성했습니다.