FABLE 5 自己改善エージェントシステム

Fable 5 で自己改善するエージェントシステムを作る 14 ステップ
— ループ・Dynamic Workflows・Routines

大半の人は Claude Fable 5 を「コンテキストウィンドウが大きい Sonnet 4.6」として使っている。プロンプトして、5 分動かして、タブを閉じる。これは、Fable 5 が本来設計された「複利するシステム」を作るためのロードマップ全文である。

TL;DR

  1. Fable 5 は数日単位の自律稼働のために作られた、最初の Mythos クラス一般公開モデル。数分で閉じる使い方は Mythos 級の価格を捨てている。
  2. 自己改善 (self-improving) ≠ 自己学習 (self-learning)。モデルの重みではなく「モデルの周囲のシステム」(メモリ・Skill・eval ループ) が走るたびに複利で鋭くなる。
  3. 鍵は 3 つのプリミティブ — /goal・Outcomes のループ、Dynamic Workflows、Routines — に、独立 verifier・STATE.md・vision 自己検証を重ねること。

00導入 — 10 人中 9 人は「複利するエージェントシステム」を知らない

14 steps. 3 tiers. Stop prompting. Start building a system that compounds.

Figure 1: 自己改善エージェントシステムの compound stack 全体図
Figure 1 — compound stack の全体アーキテクチャ (本文 step 03 で下から読み解く)

大半の人は Claude Fable 5 を「コンテキストウィンドウが大きい Sonnet 4.6」のように使っている。プロンプトする。5 分動く。タブを閉じる。

10 人中 9 人のユーザーは、複利するエージェントシステム — すべての実行が次の実行を賢くし、すべての state file が蓄積し、すべての Skill が鋭くなるシステム — を一度も運用したことがない。

Fable 5 は数日間走り続けるために作られた。あなたはそれを数分しか使っていない。これは、Fable 5 が設計された自己改善システムを構築するための 14 ステップのロードマップだ。

Follow my Substack to get fresh AI alpha: movez.substack.com (原文著者の宣伝)

Claude Fable 5 は 2026 年 6 月 9 日にローンチした — 一般公開された最初の Mythos クラスモデルであり、Anthropic が Opus の一段上に置いた tier である。

Claude Fable 5 ローンチの告知画像
Claude Fable 5 — 2026 年 6 月 9 日ローンチ

このロードマップは、Anthropic のエンジニアリング記事・チームの公開実験に基づき、2026 年 6 月時点のローンチドキュメントに照らして検証されている (原文著者による)。

3 つの tier で構成される: Fable 5 が実際に解放するもの、それを複利させる 3 つのプリミティブ (ループ、Dynamic Workflows、Routines)、そしてシステムへと変える自己改善レイヤー

14 ステップの一覧図
14 ステップ × 3 tier の全体マップ

14 steps. 3 tiers. プロンプトするのをやめて、複利するシステムを作り始めよう。

PART 1 · Fable 5 が実際に解放するもの

01Fable 5 は Mythos クラスのモデル。「数日単位の自律性」がヘッドライン

2026 年 6 月 9 日ローンチ。Anthropic が Opus の一段上に導入した tier、その最初の一般公開版。

Mythos クラスの位置づけを示す図
Mythos クラス — Opus の一段上に置かれた新 tier

Mythos Preview は 4 月に Project Glasswing を通じて一握りの重要インフラパートナーに出荷された。Fable 5 は Anthropic が一般公開に足ると判断した版で、高リスク領域のリクエストを拒否する安全クラシファイアを内蔵する。クラシファイアを持たない Mythos 5 は Glasswing 限定のままだ。

Anthropic のローンチドキュメントによる、従来の Claude モデルには持続できなかった Fable 5 の能力:

価格は tier に見合う: 入力 $10 / 100万トークン、出力 $50 / 100万トークン。プロンプトキャッシュによる既存の入力 90% 割引はそのまま適用。

提供面は Claude API、AWS、Amazon Bedrock、Vertex AI、Microsoft Foundry、そして従量課金の Enterprise プラン。これはサブスクリプションのモデルではない。ヘビーユースには相応の請求が来る。

※ 価格・提供面・日付はいずれも原文スレッドの記載値 (Anthropic launch docs 由来とされる)。

02self-improving は self-learning ではない

「自己改善エージェントシステム」という言葉は雑に使われる。実在する版と誇大宣伝の版はまったくの別物で、その差は何かを作る前に理解する価値がある。

self-learning と self-improving の対比図
self-learning (重みの更新) と self-improving (環境の複利) の違い

この意味での自己改善は、あなたが作るシステムの性質だ。Fable 5 が持つのは生の能力 — 長いコンテキスト、サブエージェント委任、vision 自己チェック、数日のスタミナ — であり、それが環境フィードバックのループを「実際に走るたびに複利するもの」へ変える。

Anthropic のエンジニアリングチームは直截にこう書いている:
“Rather than directly prompting and steering Fable 5, it’s often better to design loops that let the model self-correct in response to environment feedback (e.g., /goal or Outcomes) and manage its own context (e.g., via memory).”
(Fable 5 を直接プロンプトして操縦するより、環境フィードバックに応じてモデルが自己修正できるループ (例: /goal や Outcomes) と、自分のコンテキストを自分で管理する仕組み (例: メモリ) を設計するほうが良い場合が多い)

03compound stack: 4 つの層、1 つのフィードバックループ

冒頭の Figure 1 がこのアーキテクチャを 1 枚で示している。下から上へ読む — それがシステムを構築する順序であり、レバレッジが複利する順序だ。

中身役割
Layer 1 · PrimitivesFable 5 本体、サブエージェント、worktree、エージェントが使うツールシステムをまだ持たない生の能力。大半の人が今日使っているのはここだけ
Layer 2 · Orchestration自己修正ループのための /goal と Outcomes。複雑な多段オーケストレーションのための Dynamic Workflows。ラップトップを閉じたままのクラウド実行のための Routinesプリミティブをワークフローに変える
Layer 3 · Memorystate file、Skills、Knowledge Bases、書き留められた教訓明日のセッションが「やり直し」ではなく「再開」になる理由
Layer 4 · Self-improvementvision 自己チェック、eval ループ、ルールの蒸留エージェントが自分の出力を採点し、それを生んだ Skill を改良し、教訓をメモリに書き戻す。ループが閉じる

このアーキテクチャが複利する理由: Layer 1 のすべての出力は Layer 4 へ流れ、そこで採点・蒸留され、Layer 3 に書き戻される。明日の Layer 1 の実行は、昨日研がれたメモリと改良された Skill を継承する。モデルはステートレスだが、その周囲のシステムはそうではない。

04Fable 5 vs Opus 4.8 vs Sonnet 4.6 をいつ使うか。コスト能力マトリクス

Fable 5 はトークンあたり Opus 4.8 の約 5 倍のコスト。自己改善システムのすべてのステップに最上位 tier が要るわけではない。本番運用しているチームは「デフォルトで」ではなく「タスクの複雑性で」ルーティングする。

モデル別のコスト能力マトリクス
コスト能力マトリクス — タスクの複雑性でモデルを振り分ける
モデル担当具体例
Fable 5重量級 orchestrator 役数日にわたる計画、サブエージェントへの委任、vision での作業確認、蓄積された証拠からのルール蒸留。「days at a time」の能力が価格に見合う場所でだけ使う
Opus 4.8難しいが境界のあるサブタスクアーキテクチャ判断、複雑なデバッグ、深いコードレビュー。さらに Fable 5 のクラシファイアがブロックするリクエスト (cyber・bio・chem・蒸留) の明示的なフォールバック先
Sonnet 4.6大量のワーカータスクlint 修正、単純なリファクタ、テストの雛形づくり、ドキュメント更新。fan-out 作業の大半はここで走る
Haiku 4.5grader サブエージェント・安価なクラシファイア独立したコンテキストウィンドウと低コスト — Anthropic が明示的に推奨する verifier 役に理想的

自己改善システムを経済的に成立させるコストパターン (本番運用チームが使用): orchestrator は Fable 5、worker は Sonnet 4.6、grader は Haiku 4.5、クラシファイアのブロック時は Opus 4.8 にフォールバック。Anthropic のエンジニアが社内で使うのと同じパターン。

PART 2 · 3 つのプリミティブ

05/goal vs Outcomes。同じ思想の 2 つの実装

Anthropic の Claude Code チームは、ゴール駆動ループのためのほぼ同一なプリミティブを、ハーネスごとに 1 つずつ公開している。

/goal と Outcomes の比較図
/goal (Claude Code) と Outcomes (CMA) — 共通の形と表面の差

両者は同じ形を共有する: 独立した grader が作業をチェックし、「未達」の判定が次のイテレーションを開始し、grader が合格を出したらループを抜ける。実装の差は「どちらを使うか」を決める表面的な詳細にある。

/goal (Claude Code)Outcomes (CMA)
どこで走るか手元のマシン。クイックなインセッションループAnthropic ホストのインフラ。サンドボックス・GPU・統制された環境で数時間〜数日
向いている作業hands-on のコーディング、flaky テストのデバッグ、単一ファイルの洗練ML 訓練、長時間のマイグレーション、複数日のリサーチ
ゴールの形式プレーンテキストのゴールファイルベースのルーブリック (採点可能な基準)
graderモデル grader、ターミナル内フィードバックサブエージェント grader、ハードな max_iterations 上限

両者が機能する構造的なムーブは共通: コードを書いたエージェントが、それを採点するエージェントではない。それがなぜ重要かは step 06 で掘り下げる。

06verifier サブエージェントは self-critique に勝つ

Anthropic エンジニア Prithvi Rajasekaran はエンジニアリングブログで「モデルは自分の出力の自己批判が苦手」だと示した。Claude Code チームはこれを Fable 5 で実証的に確認した。

“We’ve found that a verifier sub-agent tends to outperform self-critique with Fable 5”
(Fable 5 では verifier サブエージェントが self-critique を上回る傾向がある)

メカニズムは「もっと頑張る」の話ではなく構造的だ。自分の出力を評価するモデルは自分の推論の軌跡が見えており、すでに書いたことと整合する結論を好む。同じ出力を評価する別のモデルには、成果物とルーブリックしか見えない。verifier は maker のゲームに利害 (skin in the game) を持たない。

Parameter Golf 実験の結果チャート
Parameter Golf — Fable 5 と Opus 4.7 の探索の質の差

チャートがヘッドラインの数字以上に示していること:

システム設計上の教訓: 独立 verifier を付けた Fable 5 は、より大きな仮説空間を探索し、負の中間結果から回復する。verifier がなければ、同じモデルに最初の「good enough」を超えさせる強制力は何もない。

07Dynamic Workflows は自己修正パターンを合成する

Dynamic Workflows は 2026 年 5 月 28 日に Claude Code へ出荷された。

アイデアはこうだ: Claude が自分の JavaScript ハーネスをその場で書く — agent()parallel()pipeline() のプリミティブに、間を流れるデータを処理する標準 JS を加えたファイル。ハーネスは汎用品ではなく、そのタスク専用に作られる。

5月29日
私たちの最も強力な新しいClaude Code機能「dynamic workflows」をお知らせできることを大変嬉しく思います! (原文に引用されたアナウンス)

Fable 5 での自己改善システムにおいて、文書化された 6 つの Dynamic Workflow パターンのうち 3 つが採用に値する:

自己改善システムには通常登場しないが知っておく価値のある残り 2 パターン: classify-and-act (クラシファイアでタスクを適切なモデルへルーティング — step 04 のモデルルーティングに有用) と tournament (好みベースのランキングのためのペア比較 — コーディングループでは稀だが、デザインや命名のタスクに有用)。

08並列安全のための worktree。数日の Fable 5 セッションでもファイル衝突なし

自己改善システムが 2 つ以上のエージェントを spawn した瞬間、ファイルの衝突が始まる。2 つのエージェントが同じファイルに書くのは、2 人のエンジニアが相談なしに同じ行へコミットするのと同じ問題だ。

git worktree による分離の概念図
git worktree — 同じ履歴を共有する、物理的に分離された作業ディレクトリ

git worktree がこれを解決する — 同じリポジトリ履歴を共有しつつ、自分のブランチを持つ別の作業ディレクトリ。一方のエージェントの編集は、もう一方のチェックアウトに物理的に触れられない

Fable 5 が検証や専門化のためにサブエージェントを spawn する自己改善システムでは、worktree はオプションではない:

Claude Code では worktree は 3 通りに公開されている: git worktree を直接使う、--worktree フラグでセッションを専用チェックアウトで開く、そしてサブエージェントへの isolation: worktree 設定 — 各ヘルパーがセッション終了後に自動クリーンアップされる新しいチェックアウトを得る。

09数日オーケストレーションのための Routines。ラップトップを閉じても Fable 5 は働く

Routines は 2026 年 4 月 14 日に research preview でローンチした。保存された Claude Code 設定 — プロンプト、リポジトリ、コネクタ、権限 — が、トリガーに応じて Anthropic 管理のクラウドインフラ上で走る。

あなたのラップトップは電源オフでいい。実行はそれでも起きる。

Routines の 3 つのトリガー型の図
Routines — schedule / API / GitHub event の 3 トリガー

Fable 5 にとって、Routines はモデルの能力を回収するトリガー層だ。Anthropic は Fable 5 の「days at a time」を Claude Managed Agents — フルツールを備え、ローカルマシンの制約がないホスト型サンドボックス — の上で測定している。Parameter Golf 実験は 8×H100 GPU 上で最長 8 時間走った。そのクラスの実行はラップトップでは起きない。

3 つの Routine トリガー型を、自己改善パターンに対応づける:

> /schedule daily at 7am, use Fable 5 in CMA
  Goal: Re-run yesterday’s eval suite against the latest skills.
  Any test that newly passes → distill the pattern into the skill.
  Any test that newly fails → investigate, document in STATE.md.
  Post the digest to #engineering. /goal don’t stop until digest is
  posted and STATE.md is updated.

▲ Claude
  Creating routine: nightly-eval-compounding
  - model: claude-fable-5
  - harness: claude managed agent (sandbox)
  - trigger: schedule (0 7 * * *)
  - grader: independent Haiku sub-agent (Outcomes)
✓ Active. First run tomorrow 07:00 local. Skill set will compound.
PART 3 · 自己改善レイヤー

10メモリの 5 段階進行

「エージェントのメモリ」が実務で何を意味するかについて最も有用なフレーミングは、Anthropic チームの Continual Learning Bench 1.0 実験から来ている。メモリの有効活用には 5 段階の進行が必要で、各段階は構造的なムーブであり、モデルごとに進行から離脱する地点が違う。

メモリの 5 段階進行とモデル別の離脱点
5 段階進行 — Fail → Investigate → Verify → Distill → Consult

Continual Learning Bench の SQL 探索タスクにおける、メモリを与えられた各モデルの測定差:

モデル離脱点実際の挙動
Sonnet 4.6step 1 で離脱メモリストアは失敗メモと未解決の推測のリスト (「maybe prc instead of prc_usd?」)。過去のノートをほとんど参照しない。メモリは存在するが複利しない
Opus 4.7step 3 で離脱不確実性をフラグしたスキーマリファレンスを作る (「possibly prc in cents? Verify.」)。検証カバレッジは質問の 7–33% (中央値 ~17%)
Fable 5進行を完走する傾向最良のランでは検証カバレッジが 73% (30 問中 22) に達し、将来のタスクに効く一般則へ学びを蒸留する

11state file。メモリが実際に住む場所

5 段階進行はメンタルモデルで、state file は各段階の出力をモデルが書き込む先だ。CMA で走る Fable 5 にとってメモリはセッション間で生き残るマウント済みファイルシステムであり、ローカルの Claude Code では markdown ファイルや Linear のボードが同じ役割を果たす。

5 段階進行を実際に支える state file の構造 (原文の例・全文):

# Project memory · trading-platform

## Verified facts # stage 3 — stop guessing about these
- prc is in dollars, not cents. Verified via SELECT MIN(prc), MAX(prc) FROM trades.
- user_id matches auth_users.uid via JOIN, not auth_users.id. Confirmed 2026-06-09.
- Test database uses Stripe sandbox keys; production uses real keys via env.

## General rules # stage 4 — consult before re-deriving
- When querying time-bucketed metrics, always include timezone (default UTC mismatches).
- Auth middleware order matters: rate_limit -> jwt -> rbac. Reversing causes 401s.
- For migrations, never use ALTER on tables >1M rows without batching.

## Open failures (investigate next session) # stage 1 → 2
- 2026-06-09: tests/e2e/checkout flakes ~1 in 50 runs. Hypothesis: webhook race.
  Reproduction steps in debug/checkout-flake.md.

## Lessons learned # stage 4 distillations
- PowerShell hits TLS 1.2 issue on Windows CI runners. Always shell out to bash.
- Stripe webhook tests require STRIPE_WEBHOOK_SECRET. Skip with clear message if missing.

## Last session # stage 5 — resume, don’t restart
2026-06-10 03:30 UTC · 7 failures classified, 3 fixes drafted (claude/fix-*), 4 escalated.
Next: verify the auth middleware fix in claude/fix-rate-limit-order against production load.

このファイルは 5 つの段階に対応する 5 セクションを持つ。Verified facts は stage 3 の出力 — エージェントが推測をやめたこと。General rules は stage 4 — 特定ケースを超えて適用できる蒸留済みルール。Open failures は stage 1–2 の仕掛かり。Lessons learned はさらなる stage 4 の出力。Last session は stage 5 のための再開ポインタだ。

このファイルが実際に複利するか、ただ肥大するだけかを分ける運用ルールは 2 つ:

12複利する Skill。教訓はチャットではなく Skill 自体に書く

STATE.md はプロジェクトのメモリ。Skill は手続きのメモリ — プロジェクトを横断して効くべき「この種のことのやり方」だ。

複利のパターン: 非自明な失敗のあとは毎回、教訓を Skill 自体に書き込む。システムが走るたびに Skill が鋭くなる。

複利する Skill の構造を示す図
2 週間複利した Skill — known failure modes・アンチパターンの節が育つ

2 週間複利してきた Skill は、作りたてのものとは見た目が違う。新しいセクションが現れる: 既知の failure modes、ポストモーテムから生まれたルール、本番で観測されたアンチパターン。Skill はもはや静的な指示セットではなく、チームが実際に学んだことの蓄積記録になる。

---
name: ci-triage
description: Classify CI failures, draft fixes for easy ones, escalate the rest.
  Trigger on workflow_run.failure or on the morning triage routine.
---

# CI triage skill

## Classification rules
- env: missing secret, wrong env var. # escalate to human, never auto-fix
- flake: passes on retry without code change. # retry once, then file
- bug: deterministic failure tied to recent commit. # draft fix
- dependency: tied to version bump. # draft rollback
- infra: timeout, OOM, runner issue. # escalate

## Known failure modes # added by the loop over 14 days
- webhook-race: e2e checkout flakes when Stripe webhook arrives mid-test.
  Fix: add 2s settle delay in tests/utils/webhook.ts.
- tls-handshake: Windows runners fail TLS 1.2 in PowerShell. Use bash.
- db-migration: ALTER on trades table >1M rows times out at 30s. Batch in 10k chunks.

## Anti-patterns (do NOT do) # added after real incidents
- Never disable a failing test to make CI green. File it instead.
- Never modify .github/workflows/ without human approval.
- Never touch src/payments/ or src/billing/ without security review.

## State
Update STATE.md after each run with classifications, fixes drafted, escalations.

## Eval suite # step 13 — the loop verifies the skill
Run against eval/ci-triage-cases.jsonl weekly. Any newly-failing case →
add to known failure modes after Outcomes verifier confirms.

複利の契約: 確認されたすべての教訓は、STATE.md だけでなく Skill に入る。STATE.md はプロジェクトスコープで、プロジェクトとともに死ぬ。Skill は ~/.claude/skills/ に住み、あなたとともに移動する。規律を持って 2 週間書き続けた Skill は、Fable 5 が新規プロジェクトでゼロから導き出すものを実質的に上回る。

13vision による自己検証。Fable 5 が自分の UI を goal と照合する

Anthropic が Fable 5 とともに出した見出し能力のひとつが「vision を使って出力を目標と照合する」。抽象的に聞こえるが、これが置き換えるものを見れば具体的だ: スクリーンショットを目視して UI が正しいか確かめる人間、である。

Fable 5 はそのステップを、ループの中で、done を宣言する前に、自分でやる。

本番でのパターン:

このパターンは Anthropic が Parameter Golf 実験で同じハーネスの下で測定したものだ: Fable 5 は訓練チャート (視覚的な成果物) を見て、曲線が基準を満たすかを判断した。ループの中でチャートを読む人間はいなかった。verifier がチャートを読んだ。

14Mythos 安全境界。Fable 5 がやらないこと、そしてその回避設計

最後のステップは、初日に最もスキップされやすく、あとで身をもって学ぶと最も高くつくものだ。

Fable 5 は、特定の高リスクドメイン — サイバーセキュリティ脆弱性研究、生物学、化学、モデル蒸留 — で応答を拒否する安全クラシファイアを内蔵して出荷される。これらのドメインでは、Anthropic は自動的に Claude Opus 4.8 へフォールバックする。これは文書化された仕様であり、バグではない。

自律的に走る自己改善システムにとって、これが意味すること:

一般的な設計原則: 安全境界を failure mode ではなく既知のフォールバックとして扱う。境界の明示的なハンドリングを備えて出荷された自己改善システムは、クラシファイアが進化しても頑健であり続ける。無視したシステムは、Anthropic がポリシーを更新したときに静かなリグレッションを生む。

§ Fable 5 を潜在能力の 10% に留めてしまうミス

§よくあるミス 10 項目 (全文)

どれか 1 つでも当てはまるなら、そこが複利の漏れ口になっている。

結論 — システムを作れ

  1. Fable 5 は速いチャットツールではない。複利するシステムの基盤 (substrate) だ。
  2. 初めて一般公開された Mythos クラスモデルは「より速くプロンプトされる」ために出荷されたのではない。あなたがその周囲に作る自己改善システムの orchestrator になるために出荷された。
  3. 能力のヘッドライン — 数日セッション、サブエージェント委任、vision 自己チェック、蓄積されるメモリ — は、モデルの周囲のシステムが仕事をして初めて価格に見合う。
  4. Anthropic 自身の実験がその差を可視化している。Parameter Golf: 独立 verifier 付きの Fable 5 はより大きなアーキテクチャ変更を探索し、負の中間結果を突き抜けて、Opus 4.7 比で 約 6 倍の改善を達成した。Continual Learning Bench: メモリ付き Fable 5 は 5 段階進行を完走し検証カバレッジ 73%、対する Opus 4.7 は 17%どちらの比較でも、両側のモデルは同じものだ。変わったのは周囲のシステムである。
  5. compound stack のうち、まだやっていない層を 1 つ選ぶ — おそらく verifier サブエージェント (step 06)、state file (step 11)、vision-verify (step 13) のどれか — そして明日それを追加する。その次はもう 1 つ。
  6. 自己改善はモデルの性質ではなく、システムの性質だ。システムを作れ。