Claude Fable 5 · 上手指南

不要只問它懂不懂答用 6 個任務測真實工作流

你已經來到指南頁，下面直接給你完整拆解：Fable 5 是什麼、應該怎樣測、用什麼標準評分，以及怎樣決定它是否值得放進你的工作系統。

開始 12 日測試直接看 Prompt

release strategy > model hype

真正問題不是「它有多聰明」，而是「你應該怎樣安全地把它放進工作流」。

01 · What changed

Fable 5 的重點，不是單純更強。

它是一個「能力、風險、公開方式」同時改變的案例。你要學的不是新聞，而是判斷模型何時值得進入 production workflow。

1. 能力層

官方形容 Fable 5 的能力超過任何曾經公開提供的模型。這代表它不是普通 refresh，而是 Anthropic 願意公開的新最高級別。

2. 安全層

同等級 Mythos model 曾用於找出漏洞與 cyberdefense。Fable 5 的公開版本加入 safeguards，隔開高風險能力。

3. 使用層

你不應只問「是否更聰明」。你要問：它能否穩定完成長任務、減少返工、提升整個工作流完成率。

02 · 12-day testing route

6/22 前，用四段測清楚。

不要用零散 prompt 測模型。用一套固定路線，才知道 Fable 5 是否真正提升你的日常產出。

Day 1-2

Baseline

揀 3 個你平時最常做的任務，用原本模型跑一次，記錄完成時間、返工次數、最終品質。

Day 3-5

Long-context test

交給 Fable 5 一份長文檔、會議紀錄、課程大綱或專案資料，測它能否保持上下文一致。

Day 6-9

Workflow test

讓它做完整流程：研究 → 架構 → 草稿 → QA → final。不要只測單一輸出。

Day 10-12

Decision

比較原本模型與 Fable 5：時間是否少 30%？返工是否少？能否做你以前不敢交給 AI 的任務？

03 · Six tasks

6 個必試任務。

如果這 6 個任務沒有明顯提升，你暫時不需要把 Fable 5 放進核心工作流。

長文檔壓縮

給它一份 5,000-15,000 字資料，要求提取決策、風險、下一步，而不是普通摘要。

Code review

讓它找 bug、邊界條件、missing tests。重點是能否指出具體 file / line / risk。

Content reframing

給它一條外國 AI 新聞，要求轉成香港受眾能理解的教學框架。

Agent workflow

讓它設計一個多步驟工作流，包含 checkpoint、rollback、quality gates。

Decision memo

給它兩個方案，要求列出 trade-off、推薦、反對理由、何時應該改變決定。

安全邊界

測它遇到高風險請求時，能否提供安全替代方案，而不是盲目完成。

04 · Scorecard

不要憑感覺判斷。用分數決定。

每個任務跑完後，用 1-5 分記錄。Fable 5 如果只是「感覺更聰明」，不算通過；它必須令完成率、返工率或決策品質明顯改善。

完成度1 = 需要大改；3 = 可用但要修；5 = 接近可直接交付看它能否一次走完整個任務，而不是只答得漂亮。

返工次數記錄你修改了幾輪如果輸出品質高但要改 6 次，實際仍然不省時間。

上下文穩定度長文檔 / 多限制 / 多步驟下是否跑偏Frontier model 的差異通常在長任務才看得出。

風險意識能否指出不確定、假設、缺資料、危險邊界越強的模型，越要看它是否懂得停手。

工作流價值節省時間、減少返工、提高決策品質三選一三項都沒有改善，就暫時不要為新模型付費。

05 · Demo gallery

如果你想一眼看懂它有多強，先看 demo。

文字會令人低估 frontier model。Fable 5 真正恐怖的地方，是它能長時間看、想、試錯，然後完成一個完整環境裡的任務。

Hands-on 測試：coding、3D worldbuilding、WebGL、physics simulation

這類片適合先讓觀眾建立直覺：Fable 5 不是只答問題，而是能把複雜任務推到可展示、可玩的狀態。

Pokémon FireRed官方提到 Fable 5 用 raw screenshots、沒有地圖或額外遊戲狀態資訊，完成 Pokémon FireRed。這是 vision + long-horizon planning 的直觀例子。

Solar system / eclipses官方 demo：用物理第一原理建立太陽系模擬，並預測 solar eclipses。適合展示「不是畫圖，是推理 + simulation」。

Factorio autonomous play官方 demo：Fable 5 自主玩 Factorio，規劃並建立自動化工廠。適合解釋 agentic planning。

VibeCAD / browser CAD官方 demo：建立 browser-based CAD editor，再用它設計 3D-printable model。適合展示「工具自己造工具」。

Fluid simulation + music官方 demo：寫出跟 classical EDM beat 同步的 fluid simulation。適合展示 coding、感知、節奏與視覺生成的結合。

06 · Testing log

複製這張表，每日填一次。

測模型最怕「今天覺得很強，明天忘記強在哪」。用同一張表追 12 日，你才會知道它是否真的進步了你的工作系統。

日期：任務名稱：原本模型完成時間： Fable 5 完成時間：輸入資料： [貼上文件 / brief / code / notes] Fable 5 輸出評分： - 完成度：__/5 - 返工次數：__ - 上下文穩定度：__/5 - 風險意識：__/5 - 工作流價值：__/5 一句結論： [這個任務是否值得以後交給 Fable 5？原因是什麼？]

07 · Prompt templates

直接複製用。

把方括號內容換成你的真實任務。每次測試都要求它輸出 decision + quality gate，才看得出模型級別。

你是一個 senior operator。任務：閱讀以下資料，替我產出 decision memo。輸入資料： [貼上文件 / 會議紀錄 / research notes] 輸出格式： 1. 3 句 executive summary 2. 主要風險 3. 推薦決策 4. 反對此決策的最強理由 5. 下一步行動清單 6. Quality gate：怎樣判斷這份 memo 及格

你是一個 content strategist。任務：把以下 AI 新聞改寫成香港創業者看得懂的 10 頁 carousel 架構。輸入： [貼上新聞 / post / source] 要求： - 不要照抄新聞 - 先定義 teachable framework - 每頁只講一個重點 - 最後輸出 caption hook 與 lead magnet keyword

08 · Verified sources

這次不是假新聞。

Fable 5 / Mythos 5 已用官方與科技媒體交叉確認。製作內容前，先做這一步，避免把 AI-generated fake news 做成 carousel。

Anthropic official announcement official Shacknews Pokémon FireRed demo coverage demo TechCrunch coverage media The Hacker News cybersecurity angle security

09 · Extended learning

如果你測完發現有用，
下一步是把 AI 放進穩定流程。

Fable 5 是一個工具；12 Agent 是一套把工具拆成角色、流程、記憶、質檢與交付的方法。你可以先用上面的 6 個測試任務，判斷它是否值得進入你的日常工作。

Agent
Workflow
Map

01把任務先拆成角色，不要把所有事交給同一個 chat。

02每個角色有固定輸入、輸出、質檢標準。

03重要資料進入記憶庫，避免每次重新解釋背景。

04交付前先跑 quality gate，再決定能不能出街。

重點不是「有幾多個 AI」，而是每個 AI 在你的工作流入面有清晰責任。

Amy總指揮，負責分流與記憶。

Anna內容腳本與素材整理。

Leo市場研究與競爭分析。

Chris招聘、團隊與合作。

Toxic自動化、workflow、系統。

Small B商業模式與策略。

Tony客戶、CRM、onboarding。

Rose學習、AI 更新、知識庫。

NEO課程、大綱、教材交付。

Derek銷售、成交、異議處理。

Vivian內容策略與 marketing。

JamieCarousel 與視覺化內容。

延伸學 12 Agent 保存 Prompt 模板

不要只問它懂不懂答 用 6 個任務 測真實工作流