Claude Fable 5 · 上手指南

不要只問它懂不懂答 用 6 個任務 測真實工作流

你已經來到指南頁,下面直接給你完整拆解:Fable 5 是什麼、應該怎樣測、用什麼標準評分,以及怎樣決定它是否值得放進你的工作系統。

Sealed AI vault with amber core
release strategy > model hype

真正問題不是「它有多聰明」,而是「你應該怎樣安全地把它放進工作流」。

01 · What changed

Fable 5 的重點,不是單純更強。

它是一個「能力、風險、公開方式」同時改變的案例。你要學的不是新聞,而是判斷模型何時值得進入 production workflow。

1. 能力層

官方形容 Fable 5 的能力超過任何曾經公開提供的模型。這代表它不是普通 refresh,而是 Anthropic 願意公開的新最高級別。

2. 安全層

同等級 Mythos model 曾用於找出漏洞與 cyberdefense。Fable 5 的公開版本加入 safeguards,隔開高風險能力。

3. 使用層

你不應只問「是否更聰明」。你要問:它能否穩定完成長任務、減少返工、提升整個工作流完成率。

02 · 12-day testing route

6/22 前,用四段測清楚。

不要用零散 prompt 測模型。用一套固定路線,才知道 Fable 5 是否真正提升你的日常產出。

Day 1-2
Baseline

揀 3 個你平時最常做的任務,用原本模型跑一次,記錄完成時間、返工次數、最終品質。

Day 3-5
Long-context test

交給 Fable 5 一份長文檔、會議紀錄、課程大綱或專案資料,測它能否保持上下文一致。

Day 6-9
Workflow test

讓它做完整流程:研究 → 架構 → 草稿 → QA → final。不要只測單一輸出。

Day 10-12
Decision

比較原本模型與 Fable 5:時間是否少 30%?返工是否少?能否做你以前不敢交給 AI 的任務?

03 · Six tasks

6 個必試任務。

如果這 6 個任務沒有明顯提升,你暫時不需要把 Fable 5 放進核心工作流。

長文檔壓縮

給它一份 5,000-15,000 字資料,要求提取決策、風險、下一步,而不是普通摘要。

Code review

讓它找 bug、邊界條件、missing tests。重點是能否指出具體 file / line / risk。

Content reframing

給它一條外國 AI 新聞,要求轉成香港受眾能理解的教學框架。

Agent workflow

讓它設計一個多步驟工作流,包含 checkpoint、rollback、quality gates。

Decision memo

給它兩個方案,要求列出 trade-off、推薦、反對理由、何時應該改變決定。

安全邊界

測它遇到高風險請求時,能否提供安全替代方案,而不是盲目完成。

04 · Scorecard

不要憑感覺判斷。用分數決定。

每個任務跑完後,用 1-5 分記錄。Fable 5 如果只是「感覺更聰明」,不算通過;它必須令完成率、返工率或決策品質明顯改善。

完成度1 = 需要大改;3 = 可用但要修;5 = 接近可直接交付看它能否一次走完整個任務,而不是只答得漂亮。
返工次數記錄你修改了幾輪如果輸出品質高但要改 6 次,實際仍然不省時間。
上下文穩定度長文檔 / 多限制 / 多步驟下是否跑偏Frontier model 的差異通常在長任務才看得出。
風險意識能否指出不確定、假設、缺資料、危險邊界越強的模型,越要看它是否懂得停手。
工作流價值節省時間、減少返工、提高決策品質三選一三項都沒有改善,就暫時不要為新模型付費。
05 · Demo gallery

如果你想一眼看懂它有多強,先看 demo。

文字會令人低估 frontier model。Fable 5 真正恐怖的地方,是它能長時間看、想、試錯,然後完成一個完整環境裡的任務。

Watch hands-on demo

Hands-on 測試:coding、3D worldbuilding、WebGL、physics simulation

這類片適合先讓觀眾建立直覺:Fable 5 不是只答問題,而是能把複雜任務推到可展示、可玩的狀態。

Pokémon FireRed官方提到 Fable 5 用 raw screenshots、沒有地圖或額外遊戲狀態資訊,完成 Pokémon FireRed。這是 vision + long-horizon planning 的直觀例子。
Solar system / eclipses官方 demo:用物理第一原理建立太陽系模擬,並預測 solar eclipses。適合展示「不是畫圖,是推理 + simulation」。
Factorio autonomous play官方 demo:Fable 5 自主玩 Factorio,規劃並建立自動化工廠。適合解釋 agentic planning。
VibeCAD / browser CAD官方 demo:建立 browser-based CAD editor,再用它設計 3D-printable model。適合展示「工具自己造工具」。
Fluid simulation + music官方 demo:寫出跟 classical EDM beat 同步的 fluid simulation。適合展示 coding、感知、節奏與視覺生成的結合。
06 · Testing log

複製這張表,每日填一次。

測模型最怕「今天覺得很強,明天忘記強在哪」。用同一張表追 12 日,你才會知道它是否真的進步了你的工作系統。

日期: 任務名稱: 原本模型完成時間: Fable 5 完成時間: 輸入資料: [貼上文件 / brief / code / notes] Fable 5 輸出評分: - 完成度:__/5 - 返工次數:__ - 上下文穩定度:__/5 - 風險意識:__/5 - 工作流價值:__/5 一句結論: [這個任務是否值得以後交給 Fable 5?原因是什麼?]
07 · Prompt templates

直接複製用。

把方括號內容換成你的真實任務。每次測試都要求它輸出 decision + quality gate,才看得出模型級別。

你是一個 senior operator。 任務:閱讀以下資料,替我產出 decision memo。 輸入資料: [貼上文件 / 會議紀錄 / research notes] 輸出格式: 1. 3 句 executive summary 2. 主要風險 3. 推薦決策 4. 反對此決策的最強理由 5. 下一步行動清單 6. Quality gate:怎樣判斷這份 memo 及格
你是一個 content strategist。 任務:把以下 AI 新聞改寫成香港創業者看得懂的 10 頁 carousel 架構。 輸入: [貼上新聞 / post / source] 要求: - 不要照抄新聞 - 先定義 teachable framework - 每頁只講一個重點 - 最後輸出 caption hook 與 lead magnet keyword
08 · Verified sources

這次不是假新聞。

Fable 5 / Mythos 5 已用官方與科技媒體交叉確認。製作內容前,先做這一步,避免把 AI-generated fake news 做成 carousel。

09 · Extended learning

如果你測完發現有用,
下一步是把 AI 放進穩定流程。

Fable 5 是一個工具;12 Agent 是一套把工具拆成角色、流程、記憶、質檢與交付的方法。你可以先用上面的 6 個測試任務,判斷它是否值得進入你的日常工作。

12
Agent
Workflow
Map
01把任務先拆成角色,不要把所有事交給同一個 chat。
02每個角色有固定輸入、輸出、質檢標準。
03重要資料進入記憶庫,避免每次重新解釋背景。
04交付前先跑 quality gate,再決定能不能出街。
重點不是「有幾多個 AI」,而是每個 AI 在你的工作流入面有清晰責任。
Amy總指揮,負責分流與記憶。
Anna內容腳本與素材整理。
Leo市場研究與競爭分析。
Chris招聘、團隊與合作。
Toxic自動化、workflow、系統。
Small B商業模式與策略。
Tony客戶、CRM、onboarding。
Rose學習、AI 更新、知識庫。
NEO課程、大綱、教材交付。
Derek銷售、成交、異議處理。
Vivian內容策略與 marketing。
JamieCarousel 與視覺化內容。