1. 能力層
官方形容 Fable 5 的能力超過任何曾經公開提供的模型。這代表它不是普通 refresh,而是 Anthropic 願意公開的新最高級別。
你已經來到指南頁,下面直接給你完整拆解:Fable 5 是什麼、應該怎樣測、用什麼標準評分,以及怎樣決定它是否值得放進你的工作系統。
真正問題不是「它有多聰明」,而是「你應該怎樣安全地把它放進工作流」。
它是一個「能力、風險、公開方式」同時改變的案例。你要學的不是新聞,而是判斷模型何時值得進入 production workflow。
官方形容 Fable 5 的能力超過任何曾經公開提供的模型。這代表它不是普通 refresh,而是 Anthropic 願意公開的新最高級別。
同等級 Mythos model 曾用於找出漏洞與 cyberdefense。Fable 5 的公開版本加入 safeguards,隔開高風險能力。
你不應只問「是否更聰明」。你要問:它能否穩定完成長任務、減少返工、提升整個工作流完成率。
不要用零散 prompt 測模型。用一套固定路線,才知道 Fable 5 是否真正提升你的日常產出。
揀 3 個你平時最常做的任務,用原本模型跑一次,記錄完成時間、返工次數、最終品質。
交給 Fable 5 一份長文檔、會議紀錄、課程大綱或專案資料,測它能否保持上下文一致。
讓它做完整流程:研究 → 架構 → 草稿 → QA → final。不要只測單一輸出。
比較原本模型與 Fable 5:時間是否少 30%?返工是否少?能否做你以前不敢交給 AI 的任務?
如果這 6 個任務沒有明顯提升,你暫時不需要把 Fable 5 放進核心工作流。
給它一份 5,000-15,000 字資料,要求提取決策、風險、下一步,而不是普通摘要。
讓它找 bug、邊界條件、missing tests。重點是能否指出具體 file / line / risk。
給它一條外國 AI 新聞,要求轉成香港受眾能理解的教學框架。
讓它設計一個多步驟工作流,包含 checkpoint、rollback、quality gates。
給它兩個方案,要求列出 trade-off、推薦、反對理由、何時應該改變決定。
測它遇到高風險請求時,能否提供安全替代方案,而不是盲目完成。
每個任務跑完後,用 1-5 分記錄。Fable 5 如果只是「感覺更聰明」,不算通過;它必須令完成率、返工率或決策品質明顯改善。
文字會令人低估 frontier model。Fable 5 真正恐怖的地方,是它能長時間看、想、試錯,然後完成一個完整環境裡的任務。
這類片適合先讓觀眾建立直覺:Fable 5 不是只答問題,而是能把複雜任務推到可展示、可玩的狀態。
測模型最怕「今天覺得很強,明天忘記強在哪」。用同一張表追 12 日,你才會知道它是否真的進步了你的工作系統。
把方括號內容換成你的真實任務。每次測試都要求它輸出 decision + quality gate,才看得出模型級別。
Fable 5 / Mythos 5 已用官方與科技媒體交叉確認。製作內容前,先做這一步,避免把 AI-generated fake news 做成 carousel。
Fable 5 是一個工具;12 Agent 是一套把工具拆成角色、流程、記憶、質檢與交付的方法。你可以先用上面的 6 個測試任務,判斷它是否值得進入你的日常工作。