一天,搬完 5,000 萬行程式碼的系統遷移——原本要一整個工程團隊做兩個多月。
這是金流巨頭 Stripe 用 Claude Fable 5 交出的成績單。
6 月 9 日,Anthropic 正式發表這個模型。官方說法很狂:這是他們公開發布過能力最強的模型。但官方說法你聽聽就好,真正有價值的,是全世界用戶拿到手之後的真實反應。
過去 24 小時,我把美國、日本、韓國、台灣、中國、歐洲六大市場的技術社群都翻了一遍。Hacker News(美國工程師圈最大的討論區)的發布討論串,一天內衝破 1,600 分、累積 1,283 則留言——通常破千分就是年度大事等級。日本工程師凌晨三點發出實戰解析;韓國匿名板被洗版;歐洲媒體則在吵一條完全不同的事。
這篇幫你整理成一份「全球開箱報告」:哪些驚豔是真的、哪些地雷會踩到你、台灣的你現在該怎麼做。
本文重點
Fable 5 是第一個全面開放的「Mythos 等級」模型,能力跳級;針對資安、生物化學、模型蒸餾三類高風險請求加上了安全防護
全球實測共識:長時間複雜任務是神器,簡單任務是殺雞用牛刀
四大地雷先知道:額度燒很快、安全防護很敏感、6/22 後要另外付費、對話一律保留 30 天
不只工程師受惠:文件比對、營運分析、跨部門報告,都可以整包發出去等驗收
文末有我給企業用戶的 4 個行動建議
先花 3 分鐘搞懂:Fable 5 是什麼?
進入正題前,先看官方 2 分鐘發表影片。我幫你燒好了中英雙語字幕,看完再往下讀會更有感:
故事要從今年 4 月說起。Anthropic 訓練出一個新模型,測試時發現它太會找資安漏洞了——能找出數千個漏洞的模型,也能被拿來發動攻擊。所以他們沒有公開發布,而是取名 Claude Mythos Preview,只開放給保護關鍵基礎設施的資安單位使用。
現在,他們幫這個模型加上了夠強的安全防護,公開版本就叫 Claude Fable 5。同一個模型、兩個名字,差別只在防護機制。
你需要知道的四件事:
能力:官方表示幾乎所有基準測試都是目前最強,而且任務越長、越複雜,領先幅度越大
安全防護:涉及資安、生物化學、模型蒸餾(把它的能力抄走、拿去訓練別家模型)的請求,會自動改由上一代最強的 Opus 4.8 回答。官方數據:95% 以上的使用過程完全不會碰到
價格:API 按用量計費,單價是 Opus 4.8 的兩倍。白話翻譯:一百萬 token 大約是 50 萬個中文字,輸入每百萬 token 收 10 美元、輸出收 50 美元。重度使用的話,一個下午燒掉兩、三千元台幣很正常
怎麼用到:你需要 Claude Pro 以上的付費方案(月費 20 美元起、約台幣 650 元)。訂閱後打開 claude.ai,在模型選單選 Fable 5 就能用,6 月 22 日前不會另外扣費
Fable 5 全球實測驚豔面:高手都在瘋什麼?
先看一個所有人都聽得懂的實驗
華頓商學院教授 Ethan Mollick 讓 Fable 5 自主工作 9.5 小時,做出一個研究圈想要多年、卻一直沒人動手寫的統計工具。過程中它還自己開了幾個分身互相檢查工作,教授只負責驗收。
他形容自己的工作模式徹底變了:以前是盯著 AI 的每一步,現在是直接發包、等交件。
記住這個畫面,後面所有案例都是同一件事的不同版本。
美國:重量級玩家集體背書
Django 框架共同創造者 Simon Willison 在 Hacker News 上說,他丟給 Fable 5 一堆非常困難的問題,它全部輾過去。他的結論只有一個詞:「a beast」——一頭猛獸。
同一串討論裡,有開發者把 Opus 4.8 和 GPT Codex 5.5 都解不開的逆向工程難題丟給它,30 分鐘後完美解決。翻成白話:兩個頂尖 AI 都卡關的難題,它半小時搞定。
媒體公司 Every 的團隊用自家「資深工程師」基準測試評分:Fable 5 拿 91 分,Opus 4.8 只有 63 分,GPT-5.5 是 62 分。
日本:實戰文產出全球最快
發表後幾小時,日本工程師寫作平台 Zenn 和 note 就出現多篇長文解析,最早一篇發文時間是凌晨兩點五十二分。
日本 X 圈最紅的一篇實測:有開發者讓 GPT-5.5 Pro 來評價 Fable 5 寫的任務計畫,結果 GPT-5.5 Pro 看完直接認輸,承認對方的計畫比自己的好。一句「讓對手親自蓋章認證」勝過所有跑分。
韓國:高手指標
韓國最大匿名論壇之一 DCInside 上,有開發者回報:同一個排序演算法,Opus 4.8 反覆失敗了十次,Fable 5 一次就過。翻成白話:以前要來回催十次的工作,現在一次過。
另一位獨立開發者直接喊它是「AI 之王」——他正用 Fable 5 把手上所有專案一口氣收尾,在海外上線的產品即將突破 30 個,還說「再貴都沒關係,拜託別下架」。
韓國社群還有一個很妙的風向觀察:以前是一般人在吹 Claude、高手在吹別家;現在反過來了——「真正的高手都在讚頌 Fable」。任務越難的人,越懂它強在哪。
中文圈:思考品質有質變
中國有評測愛好者用經典邏輯陷阱題實測,翻開模型的思考過程後發現:Fable 5 是直接推理出正確答案,而不是先算錯再自我修正。這跟 Opus 4.7、4.8 的行為有本質上的差異。
台灣的討論慢半拍,但已經開始發酵:Threads 上科技帳號的介紹文底下,最熱門的留言不是問能力,而是問「什麼時候可以取代 4.7、4.8」——大家想知道的是何時能拿它當日常主力。
如果你不寫程式,這些跟你有什麼關係?
把「逆向工程」換成你的日常就懂了:一份 300 頁的標案文件逐條比對、一整季客訴資料的歸納分析、一份拖了三個月的跨部門報告整合。
全球高手驗證的是同一件事——以前要盯著 AI 一步一步做的工作,現在可以整包發出去、等驗收。重點不在寫程式,在於它能自己連續工作好幾個小時不迷路。這對非技術部門的意義,其實比對工程師更大。
任務越難、越長、越複雜,Fable 5 的優勢越明顯。
Fable 5 四大地雷:額度、防護、收費、資料保留
地雷 1:額度燒得超快
這是全球抱怨聲量最大的一條。先補一個背景:Max 是 Claude 個人訂閱的最高階方案,月費 100 到 200 美元,額度以每 5 小時為一個週期——連付最多錢的用戶都在喊撞牆,就知道它多會吃額度。災情如下:
日本有 Max 訂閱用戶實測,大約 10 分鐘就撞到 5 小時額度的上限
另一位日本開發者只做了小規模的程式碼審查,就燒掉 36% 額度
Reddit 上有最高階方案的用戶看著額度「每分鐘跳 2%」——不是每小時,是每分鐘
Simon Willison 拿到權限 4 個半小時,燒掉相當於 82.92 美元(約台幣 2,700 元)的 token
不過也有反方觀點值得參考。韓國網友算了一筆帳:單次用量雖然變高,但如果一次就做對、來回修正的次數大減,總成本反而是省的。Hacker News 上也有人用自己的真實工作驗證:Fable 5 開中等推理強度,結果比 Opus 4.8 開最高強度更好,而且不會浪費 token 在原地繞圈。
重任務划算,輕任務超虧。
地雷 2:安全防護是「敏感肌」
防護機制的誤判,是第二大抱怨來源。真實災情包括:
有醫學影像研究人員想請它審一篇論文,被判定為生物議題,改由 Opus 4.8 回答
有人問「粒線體是不是細胞的發電廠」這種國中生物等級的問題,也觸發了防護
有工程師做公司內部的業務開發名單工具,一直被當成資安威脅
中國有用戶請它看一個 API 轉接工具的程式碼,馬上被切換到 Opus 4.8
這裡要幫大家校正一個觀念:被「擋下」不是拒絕回答,而是自動改由 Opus 4.8 接手,你會收到通知,對話可以繼續。對一般商務應用影響不大;但如果你在醫療、生技、資安產業,導入前一定要先用自己的真實任務測過。
Anthropic 自己也承認防護目前調得偏保守,承諾會持續降低誤判率。
地雷 3:免費只到 6/22,之後 Fable 5 怎麼收費?
訂閱方案的免費包含期只到 6 月 22 日。之後想繼續用,要另外購買 usage credits(先儲值、用多少扣多少)。這個設計在全球都被罵翻:
Hacker News 酸這是「第一口免費」的行銷手法
日本工程師圈把「6 月 23 日之後改為按用量計費」列為最大痛點
中國社群直接定調「飢餓行銷」
官方的說法是:算力不夠,先求大家都能試到,等產能跟上會盡快把 Fable 5 重新納入訂閱方案。話雖如此——這兩週的窗口,就是你最低成本的試用期。
地雷 4:所有對話一律保留 30 天
這條台灣媒體幾乎沒人講,但歐洲整個炸鍋:Fable 5 等級的模型,所有對話資料一律保留 30 天,連原本簽了零保留協議的企業客戶也不例外。德國老牌科技媒體 heise 直接點名:這撞上歐盟個資法 GDPR,是金融、法律、醫療產業的導入障礙。
Anthropic 強調這些資料不會拿來訓練模型、只用於安全偵測、30 天後刪除。對多數台灣中小企業影響有限,但受監管產業在導入評估時,這條必須請法遵部門看過。
全球溫差,一句話總結
美國看能力、日本算錢包、韓國看高手、中國邊用邊罵、歐洲盯合規——而台灣的你,手上正握著兩週的試用窗口。
我給企業用戶的 4 個行動建議
看完全球的災情與戰報,回到你身上。我的建議很具體:
1. 把握 6/22 前的窗口,拿「真實的重任務」去測
試駕新機型,不要在停機坪繞圈圈,要拉上天空。拿你手上最難的真實任務丟給它:上百頁的文件分析、拖了半年的流程重整、複雜的跨部門報告。輕任務測不出它的價值,你只會覺得「跟之前差不多,還比較貴」。
2. 學會任務分流,別把牛刀拿去殺雞
一個簡單的分流標準:你自己做 30 分鐘內能搞定的(回信、改錯字、摘要一份文件),用一般模型就好;你自己做要花半天以上、步驟超過五步的(整批文件比對、寫完整報告、重整一套流程),才值得開 Fable 5。
這正是我常說的——你是機長,AI 是機組人員。機長的工作不是自己跑去端咖啡,而是把對的任務派給對的組員。
3. 企業導入前,先做資料分級
這是我帶企業導入時的標準動作(這次日本顧問圈也給出同一套建議)。最簡單的起手式是三級制:
機密(客戶個資、未公開財報、製程參數):禁止貼進任何雲端 AI
內部(會議記錄、一般簡報、流程文件):可以用,但先拿掉人名與客戶名
公開(官網內容、新聞稿):不設限
指定一個窗口(通常是資訊或品保主管),花一週把常用的文件類型對進這三格,再開放團隊使用。
4. 指定 1-2 位種子成員,把免費窗口變成內部測試
別讓全公司散兵游勇各測各的。挑一兩位對 AI 有熱情的同仁,給他們真實任務和兩週時間,結束後在內部分享會報告:哪些任務值得上 Fable 5、哪些不用。多數企業導入 AI 失敗,不是工具不行,是缺了把個人經驗變成組織能力的這一步。
結語:窗口已開,時間有限
Fable 5 帶來的不只是一個更強的模型,而是一個訊號:AI 已經從「你問它答」,進化到「你發包、它交件」。全世界的高手已經在用它壓縮幾個月的工作量,而窗口只開到 6 月 22 日。
與其看別人的開箱文,不如自己開一次箱。接下來我也會拿企業培訓現場最常見的任務實測 Fable 5,結果會第一時間發在電子報。
上面 4 個建議——挑測試任務、任務分流、資料分級、種子成員——每一條都是我在企業內訓帶著學員實際演練的內容。如果你想在窗口關閉前幫團隊把這件事做對,歡迎來信聊聊:ai@autolab.cloud
📚 想用 AI 把工作效率拉開一個世代?
我是 AI峰哥(阿峰老師),專注企業 AI 實戰培訓。如果這篇對你有幫助,歡迎跟我一起——會用、懂用、好用、每天用:
📬 訂閱電子報:第一時間收到最新 AI 實戰技巧與產業趨勢 → https://aifengge.substack.com
📝 更多實戰文章:https://blog.autolab.cloud
🎓 企業內訓 / 課程諮詢:ai@autolab.cloud | LINE:0976-715-102
你是機長,AI 是你的機組人員。✈️
關於作者
黃敬峰(AI峰哥/阿峰老師),企業 AI 實戰培訓專家。服務過國泰人壽、工研院、英業達、電通、金管會等企業與機構,專注把 AI 變成每個工作者用得起來的日常工具。
參考來源
Anthropic 官方公告:https://www.anthropic.com/news/claude-fable-5-mythos-5
Hacker News 發布討論串:https://news.ycombinator.com/item?id=48463808
Ethan Mollick 實測長文:https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos
Simon Willison 成本實測:https://til.simonwillison.net/llms/agentsview-custom-model-price
Every 團隊實測報告:https://every.to/vibe-check/anthropic-mythos-our-fable-vibe-check
日本 Zenn 企業導入解析:https://zenn.dev/akasara/articles/ce6287e39a9a52
韓國 DCInside 開發者實測:https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=1242171
中國 V2EX 討論串:https://www.v2ex.com/t/1219205
德國 heise 合規分析:https://www.heise.de/news/Anthropic-veroeffentlicht-Claude-Mythos-5-als-Fable-5-mit-Einschraenkungen-11326637.html