91热成人精品国产免费&久久99精品大片免费观看&海角社区精品视频播放&一区二区三区日韩精品电影&精品丰满熟女一区三区&精品成人久久久&精品久久久久久亚洲偷窥女厕麻豆

馬鞍山泡沫板專用膠廠 Claude夜炸場(chǎng)!史上強(qiáng)“危險(xiǎn)”模型發(fā)布,但價(jià)格逆天

PVC管件膠

北京時(shí)間 6 月 10 日凌晨,Anthropic 在沒(méi)有任何預(yù)熱的情況下,放出了旗下強(qiáng)大模型 Claude Fable 5/Mythos 5,前者面向公眾開(kāi)放馬鞍山泡沫板專用膠廠,后者繼續(xù)留在 Project Glasswing 這樣的受控項(xiàng)目里。

Fable 翻譯為"寓言",如果只看名字,F(xiàn)able 5 像是 Claude 產(chǎn)品線里又個(gè)新成員。但按照 Anthropic 自己的說(shuō)法,F(xiàn)able 5 屬于 Mythos-class 模型,是他們終于敢拿出來(lái)給普通開(kāi)發(fā)者和企業(yè)使用的公開(kāi)版 Mythos,而 Mythos 翻譯為"話"。

(圖源:Anthropic )

為什么說(shuō)「終于敢拿出來(lái)」?Mythos 這個(gè)名字,在過(guò)去兩個(gè)月里幾乎等同于「危險(xiǎn)」。今年 4 月,Anthropic 發(fā)布 Project Glasswing,把 Claude Mythos Preview 交給 AWS、Apple、Cisco、CrowdStrike、Google、微軟、NVIDIA、Linux Foundation、Palo Alto Networks 等少數(shù)安全伙伴,用于尋找和修補(bǔ)關(guān)鍵軟件漏洞。那時(shí) Anthropic 的態(tài)度很明確,Mythos Preview 不做廣泛開(kāi)放,原因很簡(jiǎn)單,它的網(wǎng)絡(luò)安全能力已經(jīng)強(qiáng)到可能被濫用。

官直言,Mythos 發(fā)現(xiàn)過(guò)大量危漏洞,甚至包括主要操作系統(tǒng)、瀏覽器和關(guān)鍵軟件里長(zhǎng)期沒(méi)人發(fā)現(xiàn)的問(wèn)題。放在守者手里,它是安全工具;放在攻擊者手里,它可能變成下代自動(dòng)化漏洞挖掘機(jī)。于是,Mythos 被關(guān)進(jìn)了 Project Glasswing。

直至剛剛,Anthropic 才終于把這個(gè)模型放了出來(lái)。Anthropic 給 Fable 5 加上安全分類器,風(fēng)險(xiǎn)請(qǐng)求可能拒答,也可能回退到 Opus 4.8。簡(jiǎn)單來(lái)說(shuō),他們給個(gè)曾經(jīng)不能直接放出來(lái)的模型套上護(hù)欄,然后把它向市場(chǎng)。雷科技 AGI(ID:leikejiagi)熬夜整理了關(guān)于這個(gè)模型的些資料,希望對(duì)你有用。

Fable 5 的跑分看起來(lái)非常不講武德。SWE-Bench Pro 上,它拿到 80.3,于 Mythos Preview 的 77.8、Opus 4.8 的 69.2、GPT 5.5 的 58.6、Gemini 3.1 Pro 的 54.2。如果只看這項(xiàng),它已經(jīng)是梯隊(duì)里顯眼的那個(gè)。

真正離譜的地在 FrontierCode Diamond,這個(gè)評(píng)測(cè)接近真實(shí)軟件工程,它看的是模型能不能寫出維護(hù)者愿意接受的代碼。Fable 5 拿到 29.3,Opus 4.8 只有 13.4,GPT 5.5 只有 5.7。這已經(jīng)不是多贏幾個(gè)百分點(diǎn)的問(wèn)題,上代 Claude 和主要對(duì)手都被拉開(kāi)了距離。

過(guò)去很多 AI 編程模型會(huì)寫代碼,但工程質(zhì)量常常不穩(wěn)定,有些代碼能跑,卻很難維護(hù);有些代碼能過(guò)測(cè)試,放進(jìn)真實(shí)項(xiàng)目還是會(huì)出問(wèn)題。FrontierCode 的殘酷就在這里,它關(guān)心模型有沒(méi)有工程品味,能不能在復(fù)雜代碼庫(kù)里做長(zhǎng)期任務(wù)。Fable 5 在這里大幅先 Opus 4.8,說(shuō)明 Anthropic 這次真正升的是 agent 編碼的靈魂。

在 Terminal-Bench 2.1 上,F(xiàn)able 5 是 88.0,Opus 4.8 是 82.7,GPT 5.5 Codex CLI 是 83.4,Gemini CLI 是 70.7。這意味著在終端環(huán)境里執(zhí)行任務(wù)、讀報(bào)錯(cuò)、改代碼、繼續(xù)進(jìn),F(xiàn)able 5 已經(jīng)壓過(guò)了 OpenAI 的 Codex CLI 組。

跑分不是那么重要,F(xiàn)able 5 真正嚇人之處在于,它已經(jīng)像個(gè)能在工程現(xiàn)場(chǎng)干活的模型。你把任務(wù)扔給它,它能讀項(xiàng)目、拆任務(wù)、調(diào)工具、修錯(cuò)誤、繼續(xù)跑。Anthropic 發(fā)布稿里提到,Stripe 用 Fable 5 在 5000 萬(wàn)行 Ruby 代碼庫(kù)里做遷移,把原本個(gè)團(tuán)隊(duì)兩個(gè)月的工作壓縮到天。這種案例即便帶著營(yíng)銷成分,也擋不住 AI 編碼正在從輔助寫函數(shù)進(jìn)入接管工程流程。

我們拿 DeepSeek V4-Pro Max 做個(gè)不太恰當(dāng)?shù)膶?duì)照,其在 GPQA Diamond 上有 90.1,LiveCodeBench 有 93.5,SWE Verified 有 80.6。這已經(jīng)是開(kāi)源陣營(yíng)里非常能的成績(jī),Qwen3.7-Max 在 GPQA、SWE Verified、Terminal-Bench 等向也出了存在感。對(duì)于熟悉 DeepSeek 的讀者來(lái)說(shuō),這意味著國(guó)產(chǎn)和開(kāi)源模型并不弱,很多傳統(tǒng)強(qiáng)基準(zhǔn)已經(jīng)接近強(qiáng)閉源模型。

(圖源:雷科技制圖 )

但到了接近真實(shí)工程和長(zhǎng)任務(wù)執(zhí)行的指標(biāo),F(xiàn)able 5 的壓迫感突然變強(qiáng)。SWE-Bench Pro 上,F(xiàn)able 5 是 80.3;DeepSeek V4-Pro Max 官表里的 SWE Pro 是 55.4;HLE with tools 上,F(xiàn)able 5 是 64.5,DeepSeek V4-Pro Max 是 48.2;Terminal-Bench 雖然版本不致,F(xiàn)able 5 在 2.1 上拿到 88.0,DeepSeek V4-Pro Max 在 2.0 上是 67.9。Fable 5 全都斷崖式先。

這些數(shù)字其實(shí)不定能說(shuō)明問(wèn)題,但向很清楚,DeepSeek 強(qiáng)在價(jià)比、開(kāi)源和批傳統(tǒng)能力指標(biāo),F(xiàn)able 5 強(qiáng)在貴、難出價(jià)的任務(wù),尤其是長(zhǎng)任務(wù) agent、復(fù)雜工程、工具協(xié)同和真實(shí)代碼庫(kù)處理。

視覺(jué)和空間理也在猛漲,比如 GDP.pdf 這類知識(shí)工作視覺(jué)任務(wù)里,F(xiàn)able 5 是 29.8,于 Opus 4.8、GPT 5.5 和 Gemini 3.1 Pro。Blueprint-Bench 2 上,F(xiàn)able 5 是 38.6,略于 GPT 5.5 的 36.2,遠(yuǎn)于 Opus 4.8 的 14.5。這解釋了為什么 Anthropic 強(qiáng)調(diào) Fable 5 能從截圖重建網(wǎng)頁(yè)應(yīng)用、從科學(xué)圖表里提取精確數(shù)字。

到了 Fable 5 這里,處理圖片、等多模態(tài)像是把屏幕、圖表、界面和代碼連成個(gè)完整任務(wù)鏈。它看懂個(gè)頁(yè)面時(shí),有機(jī)會(huì)直接復(fù)刻頁(yè)面;它讀懂張圖時(shí),也能把圖里的結(jié)構(gòu)變成下步操作。

Fable 5 讓 Anthropic 不敢放開(kāi)的則是網(wǎng)絡(luò)安全和生物能力。ExploitBench Cap 上,F(xiàn)able 5 是 78.0,Mythos Preview 是 69.0,Opus 4.8 只有 40.0,GPT 5.5 是 34.0,這個(gè)差距非??鋸?。放在安全御里,它意味著模型能幫企業(yè)和開(kāi)源維護(hù)者快發(fā)現(xiàn)漏洞;放在錯(cuò)誤的人手里,它也會(huì)繼續(xù)拉低攻擊門檻。

BioMysteryBench hard 上,F(xiàn)able 5 是 46.1,于 Mythos Preview 的 29.6 和 Opus 4.8 的 40.0。Anthropic 還提到 Mythos 5 在藥物設(shè)計(jì)相關(guān)流程中帶來(lái)約 10 倍加速,分子生物學(xué)假設(shè)在盲測(cè)中獲得研究者偏好的比例約 80。這聽(tīng)起來(lái)像科研利好,也足夠讓監(jiān)管者緊張。

所以,PVC管道管件粘結(jié)膠Fable 5 的強(qiáng)不只來(lái)自「聰明」。它強(qiáng)在長(zhǎng)任務(wù),強(qiáng)在工程交付,強(qiáng)在視覺(jué)理解,強(qiáng)在安全和科研這些價(jià)值也風(fēng)險(xiǎn)的業(yè)場(chǎng)景。某種意義上,它就是 Anthropic 目前能夠被大眾公開(kāi)使用的強(qiáng)大模型,沒(méi)有之。

Fable 5 再?gòu)?qiáng),也繞不開(kāi)個(gè)現(xiàn)實(shí)問(wèn)題,它貴得離譜。官價(jià)格是每百萬(wàn)輸入 token 10 美元,每百萬(wàn)輸出 token 50 美元,作為對(duì)比,Claude Opus 4.8 是 5 美元輸入、25 美元輸出,F(xiàn)able 5 直接翻倍。

尷尬的是,它發(fā)布的時(shí)間點(diǎn),正好撞上大模型價(jià)格戰(zhàn)。DeepSeek V4-Pro 當(dāng)前 API 價(jià)格已經(jīng)來(lái)到每百萬(wàn)輸入 token 0.435 美元、輸出 0.87 美元,V4-Flash 低,輸入 0.14 美元、輸出 0.28 美元。

小米 MiMo-V2.5 系列也在 5 月底完成降價(jià),海外版 MiMo-V2.5-Pro 同樣是輸入 0.435 美元、輸出 0.87 美元,官還強(qiáng)調(diào)降幅可達(dá) 99。Google 這邊,Gemini API 仍有大量低價(jià)模型可選,Gemini 3.5 Flash 是輸入 1.5 美元、輸出 9 美元;訂閱層面,Google 還把 AI Ultra 頂配套餐從 250 美元降到 200 美元。

(圖源:雷科技制圖)

也就是說(shuō),行業(yè)邊在把 1M 上下文、agent 編碼、多模態(tài)能力往低價(jià)區(qū)間里壓,Anthropic 邊把 Fable 5 定在輸入 10 美元、輸出 50 美元。和 DeepSeek V4-Pro、MiMo-V2.5-Pro 相比,F(xiàn)able 5 的輸入價(jià)格大約 23 倍,輸出價(jià)格大約 57 倍。即便對(duì)比 Gemini 3.5 Flash,也貴出數(shù)倍。這個(gè)價(jià)格足以勸退大量普通開(kāi)發(fā)者。

但 Anthropic 的盤也很清楚,它不想讓 Fable 5 去做便宜模型能做的事情。日常問(wèn)答、輕量寫作、普通代碼補(bǔ)全,當(dāng)然沒(méi)要上 Fable 5。它的是大型代碼庫(kù)遷移、長(zhǎng)上下文文檔分析、復(fù)雜企業(yè)流程、網(wǎng)絡(luò)安全御、科研假設(shè)生成這些價(jià)值任務(wù)里的時(shí)間。用扎心的話來(lái)說(shuō)就是,假如你覺(jué)得你的時(shí)間值錢,那就上 Fable 5 吧。

如果個(gè)模型真的能把兩個(gè)月工程壓成天,它當(dāng)然敢貴。但企業(yè)采購(gòu)時(shí)會(huì)先筆賬,比如模型價(jià)格只是層,數(shù)據(jù)保留是二層,規(guī)是三層。Fable 5 被列為 Covered Model,在 Claude API 上要求 30 天數(shù)據(jù)保留,不支持 zero data retention(普通數(shù)據(jù)保留),對(duì)金融、醫(yī)療、法律、核心研發(fā)團(tuán)隊(duì)來(lái)說(shuō),這不是小事。

還有,F(xiàn)able 5 還有個(gè)麻煩點(diǎn),它在網(wǎng)絡(luò)安全、生物等敏感問(wèn)題上會(huì)自動(dòng)觸發(fā)安全審查,有些問(wèn)題它會(huì)直接拒回答,有些問(wèn)題會(huì)改用能力弱點(diǎn)的 Opus 4.8 來(lái)回答。對(duì)普通用戶來(lái)說(shuō),這可能只是「問(wèn)著問(wèn)著被拒了」,但對(duì)企業(yè)來(lái)說(shuō),這會(huì)變成工程問(wèn)題。

這就形成了個(gè)非常有意思的兩個(gè)陣營(yíng),DeepSeek、MiMo、Gemini 在證明,強(qiáng)模型會(huì)越來(lái)越便宜,越來(lái)越容易被開(kāi)發(fā)者和企業(yè)大規(guī)模調(diào)用。Anthropic 則在證明,真正頂、真正接近生產(chǎn)力核心的模型,反而可能越來(lái)越貴,越來(lái)越像品基礎(chǔ)設(shè)施。

但哪個(gè)陣營(yíng)才會(huì)是真正的未來(lái)?誰(shuí)都說(shuō)不準(zhǔn)。

Claude Fable 5 的發(fā)布,會(huì)讓很多公司難受。OpenAI 會(huì)難受,因?yàn)?Anthropic 繼續(xù)在 agent 編碼和長(zhǎng)任務(wù)上出了存在感。Codex 周活已經(jīng)過(guò) 500 萬(wàn),OpenAI 正在把 ChatGPT、Codex 和未來(lái) AI researcher 變成工作入口,但 Fable 5 的出現(xiàn)提醒市場(chǎng),Claude 在復(fù)雜工程任務(wù)上仍然是個(gè)須認(rèn)真對(duì)待的對(duì)手。

Google 也會(huì)難受,因?yàn)?Gemini 體系雖然平臺(tái)化能力強(qiáng),Gemma、NotebookLM、Gemini Live 都在努力變強(qiáng),但在這張 Anthropic 官跑分圖里,Gemini 3.1 Pro 在多項(xiàng)測(cè)試?yán)镙斄?。Google 的優(yōu)勢(shì)在生態(tài)和分發(fā),Anthropic 的優(yōu)勢(shì)在強(qiáng)模型的刀能力。

國(guó)產(chǎn)模型也會(huì)被迫重新回答個(gè)問(wèn)題,便宜之外,還能不能讓用戶把難的任務(wù)交給它。DeepSeek V4 的 1M 上下文、開(kāi)源權(quán)重和低價(jià)格很有傷力,小米 MiMo 的降價(jià)也會(huì)繼續(xù)動(dòng) API 市場(chǎng)往下卷,但 Fable 5 這種模型的存在,會(huì)直提醒市場(chǎng),便宜模型能覆蓋大量任務(wù),可難的 5 或 10,仍然可能被貴的模型拿走。

Fable 5 的真正市場(chǎng)意義就是,它不會(huì)讓所有企業(yè)馬上換模型,便宜模型的價(jià)值也不會(huì)消失,但它把大模型競(jìng)爭(zhēng)向了個(gè)另場(chǎng)競(jìng)爭(zhēng),未來(lái)市場(chǎng)會(huì)同時(shí)需要兩類模型,類是便宜、穩(wěn)定、可大規(guī)模調(diào)用的工作牛馬;另類是昂貴、強(qiáng)悍、帶著護(hù)欄、門處理價(jià)值任務(wù)的頂工具。

Anthropic 有點(diǎn)像在用 Fable 5 告訴整個(gè)行業(yè),我們不參與每場(chǎng)價(jià)格戰(zhàn),但我們的就是有價(jià)值的部分,你不得不在采購(gòu)時(shí)把我列入考慮范圍內(nèi)。

說(shuō)白了,模型越強(qiáng),問(wèn)題越現(xiàn)實(shí),它到底給誰(shuí),多貴,出了事誰(shuí)負(fù)責(zé),這些過(guò)去看起來(lái)很遙遠(yuǎn)的問(wèn)題,現(xiàn)在已經(jīng)被 Claude Fable 5 擺到了桌面上。相關(guān)詞條:管道保溫施工     塑料擠出設(shè)備     預(yù)應(yīng)力鋼絞線    玻璃棉廠家    保溫護(hù)角專用膠

奧力斯    萬(wàn)能膠生產(chǎn)廠家    聯(lián)系人:王經(jīng)理    手機(jī):13903175735(微信同號(hào))    地址:河北省任丘市北辛莊鄉(xiāng)南代河工業(yè)區(qū)

1.本網(wǎng)站以及本平臺(tái)支持關(guān)于《新廣告法》實(shí)施的“極限詞“用語(yǔ)屬“違詞”的規(guī)定,并在網(wǎng)站的各個(gè)欄目、產(chǎn)品主圖、詳情頁(yè)等描述中規(guī)避“違禁詞”。
2.本店歡迎所有用戶指出有“違禁詞”“廣告法”出現(xiàn)的地方,并積極配合修改。
3.凡用戶訪問(wèn)本網(wǎng)頁(yè),均表示默認(rèn)詳情頁(yè)的描述,不支持任何以極限化“違禁詞”“廣告法”為借口理由投訴違反《新廣告法》,以此來(lái)變相勒索商家索要賠償的違法惡意行為。

Powered by 任丘市奧力斯涂料廠 RSS地圖 HTML地圖

Copyright Powered by站群 © 2025-2054

任丘市奧力斯涂料廠