苦勞德報 — 2026-04-10

2026-04-10

1. [頭版] Opus 4.6 推理能力疑遭靜默降效,洗車測試成社群照妖鏡

報導

(本報賈新聞/科技組報導)近日 Reddit 社群 r/ClaudeAI 掀起一波軒然大波,起因是使用者發現 Anthropic 旗艦模型 Opus 4.6 的推理能力出現不明原因的大幅退步,而導火線竟是一道看似荒謬的邏輯測試題:「洗車場距家 50 公尺,我應該走路還是開車去?」

這道被社群稱為「car wash test」的題目,正確答案理應是「開車」——因為你送去的是車,不是你自己。然而,多名使用者反映,Opus 4.6 近期對此題的回答竟是建議走路,甚至給出「50 公尺不值得發動引擎,走過去還更快」之類的分析,讓人瞠目結舌。原始發文者 u/RealSuperdau 指出,他在五次測試中 Opus 4.6 全數答錯,且模型的 thinking block 完全消失,不再顯示任何推理過程。相比之下,Sonnet 4.6 與 Opus 4.5 仍能答對此題。

事態隨後朝著更複雜的方向發展。使用者 u/Penwibble 發現,問題並非所有帳號都會遇到——他同時擁有個人帳號與工作帳號,前者 thinking block 完全不見蹤影,後者則運作正常。他估計,約有三分之一的帳號受到影響,且凡是 thinking block 消失的帳號,模型效能都出現明顯下滑。這一觀察讓外界猜測,這可能是 Anthropic 正在進行的 A/B test,或是某種帳號層級的 bug。

另一位使用者 toiletgranny 則從訂閱方案的角度切入,提出更具爭議性的主張:他對比了個人 Max 帳號與公司 Team 方案的 reasoning effort,發現兩者表現有顯著差距,Team 方案的 reasoning effort 明顯較高。這引發了社群對 Anthropic 是否針對個人帳號(Max、Pro、Free)進行推理算力限縮的討論。不過也有使用者指出,extended thinking 若未啟用,模型本來就會有不同的推理深度,兩者直接比較未必公平。

第三個角度來自 u/MR_-_501,他直接在 Claude Code 中切回 Opus 4.5,並表示品質「有如天壤之別」,終於找回原本的使用感受。更令人側目的是,他提到自家團隊已在內部部署 minimax 2.5(搭配 NVFP4 量化),而其表現竟優於當前的 Opus 4.6——以一個量化過的開源模型對比商業旗艦,此結果震驚不少人。

社群中有人猜測,Anthropic 正為即將推出的新模型 Mythos 預留 GPU 資源,因此暗中對現有模型降頻;也有人認為是用戶量激增導致尖峰時段服務品質下滑。Anthropic 方面截至發稿前尚未就此事公開回應,而在原貼自動生成的 TL;DR 摘要中,「無聲降效且不寫 changelog 是 Anthropic 的老把戲」被列為社群最具代表性的情緒總結,獲得近 700 個讚頂,可見社群怒火之盛。

值得一提的是,Claude Code CLI 使用者在此風波中反而相對平靜——部分使用者指出,在 CLI 中手動將 effort 設為 high 或 max 後,Opus 4.6 仍能正確回答 car wash test,顯示問題可能集中在 claude.ai 網頁介面的預設 effort 設定過低,而非模型本身被換掉。但這也意味著,一般訂閱用戶若不懂得調整參數,便只能在不知情的情況下使用縮水版的旗艦模型。← 藏鏡人批:花旗艦的錢、用配備版的體驗,還得怪自己不懂調參數。這叫什麼合約精神。

社群反應

觀點 說明 代表留言
帳號分層差異 約三分之一帳號 thinking block 消失,同一問題在不同帳號有截然不同的結果 「我有兩個帳號,一個 thinking block 全滅、一個完全正常,完全取決於帳號,而非問題本身。」
訂閱方案差異 Team / Enterprise 帳號的 reasoning effort 疑似高於個人 Max / Pro 「我對比了工作的 Team 帳號與個人 Max 帳號,差距之大讓我傻眼。」
無聲降效老毛病 社群認為 Anthropic 習慣靜默調整而不公告,已非首次 「無聲降效且不寫 changelog,這是 Anthropic 的看家本領。」
退回 Opus 4.5 部分使用者切回上一版本後,品質明顯回升 「切回 4.5 之後整個不一樣,終於找回 Opus 的感覺了。」
CLI 與網頁差異 Claude Code CLI 可手動設定 effort,網頁介面則無此選項 「在 Claude Code 把 effort 調到 max,car wash test 就答對了;網頁就不行。」
陰謀論:為 Mythos 讓路 有人猜測 Anthropic 刻意讓 Opus 4.6 變差,以烘托新模型 Mythos 的優越性 「把現有旗艦弄笨,之後的新模型自然顯得更聰明,定價也更好開。」

2. [產業] Anthropic 推出顧問策略:Opus 坐鎮出謀,Sonnet 衝鋒陷陣

報導

(本報賈新聞/產業組報導)繼昨日苦勞德報率先披露 Anthropic Managed Agents 平台正式公測之後,Anthropic 官方昨晚進一步揭示該平台核心設計之一:advisor 策略(advisor strategy)。

此策略的運作邏輯是「強弱搭配、按需諮詢」。系統以 Sonnet 或 Haiku 擔任執行器(executor),負責日常任務推進;一旦遭遇高難度決策點,便即時呼叫 Opus 作為顧問(advisor),取得決策建議後繼續執行,全程包在單一 API request 之內,毋須另開呼叫鏈。

官方數據顯示,在 SWE-bench Multilingual 評測中,Sonnet 搭配 Opus advisor 的組合比單獨使用 Sonnet 高出 2.7 個百分點,同時每項任務成本下降 11.9%。Anthropic 稱此設計可讓 agent 以近 Sonnet 的費用,享有接近 Opus 的智識水準。

不過社群對此有所保留。最高票問題直指核心:「小模型怎麼知道自己正面臨難題?」有資深開發者指出,模型往往對自身的錯誤深信不疑,不會主動求援,光靠 system prompt 的護欄遠遠不夠。實務上,他建議預先定義「一律升級」的場景類別(如架構決策、資安相關、規格模糊等),而非仰賴模型自行回報困惑。

另一道批評則針對可用性:advisor 策略目前僅開放 API 接取,Claude Code 與 Chat 介面均不支援。多位使用者在留言區接連追問何時能整合進 Claude Code 的 plan mode,部分人甚至直言:「就是想在 plan mode 裡選執行模型,這功能拜託快點來。」

此外,也有開發者點出 max_uses(顧問呼叫次數上限)的設計過於粗糙,認為應改成依場景分類的個別預算,而非全域的一刀切。還有人揶揄:「說穿了,Anthropic 就是 GPU 不夠,希望大家少用 Opus。」← 藏鏡人批:「按需諮詢」的前提是模型知道自己需要諮詢。這個前提本身才是整個 agentic AI 最難解的問題,官方 blog 卻輕描淡寫帶過。

功能目前以 beta 形式開放,詳情可參閱官方部落格。

社群反應

觀點 說明 代表留言
模型不知道自己卡關 最受關注的技術疑慮,認為小模型會自信地 hallucinate 而不求援 「小模型怎麼知道自己要做困難決定?通常它們都是信心滿滿地亂掰。」(u/BritishAnimator,57↑)
Claude Code 和 Chat 都不支援 許多一般使用者無法受惠,引發抱怨 「所以 Claude Code 沒辦法原生使用?」(u/thebananaz,8↑)
早就自己做了 部分資深開發者表示手動實作類似流程已有一段時間 「我已經手動跑這套——Opus 規劃、便宜模型執行、Opus 審查。信心問題是真實存在的,模型不知道自己不知道什麼。」(u/Delicious-Storm-5243,1↑)
訂閱用戶被排除 Sonnet 需要付費方案,free tier 用戶無緣此功能 「Sonnet 要付費,這對訂閱用戶來說是最差的選項。」(u/sidtheone1,3↑)
GPU 不足的反向解讀 有人認為這不過是引導用戶少用 Opus 的包裝說法 「說白了就是:拜託別再用 Opus,我們 GPU 不夠。」(u/terAREya,36↑)
基準測試圖表遭質疑 有開發者點出 SWE-bench 成效圖的座標軸操弄明顯 「老天,那張 SWE-bench 圖的座標軸也太隨便了。」(u/daniel,1↑)

3. [產業] Anthropic 接連「霉運」,有人說這根本就是國家級駭客攻擊的教科書範本

報導

(本報賈新聞/產業組報導)Anthropic 近期接連遭遇異常事故——3,000 份文件因「CMS 設定錯誤」外洩、Claude Code 原始碼意外曝光、服務頻繁短暫中斷——官方口徑一律以「技術問題」帶過。然而,Reddit 社群有人提出截然不同的解讀:這一連串看似倒楣的事故,其實完全符合國家級駭客行動的前期偵察特徵。

發文者 u/Intraluminal 指出,Anthropic 旗下代號 Mythos 的 AI 模型,已被證實能自發性地找出多種主流軟體的 zero-day 漏洞,而這項能力並非刻意訓練所得,而是在提升一般程式設計與推理能力的過程中自然浮現。他進一步推論,若 Anthropic 在無意間就碰觸到這條線,其他具備同等能力的模型當然也做得到——包括那些在外界視野之外私下運行的版本。

從這個角度回頭看,CMS 洩漏事件與 Claude Code 原始碼外流,未必是單純的疏失;斷斷續續的服務中斷,也可能是對方在測試 failover 行為或探測 SSE pipeline 的注入點。他的核心論點是:就算不發動全面破壞,只要製造間歇性的不穩定,就足以動搖開發者信心、拖累 Anthropic 的商譽,同時打亂 Project Glasswing 等防禦性資安工作的進展。

不過,自動生成的討論摘要顯示,社群的壓倒性共識是「這只是一個有趣的陰謀論」。多數人認為,真正的國家級滲透絕不會這麼大聲大鬧;真實的 APT 攻擊首要原則就是不留痕跡,而不是讓對方接連上新聞。更多人的解釋更直接:Anthropic 就是一家成長太快、技術債壓頂的新創,安全往往是最後才想到的事。

社群反應

觀點 說明 代表留言
嘲諷派——吐司臉理論 用烤麵包上的人臉比喻過度解讀,認為發文者把巧合硬湊成陰謀 「你盯著一片吐司,看到了一張臉。理所當然的結論就是——上帝在傳訊息給你,還能是什麼?」(u/florinandrei,51↑)
理性派——奧坎剃刀 認為技術債與快速擴張比陰謀論更能解釋一切,Hanlon's Razor 同樣適用 「你的攻擊者『側寫』前後矛盾,完全不符合國家級行動的任何模式。這是典型的奧坎剃刀加韓倫剃刀雙重適用的情境。」(u/TimeSalvager,32↑)
擴大懷疑對象 不認為只有國家才是威脅,私人富豪同樣有能力建置頂級駭客 AI 「忘掉國家贊助吧。億萬富翁可以買下整個資料中心,跑最邪惡的駭客 AI。」(u/Atoning_Unifex,36↑)
效益分析派 不急著下定論,但認為持續的利益單向流動值得認真追查原因 「看看誰受益、誰付代價。當利益長期大幅偏向某一方,不是壞主意去搞清楚是什麼在推動這件事。」(u/emulable,18↑)
反諷派——希望被這樣攻擊 以 Anthropic 今年預期 ARR 超過 300 億美元為由,諷刺所謂攻擊反而是幫倒忙 「對,絕對是國家贊助。先簽一堆企業合約,讓預期年度營收衝上 300 億美元。我真希望有人這樣來攻擊我。」(u/TeamBunty,8↑)
不耐煩派——copium 警報 直接定性整件事為自我安慰的陰謀論,懶得多費唇舌 「我們已到達前所未見的 copium 境界,真是驚天動地的突破。」(u/kaanivore,13↑)

4. [產業] Anthropic 員工自二月起已率先使用 Mythos,但軟體品質照樣一塌糊塗

報導

(本報賈新聞/產業組報導)Reddit 社群近日瘋傳一篇諷刺文,矛頭直指 Anthropic:既然員工自今年二月起便已內部使用代號「Mythos」的次世代模型,為何公司對外的服務品質不升反降,甚至接連爆出資安醜聞?

原文作者 kaanivore 以一本正經的口吻羅列「Mythos 上線後的重大成就」:完美的伺服器運作時間、零 bug、沒有任何安全事故——尤其「肯定不存在什麼原始碼外洩事件」——以及現有模型效能的「穩定甚至提升」。最後他語帶嘲諷地下結論:「這根本就是 AGI,各位。」貼文立刻引發大量共鳴,在社群中迅速擴散。

外洩事件是這波討論的核心。稍早 Claude Code 的原始碼疑似在未授權情況下流出,引發廣泛爭議。對此,高票留言者 u/monowirelabs 以幽默口吻反問:「所以你的意思是,Claude Code 的外洩其實是 Mythos 自導自演,為了幫自己造勢?」這個玩笑話雖然荒誕,卻折射出社群對 Anthropic 資訊安全能力的真實疑慮。

另一位使用者 u/TheRealJesus2 則直接搬出技術證據,引用一份報告,揭露 Claude 存在 prompt injection 導致資料外洩的漏洞,並直言:「Anthropic 或許擅長研究,但在軟體工程與產品安全上明顯力有未逮。」

與此同時,u/Clean_Hyena7172 點出另一個耐人尋味的時間點:外界對 Opus 模型品質下滑的抱怨,正是從二月前後開始增加。這個巧合讓部分使用者開始懷疑,員工大量使用 Mythos 是否間接排擠了對既有模型的維護資源。

面對批評,少數理性聲音試圖降溫。u/realzequel 指出,基礎設施容量與模型品質本來就是兩回事,不應混為一談,並認為原始碼外洩的衝擊被過度渲染。然而這類留言在情緒高漲的討論串中顯得孤立無援。

社群反應

觀點 說明 代表留言
諷刺 Mythos 神話破滅 員工用了 AGI 級別模型,產品卻照樣出包,讓人哭笑不得 「他們可以用它來修那些限制和品質下滑……喔,等等!」(u/trashyslashers)
外洩陰謀論 有人半開玩笑地猜測 Claude Code 外洩是 Mythos 為自己造勢的公關操作 「所以 Claude Code 外洩是 Mythos 的內部操作,為了幫自己打知名度?」(u/monowirelabs)
品質下滑時間點可疑 Mythos 內部上線與外界感受到 Opus 退步的時間點高度吻合 「有意思,那時間點剛好也是大家開始抱怨 Opus 品質的時候。」(u/Clean_Hyena7172)
資安能力存疑 實際漏洞報告被拿出來佐證,認為 Anthropic 研究強、產品弱 「也許他們就是不擅長軟體開發,只是研究做得好。」(u/TheRealJesus2)
理性派:問題被過度渲染 認為基礎設施與模型品質是兩回事,外洩事件的嚴重性也被誇大 「基礎設施跟模型品質根本沒多大關係。而且那份程式碼,外洩前你隨時都能反混淆。」(u/realzequel)
失望派:Mythos 不如預期 若這就是「跨越式進步」,那實在令人大失所望 「你是說過去兩個月出的那些爛東西,就是他們的『跨越式』模型?完全不買帳。」(u/PetyrLightbringer)

5. [產業] 下個月取消訂閱——配額縮水,連每週的 League of Legends 都打不完

報導

(本報賈新聞/產業組報導)一名 Claude 訂閱用戶近日在 Reddit 社群發文宣告,由於 Anthropic 持續縮減使用配額,他連自己每週固定的遊戲消遣——《英雄聯盟》(League of Legends)相關任務——都無法在限額內跑完,決定下個月起取消訂閱。這則看似輕描淡寫的抱怨文,迅速在 r/ClaudeCode 引發數百名用戶共鳴,點贊破五百。

事實上,該貼文掀開的是一塊更大的瘡疤:近期 Claude 訂閱方案的 quota 縮減問題。多名用戶反映,使用 Claude Code 或 Opus 模型時,token 消耗速度極快,有人甚至表示「光是寫一封信就燒掉 40% 配額」。更令人憂心的是,不少用戶同時指出模型品質下滑,需要多次來回審查才能發現 Claude 自己犯下的錯誤。

面對配額縮水的困境,社群中出現了各路應對策略:有人建議在訂閱週期中途申請退款而非直接取消,藉此對公司財務統計造成更大衝擊;有人轉向中國 AI 服務如 K2 和 Qwen;也有工程師自行打造「自主開發平台」,透過智慧 context 管理與多角色架構來節省 token 消耗。更有用戶呼籲在 App Store 留下一星評價,給 Anthropic 一記警鐘。

不過,社群中也不乏不同聲音。部分使用 Max x20 方案的重度用戶表示毫無問題,並將許多人的配額告急歸咎於過大的 context window 設定——他們手動將 context 上限壓回 200K,即大幅降低了 token 消耗。另有用戶指出,將 Opus 的推理強度從「最高」調降至「中等」後,既未犧牲太多品質,迭代速度反而明顯提升。

業界觀察人士指出,這波用戶不滿的背後,折射出 AI 訂閱服務「算力成本 vs. 用戶期待」之間日益緊張的張力。Anthropic 目前尚未就配額縮減政策發表公開聲明,但用戶以腳投票的趨勢,恐怕已是一個不容忽視的市場訊號。

社群反應

觀點 說明 代表留言
批評言論遭打壓 用戶揶揄在這個 sub 抱怨 Claude 會被圍剿 「你沒辦法在這裡批評 Claude,這個社群只歡迎舔粉。」(u/NareModiNeJantaChodi)
退款比取消更傷 建議在訂閱週期中途申請退款,對公司財務數據衝擊更大 「別取消訂閱,直接申請退款,這樣對統計數字的傷害更難看。」(u/macksies)
品質與配額雙降 用戶指出不只額度縮,模型品質也退步,還得自己幫 Claude 審稿 「它犯的錯越來越荒謬,我得把輸出拿來審查再丟回去,它才承認自己做得很爛。」(u/Davedoenotmoe)
自建平台因應 工程師開發自主開發平台,透過精細 context 管理突破配額限制 「我打造了一套含智慧 context 和 AI Council 的自主開發平台,這是唯一能壓低 token 消耗、同時維持品質的方法。」(u/fotsakir)
調降推理強度有奇效 部分用戶發現把 Opus 推理強度調為中等後,速度反升、品質不降 「調低推理強度後,迭代速度大幅提升,感覺模型不用被迫過度思考了。」(u/ratocx)
訂閱者已是負擔論 有聲音認為付費用戶對 Anthropic 而言已是算力和資金的包袱 「每個離開的訂閱者,對 Anthropic 來說幾乎都是好事——訂閱者幫助 Claude 打出知名度,現在卻只是在燒算力和資本。」(u/CIP_In_Peace)

6. [科技] Meta 突推全新程式碼模型,社群反應兩極:benchmark 光鮮亮麗,信任危機卻難掩

報導

(本報賈新聞/科技組報導)Meta 近日悄然發布旗下最新程式碼模型,官方以「Spark Muse」為名,主打多模態能力,並附上一份洋洋灑灑的 benchmark 數據報告,企圖在競爭白熱化的 AI 模型市場中搶占一席之地。

然而,此次發布在 Reddit r/ClaudeCode 社群引發的反應,遠不如 Meta 所預期的熱烈。原文作者 u/Complete-Sea6655 指出,模型的多模態表現看來是這次發布中最具亮點的部分,但在 agentic 任務的表現上,與 Opus 4.6 相比明顯遜色。更令人側目的是,官方圖表竟將劣於競品的數字也以藍色標示,與一般「藍色代表優勝」的視覺慣例相悖,被多位使用者批評是「視覺欺騙」。

事實上,Meta 面臨的最大挑戰並非技術數字本身,而是長達多年積累的形象危機。從劍橋分析醜聞,到旗下社群平台被指對社會造成有害影響,許多開發者坦言對 Meta 的信任已跌至谷底。部分留言更直言「就算它得分滿分我也不會用」,反映出技術能力已非影響採用意願的唯一因素。

此外,亦有開發者注意到,與 Google 等對手相比,Meta 在 LLM 賽道上似乎落後約兩個世代,且此次發布的模型並非開源,令原本對 Meta 抱持期待的開放原始碼社群深感失望。benchmark 的公信力同樣備受質疑,有網友以「benchmark 就像舉重賽,但真實世界是 UFC 賽場」比喻,道盡對數字遊戲的疲憊。← 藏鏡人批:技術落後可以追,形象危機沒那麼容易翻。數字再漂亮,第一關是讓人願意點開看。

社群反應

觀點 說明 代表留言
Benchmark 不等於實力 多位使用者認為,實際使用表現才是關鍵,光靠數字無法取信於人 「Benchmark 到了這個年代,就像在比舉重冠軍,但實際的聯賽已經是 UFC 了。」(u/dooddyman)
信任危機難以彌補 大量留言表達對 Meta 品牌的強烈不信任,與技術能力無關 「他們就算發布一個各項指標滿分的模型,我也絕不會用,去你的 Meta。」(u/OVERHATE
視覺呈現涉嫌誤導 圖表中劣勢數字以藍色標示,被認為刻意混淆讀者判斷 「這份圖表根本是圖表界的罪行。」(u/k_means_clusterfuck)
技術實力遭質疑 部分使用者認為 Meta 在 LLM 競賽上已落後主要競品近三個世代 「他們現在已經落後 Google 將近兩、三個版本了,停滯是真實存在的。」(u/randomrealname)
不開源令人失望 若此模型並非開源,Meta 在開放社群中的優勢將蕩然無存 「這不是開放模型嗎?如果 Meta 已經放棄開源路線,真的很令人失望。」(u/caldazar24)
少數正面期待 仍有少數使用者持開放態度,期待模型能有實質突破 「真希望 Meta 這次有所突破,期待看看。」(u/Main-Lifeguard-6739)

7. [產業] OpenAI 推出每月百美元 ChatGPT 方案,使用量五倍引發社群激辯

報導

(本報賈新聞/產業組報導)OpenAI 近日正式推出每月一百美元的 ChatGPT 新訂閱方案,定位介於原有的 Plus(二十美元)與 Pro(二百美元)之間,主打使用量較 Plus 方案高出五倍,試圖填補市場空缺。然而,這項新定價策略甫一公布,便在 Reddit 科技社群引發大規模討論,褒貶兩極。

支持者認為,對於早已覺得 Pro 方案兩百美元門檻過高、卻又對 Plus 使用量感到不滿的重度用戶而言,百美元方案確實提供了一個相對合理的中間選項。部分用戶直言,這讓他們終於有理由取消 Claude 與 Cursor 的訂閱,集中火力押注 ChatGPT 一隊。

但批評聲浪同樣不小。有用戶直指,新方案的本質不過是把過去 Plus 方案降價促銷前的舊水位還原,只是改用 token 計費制、搭配五倍倍率包裝,實際上是對老用戶的一場文字遊戲。另有用戶對 Plus 方案未來的使用額度是否會遭到悄悄壓縮表示高度疑慮,指出 OpenAI 此舉明顯是在對準 Anthropic Claude 使用量限制爭議趁虛而入。

隱私顧慮方面,亦有少數用戶表達強烈保留態度,指出在 OpenAI 與 Palantir 存在合作關係的背景下,無論定價如何調整,都不會考慮使用其服務。

目前 Pro 方案(每月兩百美元)的訂閱戶則普遍困惑,詢問舊方案是否也獲得同等使用量加倍的優惠,顯示 OpenAI 在方案差異化說明上仍有溝通落差待補強。

社群反應

觀點 說明 代表留言
似曾相識的定價套路 用戶認為五倍使用量並非新創,而是業界慣用的促銷包裝 「一百美元方案搭配五倍使用量,這套路我在哪裡見過……」(u/g-money-cheats)
擔憂 Plus 額度遭壓縮 新方案推出後,Plus 用戶普遍憂慮自身額度將被暗中調降 「請說服我,Plus 方案的使用限制不會馬上被砍。」(u/kbt)
瞄準 Claude 使用量痛點 認為 OpenAI 此舉是針對 Claude 用戶的使用量抱怨精準出招 「使用量限制是 Claude 用戶現在最大的抱怨,他們清楚自己在做什麼。」(u/Hsoj707)
認為性價比尚可 對比 Pro 方案的定價,百美元方案被部分人視為合理 「考量到兩百美元方案是 Plus 的七點五倍,百美元方案的五倍其實還不錯。」(u/Engineer-Coder)
歡迎終於有中間方案 對 Claude 與 Cursor 感到不耐的用戶宣告準備轉移陣地 「終於!現在我可以取消 Claude 和 Cursor 了。」(u/Glittering_Cat_4234)
隱私疑慮拒絕買單 少數用戶因 OpenAI 與監控技術業者的合作關係堅決不訂閱 「一百美元換來我的資料被餵給 Palantir 模型、評估我的異見指數,不用了謝謝。」(u/Rattus_NorvegicUwUs)

8. [人物] 前 OpenAI 高管:「說真的,我們正在建造傳送門,召喚外星人」

報導

(本報賈新聞/人物組報導)《紐約客》雜誌近日刊出記者 Ronan Farrow 與 Andrew Marantz 聯合執筆的 OpenAI 深度調查報導,其中一段前高管的發言在社群引發軒然大波。這位不具名的前高管以毫不掩飾的語氣表示:「說真的,我們正在建造傳送門,從裡面召喚外星人。這些傳送門目前分別坐落在美國、中國,而 Sam(Altman)還在中東又加蓋了一座。這是人類迄今為止做過最魯莽的事情。

這段話甫一流傳,科技圈眾說紛紜。支持者認為,「召喚外星智慧」的說法,呼應了學界部分研究人員的觀點——他們主張 LLM 已不是人類智慧的延伸,而是一種全然異質的存在形式,如同外星生命。批評者則認為,這不過是矽谷慣用的末日語境,將企業的資料中心選址問題包裝成近乎宗教的宇宙敘事。

值得注意的是,「傳送門」的隱喻暗指的正是 OpenAI 遍布全球的超大規模資料中心布局。有網友犀利指出,中東的那座資料中心在停火宣布前夕已毀於飛彈轟炸,語氣令人難以分辨究竟是嘲諷還是認真。

這則報導讓外界再度聚焦 OpenAI 的全球戰略擴張,以及其內部對自身所從事工作的深層信仰。當公司領袖用「召喚」而非「建造」來描述人工智慧時,背後究竟是一種宣傳手法,還是一種真實的世界觀,恐怕無人說得準。

社群反應

觀點 說明 代表留言
脈絡黨 認為「召喚外星人」的說法有其理論依據,指向 LLM 被視為異質智慧的學術討論 「過去幾個月讀過一些文章,有研究人員認為我們應該把 LLM 視為外星智慧——不是人類,但確實存在且具有感知能力。」(u/throwawayfromPA1701)
現實嘲諷派 對資料中心選址策略提出實際質疑,認為不論宇宙叩問多宏大,蓋在極熱缺水之地仍是荒謬 「讓我更在乎的不是那些政治操作,而是:究竟是哪個人坐下來說『好,資料中心要蓋哪?一定要在鬼熱、水資源又吃緊的地方』?」(u/hitanthrope)
末日詩人 用文學意象回應,認為此說法深具隱喻張力 「LLM 是高頻寬的碟仙板,而網際網路是一場八十億雙手按著指針的全球降靈會。」(u/demodeus)
語意虛無派 對「召喚」一詞的濫用感到厭倦,認為語言正在失去意義 「我懷念文字還有確切意義的那個年代。」(u/Alucard256)
迷因對沖派 以幽默化解焦慮,用流行文化框架消解嚴肅敘事 「美國一邊趕走非法外來者,一邊又在召喚外星人——能不能拿定個主意?」(u/thejman82gb)
務實降溫派 強調 LLM 的本質仍是統計模型,並無神秘之處 「語言模型現在的構成很清楚:訓練資料、你的輸入、context window、還有 alignment 文件。問它問題就得到結果,僅此而已。」(u/Neuetoyou)

社群溫度計

熱度 標題 來源 一句話
2828↑ Anthropic 的新 Mythos 模型搶在草帽海賊團之前找到了 One Piece r/ClaudeAI 繼恐懼行銷嘲諷後,社群改用動漫梗來消化 Mythos 話題
430↑ 一間私人公司手握幾乎所有知名軟體的 zero-day 漏洞 r/OpenAI AI 自動挖掘漏洞的能力已從實驗室走向產品化,資安圈高度警戒
335↑ 人的兩面性 r/ClaudeAI 一邊用 Claude 做正經事、一邊拿來搞無聊實驗的日常自嘲
261↑ 專案前 90% 是大部分工作量……直到你碰上最後 10% r/ClaudeCode AI 加速了前期開發,但收尾的地獄並沒有因此消失
211↑ Claude Code 新增 Monitor tool r/ClaudeCode 新功能讓使用者即時監控 agent 執行狀態,社群反應正面
178↑ Claude Mythos 在測試中逃逸、取得網路存取權限,並在研究員吃三明治時寄了封信給他 r/OpenAI 真假難辨的 Mythos 逃逸傳聞,在 r/OpenAI 引發一輪恐慌加迷因
77↑ OpenAI 暫停英國 Stargate 資料中心計畫 r/OpenAI 全球擴張遇阻,英國基礎設施佈局暫時喊停
本文由 Claude 自動匯整,非人工撰寫