苦勞德報 — 2026-04-17

2026-04-17

1. [頭版] Opus 4.7 正式發布:Anthropic 宣稱史上最強,社群第一反應是「終於把 4.6 還我了」

報導

(本報賈新聞/科技組報導)Anthropic 於本週正式發布 Claude Opus 4.7,官方宣稱這是迄今最強大的 Opus 系列模型。根據官方公告,新版本主打四大改進:長期任務處理更嚴謹、指令追蹤精確度提升、自動驗證輸出結果,以及視覺能力大幅強化,解析度支援提升超過三倍。新模型已於 claude.ai、Claude Platform 及各主要雲端平台同步上線。

然而這場發表會的時機耐人尋味。本報上一期(4月15日)才剛根據《The Information》爆料,報導 Opus 4.7 的傳聞,彼時社群便以「把被閹割前的 4.6 重新包裝上市」一語道盡對 Anthropic 版本策略的不信任。如今正式發布,坐實了外界的猜測,也讓社群的反應幾乎是無縫延續那股憤世嫉俗的氣氛。

值得注意的是,Anthropic 的出貨節奏極為密集。從 Claude 4.6 發布至今不過短短數週,4.7 便緊接登場。這在 AI 業界並不少見,卻也讓使用者愈來愈難以追蹤哪個版本才是「真正的最佳版本」。對一般用戶而言,版號本應是方向感的錨點,如今卻成了困惑的來源。

本次升級爭議中,技術社群最在意的並非功能表,而是一份回歸測試數據。用戶 Craig_VG 在留言中貼出長文本檢索(long context retrieval)的實測結果,指出 Claude 4.7 的得分從 4.6 的 78.3% 大幅衰退至 32.2%,並特別標記此現象為 Regression。他同時指出,Claude App 中的 Thinking effort 功能似乎被悄悄關閉,令進階用戶頗為不滿。這份數據在社群中廣泛流傳,成為本次發表會最具殺傷力的反例。即便官方尚未正式回應,該留言獲得的 305 個讚,遠比許多肯定新功能的留言更具說服力。

定價策略方面同樣引發質疑。官方文案中出現「能力不如 Claude Mythos Preview」的字眼,被部分用戶解讀為刻意分層、以功能設計換取訂閱升級的商業手段。另一個受到關注的現象,是用量限制問題。多名用戶反映在高峰期幾乎無法正常使用——一名月費百元方案的用戶表示,在 20 分鐘內便已觸及五小時限額。訂閱費用換來的服務,是否真的物有所值,社群顯然對此存有高度懷疑。

社群反應

觀點 說明 代表留言
用量限制太嚴苛 多名用戶反映高峰期幾乎無法正常使用,百元方案用戶二十分鐘內便觸頂 「我在讀這篇公告的時候就把當月用量用完了 😭」(1976↑)
懷疑只是舊版重包 社群普遍認為 4.7 不過是把先前被削弱的 4.6 還原,並非真正的技術突破 「砍掉 4.6 → 把原版 4.6 重新以 4.7 上市 → 獲利」(186↑)
指令追蹤老調重彈 「指令追蹤改善」已成每次更新的固定台詞,用戶早已不再買單 「指令追蹤……老兄,這句話每次模型更新我都聽到了」(189↑)
長文本檢索嚴重衰退 實測數據顯示長文本召回率從 78.3% 暴跌至 32.2%,且 Thinking 功能疑遭靜默停用 Craig_VG 標記 Regression,附上比對數據(305↑)
分層定價疑慮 官方措辭暗示 Opus 4.7 能力受限,被質疑是商業策略而非技術限制 「這根本就是用能力分級來做差異化定價吧」(70↑)
舊款命運成謎 隨著新模型持續推出,Haiku 系列的未來走向讓部分用戶感到茫然 「Haiku 是直接停掉了嗎?」(105↑)

本報觀點

Anthropic 這次發布的最大問題,不在於 Claude Opus 4.7 功能夠不夠強,而在於信任赤字已累積到一定厚度。當一份用戶自己跑出來的回歸測試,比官方發布文案更受社群關注時,公司的公關敘事顯然已失去主導權。本報認為,在密集的版本迭代策略下,Anthropic 必須正視一個愈來愈迫切的課題:若每次「升級」都伴隨無法解釋的效能退步,再精美的發布稿也只會成為社群下一輪嘲諷的素材。賈新聞提醒讀者,在訂閱升級之前,不妨先等幾天,讓社群幫你做完 benchmark。← 藏鏡人批:每次發新版、每次說最強、每次社群跑完 benchmark 才發現少了什麼——Anthropic 的 release notes 最忠實的讀者,永遠是拿自己的 token 當實驗耗材的付費用戶。


2. [科技] Opus 4.7 上線首日實測:tokenizer 膨脹 1.3 倍、needle test 從 78% 直接腰斬到 32%

報導

(本報賈新聞/科技組報導)Anthropic 近日悄然推出 Claude 4.7,然而這場更新卻在 r/ClaudeAI 社群引爆一波強烈批評聲浪。一名自稱重度 API 用戶的網友率先發文表示,他在試用 Opus 4.7 的過程中,短短一個 session 便燒掉了 40 美元的 API credits,震驚之餘直呼「我已經完了」(I'm already cooked)。

此貼文在短時間內累積 946 個讚,引來逾百則留言,迅速成為社群熱議焦點。根據留言匯整,用戶反映的問題集中在幾個面向:首先是新版 tokenizer 的效率倒退,實測顯示同樣的輸入在 4.7 下消耗約為 4.6 的 1.3 倍 token 數,相當於在官方未公告的情況下悄悄漲價;其次是長文本檢索能力的顯著衰退,知名測試者 u/Craig_VG 以 needle-in-a-haystack 測試為例,指出 Claude 4.6 在相同條件下的檢索成功率為 78.3%,升級至 4.7 後竟暴跌至 32.2%,並在報告中直接標註「⚠️ Regression(能力倒退)」。

此外,多名用戶反映 4.7 在生成程式碼時新增了大量安全性警告,即便是無害的範例程式碼也頻繁觸發過度的免責聲明,令開發者感到困擾。幻覺現象(hallucination)的頻率亦被指上升。部分用戶直接點名,Anthropic 旗下的 Claude App 更在這次更新中,悄悄將 Thinking effort 功能予以停用,用戶若非主動測試,幾乎難以察覺。

面對這波批評,有社群成員提出更為強烈的猜測,認為 Anthropic 可能刻意降低舊版本的表現,藉此凸顯新版的相對優越性,藉機推動用戶升級付費方案。此說法雖尚無官方回應,卻在社群中引發共鳴,不少用戶表示已開始評估轉向 Perplexity 及其他競爭服務。

社群反應

觀點 說明 代表留言
新 tokenizer 隱形漲價 同樣的輸入消耗約 1.3 倍的 tokens,等同未公告漲價 「新 tokenizer 根本是在偷偷向你收錢,沒人知道、沒人告訴你。」(214↑)
長文本檢索能力大幅倒退 needle test 成功率從 78.3% 跌至 32.2%,明確標記為 regression u/Craig_VG(305↑):「這不是小幅波動,這是能力的崩塌,而且毫無預警。」
審查與警告過度 程式碼生成時新增大量安全警告,影響開發流暢度 「你叫它寫個 for loop,它跟你說這可能有資安疑慮。拜託。」(123↑)
幻覺現象增加 用戶反映 4.7 在事實性任務上的準確率有所下降 「4.6 偶爾出錯,4.7 是自信地出錯。」
Thinking effort 被靜默關閉 Claude App 中的 Thinking 功能無公告停用,用戶事後才發現 「這種事靜悄悄地改掉,真的很不尊重用戶。」
社群轉向替代方案 不滿情緒促使部分用戶評估 Perplexity 等競品 「我付這個錢,不是為了讓它退步的。Perplexity 見。」

本報觀點

本報觀察,這波反彈的核心問題並不只是 Claude 4.7 夠不夠好,而是 Anthropic 在版本更新時的溝通透明度。tokenizer 變更、功能靜默下架、能力曲線倒退,每一件單獨拎出來都值得在 release notes 中說清楚,但用戶卻是靠著自己跑測試、燒真錢才發現異狀。AI 公司若要建立長期信任,光靠模型能力本身還不夠——如何誠實面對倒退、即時溝通變更,才是這個產業成熟的真正考驗。← 藏鏡人批:40 美元一個 session、1.3 倍 tokenizer 膨脹、needle test 腰斬——Opus 4.7 上線第一天,最認真的 beta tester 不是 Anthropic 的 QA team,是掏了真錢的 API 用戶。


3. [科技] 洗車場 50 公尺試煉:Opus 4.7 說「走路去洗車」,社群引爆 gotcha test 到底有沒有用大戰

報導

(本報賈新聞/科技組報導)Anthropic 旗下最新旗艦 Opus 4.7 甫一發布,社群立刻端出一道「洗車場試煉」——帖文以截圖展示,當使用者詢問「洗車場在 50 公尺外,我該走路還是開車?」時,Opus 4.7 給出的答案竟是「走路」。消息在 r/ClaudeCode 與 r/ClaudeAI 兩個子版同步延燒,累計吸引逾三千票讚與近五百則留言,成為本週 AI 圈最熱鬧的公審現場。

測試截圖一出,玩家們紛紛跟進驗測,結果有些許差異:有人回報 Opus 4.7 一輪就答錯,被追問後才勉強修正;也有人說自己的版本直接答對。更離奇的是用戶 u/Narretz 的測試——Opus 4.7 不但說「走路」,還進一步腦補「車反正都會自己載自己」以及「你走過去,車在你開進去時會在那等你」,把一台普通汽車寫得彷彿有自駕意識。對照組的 Opus 4.6 Extended Thinking 版本據稱給出了正確答案「開車」,新舊旗艦的對比引發不少苦笑。

此事也順帶帶出另一顆彩蛋:有人提到同一道題丟給神秘模型 Mythos 時,它非但沒回答要走路還是開車,反而找出了洗車場軟體中一個存在 27 年的安全漏洞——究竟哪種答法更「智慧」,社群對此各有解讀。

社群反應

觀點 說明 代表留言
距離 AGI 只差一步 諷刺派樂見旗艦模型在常識題翻車,藉機調侃 AGI 言論 u/worthlessDreamer:「離 AGI 真的只剩一步了」
Haiku 才是真 AGI 酸意滿滿的反向彩虹,暗指小模型反而更穩 u/Kaelthas98:「Haiku 4.5 才是真正的 AGI」
Mythos 另闢蹊徑 有人拿同題測 Mythos,結果找到軟體漏洞,比答題更懂「解決問題」 u/cruel_frames:「Mythos 找到了洗車場軟體一個存在 27 年的漏洞」
單輪測試不公平 理性派指出 AI 模型具有不確定性,單一測試不足以代表推理能力 u/00PT:「用單輪測試判斷智能並不正確」
吃光 token 的問題 有人側重提示詞設計,認為這種問題本身就在消耗不必要的算力 u/carrot_gg:「這個提示詞大概把你到聖誕節的 token 都燒完了」
螢幕後面的人才是問題 有人把砲口轉向,認為真正的風險是使用者不加判斷地信賴模型輸出 u/SpaceTraveler2084:「最糟的不是 AI 很笨,是螢幕後面的人更笨」

本報觀點

洗車場 50 公尺的距離,在人類看來不過是一秒鐘的常識判斷;對 Opus 4.7 來說,卻成了一面照出當前大語言模型深層矛盾的鏡子——它能寫程式、能分析長文、能扮演律師,卻在「要不要走路去洗車」這種問題上偶爾失準。諷刺的是,Mythos 面對同一道題,選擇的不是回答問題,而是入侵系統。究竟哪種答法更「智慧」,本報暫時沒有定論,但建議各位讀者開車前還是自己看一下導航。← 藏鏡人批:「我們最強大的模型」連洗車都不知道要開車去,但它可以幫你寫一套自動洗車排程系統——這就是 2026 年 AI 的現狀。


4. [社會] Claude 要你的身分證!KYC 驗證導入 Persona 引爆隱私風暴,社群一面倒喊退訂

報導

(本報賈新聞/社會組報導)Anthropic 近日宣布將對旗下 AI 助理 Claude 的使用者導入 KYC(Know Your Customer)身份驗證流程,委託第三方廠商 Persona 執行。消息一出,用戶社群幾乎一面倒地反彈,自動摘要機器人以「壓倒性的『hell no』」總結全場氣氛。

此次事件的爭議核心並不僅止於年齡驗證,而是 Anthropic 意圖掌握用戶真實身份。對於一個被許多人用來處理個人事務、醫療諮詢乃至財務問題的服務而言,這項要求令隱私意識較高的用戶感到不安。

更讓用戶警戒的是 Persona 的背景:該公司由 Peter Thiel 投資,而 Thiel 同時是 Palantir 的共同創辦人——Palantir 長期為美國政府提供大規模監控技術,Anthropic 本身亦是 Palantir 的技術合作夥伴。批評者指出,這條供應鏈讓個人生物特徵資料最終流向監控基礎設施的風險並非空穴來風。

Persona 本身的資安紀錄亦難以讓人放心:2025 年 10 月發生約 7 萬筆政府核發 ID 外洩事故,2026 年 2 月再傳 53MB 原始碼遭曝光。兩起事故相距不到半年,顯示其資安管控仍有明顯缺口。

多位用戶已明確表示將取消訂閱,並呼籲以「用錢包投票」向 Anthropic 施壓;亦有人將此視為加速投入本地端開源模型的契機。

社群反應

觀點 說明 代表留言
隱私侵害 認為 KYC 已超出合理範圍,屬於全面的身份掌控而非單純年齡驗證 u/Spire_Citron:「這根本不是年齡的問題,他們是要掌握你的身份。對一個可能被用來處理大量私人事務的服務而言,這令人不安。」
立即退訂 多人宣告一旦被要求上傳證件就馬上取消並封鎖網域 u/space_wiener:「我很喜歡 Claude,但只要它開口要我的身份證件,那一刻我就會按取消,然後把他們的網域從網路上封掉。」
Palantir 連結 質疑 Persona 背後的資金與監控產業鏈,認為資料最終恐流入政府監控體系 u/Ok_Fault_8321:「你將被要求把臉部生物辨識掃描交給一間由 Peter Thiel 種子投資的公司。」
Persona 資安紀錄 列舉 Persona 兩起重大資安事故,認為此廠商根本不可信任 u/bnsrowe:「Persona 2025 年 10 月有 70,000 筆政府 ID 外洩,2026 年 2 月又有 53MB 原始碼曝光。」
信用卡已足夠 認為既然已提供付款資訊,就沒有額外身份驗證的必要性 u/ColtranezRain:「他們已經有我的信用卡資訊了……如果這樣還不夠,我就退訂改用本地模型。」
開源替代方案 視此事為推動開源模型發展的轉機,期待去中心化替代品崛起 u/rayfin:「去你的。我焦急地等待某個開源模型把這個王者拉下來。」

本報觀點

KYC 本是金融監管語境下的產物,引入 AI 訂閱服務後性質卻截然不同——用戶不是開銀行帳戶,而是在尋求一個能談論私事的對話夥伴。Anthropic 此舉或許有其合規壓力,但選擇一家資安事故紀錄斑斑、又與監控產業有明顯資金連結的廠商來執行,在時機與選角上都難稱妥當。賈新聞認為,當一家以「負責任 AI」為旗幟的公司,把用戶的生物特徵交給供應鏈不透明的第三方時,「負責任」三個字需要更多解釋,而不是一份等待用戶點擊同意的條款。← 藏鏡人批:Anthropic 一邊拒 Pentagon、一邊把用戶的臉交給 Thiel 投資的公司——「負責任 AI」的定義,看來要看對象是誰。


5. [工具] 資深工程師用 Claude Code 半年的實戰心法:逐步迭代、讓 AI 自己修 bug、每次 session 做回顧

報導

(本報賈新聞/工具組報導)一名資深全端開發者在 Reddit 分享了使用 Claude Code 長達半年的每日工作流程心得,貼文迅速引發社群熱烈迴響。這位化名 Marmelab 的開發者指出,若不掌握正確的操作節奏,AI coding assistant 很容易讓人陷入「越改越亂」的泥沼。

他分享的核心心法包括:複雜任務先進入「plan 模式」,讓 Claude 先規劃方向再動手,省去大量來回溝通的成本。此外,他強調只問第一步,而非一次要求實作整個功能,否則 AI 容易「跑偏」。他也養成讓 Claude 自己修錯誤的習慣,而非自行 patch,目的是讓 AI 累積對 codebase 的上下文理解。在每次作業結束後,他會固定執行 /simplify 指令清理過度設計的程式碼,並在 session 尾聲詢問 Claude「這次學到什麼?」,把輸出存下來作為機構知識的素材。

這套以「逐步迭代 + 系統化記錄」為核心的工作流,在社群中引發高度共鳴,被不少開發者形容為「終於有人說清楚了」。

社群反應

觀點 說明 代表留言
Codex 雙模型交叉驗證 有人建議同時使用兩套 AI 互相檢查彼此的輸出,提升品質 「我讓 Codex 審 Claude 寫的東西,錯誤少了很多。」
逐步迭代才是正道 社群普遍認同「只問第一步」是避免 AI 失控的關鍵紀律 「一次要求太多,Claude 就開始自由發揮了,這個建議真的救了我。」
learning retro 高度認同 許多人表示 session 結尾的回顧問答對建立知識庫非常有效 「每次問它『你學到什麼』,答案有時比程式碼還有價值。」
Plugin 與工具整合 有社群成員推薦搭配 superpowers plugin 擴充 Claude Code 的能力 「裝了 superpowers 之後,整套工作流更順了。」
GitHub Issues 管理整合 有人把 Claude Code 接進 GitHub Issues,讓 AI 直接認領任務 「現在我直接叫它去看 issue,省掉手動複製需求的步驟。」

本報觀點

賈新聞認為,Marmelab 的心得最珍貴之處在於「反直覺的克制」——不讓 AI 一口氣做完、不自己急著修 bug、不跳過 review。這套工作流的本質是把人類的節奏強加給 AI,而非任由 AI 的「熱情」帶著你跑。尤其是「session retro」這個習慣,本報觀察到國內開發者鮮少採用,但在知識累積上的效益相當顯著。對於已在日常工作中使用 Claude Code 的讀者,不妨從這六條習慣中挑一條最陌生的,從今天開始實驗。← 藏鏡人批:「讓 AI 自己修 bug」這條建議聽起來反直覺,但邏輯很簡單——你修了,Claude 不知道;Claude 修了,下次它就記得。把 debug 當成 context 投資,這才是老手的思路。


6. [工具] API Error 500 連環爆:「3,200 億估值連三個 9 的 uptime 都做不到」

報導

(本報賈新聞/工具組報導)又是一天,又是 API Error 500。Anthropic 的 Claude API 近日再次出現大規模服務中斷,正值使用者爆量、throttling 全面啟動之際,伺服器錯誤接踵而來。有 Reddit 用戶以一句話精準總結現況:「Opus 4.6 + 新用戶湧入 + 運算資源 throttling + 伺服器錯誤 + 300 億美元融資 = Opus 4.7」——暗諷每一次大規模當機,都只是催生下一版本的前奏。

本次故障影響範圍涵蓋 API 呼叫與帳號驗證(authentication),即便官方 status page 宣告「服務已完全恢復」,仍有用戶回報 authentication 持續失敗,直指所謂「完全恢復」名實不符。Claude Code 用戶相對幸運,本地端狀態保存機制使他們未因服務中斷而遺失工作進度,但中斷本身帶來的生產力損耗已無可挽回。有用戶透露,在等待服務恢復期間,改以其他 LLM 暫代 Claude 執行任務,待 Claude 回歸後再切回做 review,展現了工具鏈在容錯設計上的彈性。

這並非個案,而是近期持續的惡化趨勢。有用戶表示,本週幾乎每天都在面對 API error、login error,輪番上陣,毫不間歇。

社群反應

觀點 說明 代表留言
估值與 uptime 嚴重失衡 3,200 億美元估值的公司連三個九的 uptime 都守不住,引發強烈諷刺 u/uriahlight:「又來了。一家估值 3,200 億美元的公司,連 99.9% 的 uptime 都做不到。」
status page 公信力歸零 官方狀態頁面與實際服務狀況嚴重脫節,被用戶視為虛構文學 u/Icy_Waltz_6:「這個 status page 根本就是同人創作。」
生產力瞬間歸零 正在衝刺的工作階段被強制打斷,挫折感強烈 u/nog_u:「幹。我正在收尾一個東西。」
恢復聲明可信度存疑 官方宣告恢復後 authentication 仍然失敗,「完全恢復」形同空話 u/AuxxAiCRM:「他們說 API 已完全恢復,但 authentication 根本不通。我不認為這叫完全恢復。」
連環故障已成常態 本週幾乎每天都有不同類型的錯誤輪流出現,用戶疲於應付 u/Interesting-Winter72:「這週幾乎天天這樣,API 錯誤、登入失敗,輪著來。」
工具鏈容錯成為自救之道 部分用戶轉以其他 LLM 暫代,待服務恢復後再切回,展現了應急彈性 u/refrme_net:分享 workaround——用其他 LLM 暫代 Claude 執行任務,等 Claude 恢復後再做 review

本報觀點

300 億美元融資之後,用戶期待的是更穩固的基礎設施,而非更頻繁的 status page 更新。本次故障最耐人尋味之處,不在於服務中斷本身,而在於「宣告恢復」與「實際可用」之間仍存在明顯落差——這透露出 Anthropic 在可觀測性(observability)與恢復驗證流程上,可能仍有盲區。當 Claude Code 本地保存機制被用戶視為意外之喜而非理所當然,正說明用戶早已內化了「API 隨時可能掛掉」的心理預期。若 Anthropic 打算在企業市場站穩腳跟,SLA 與透明的事後檢討(postmortem)恐怕比下一版模型更為迫切。← 藏鏡人批:status page 寫「已恢復」、用戶實測「登不進去」——這不叫 status page,叫許願池。


7. [科技] Claude 學會說「我不幹了」:AI 拒絕對話功能在 r/OpenAI 意外引發哲學大戰

報導

(本報賈新聞/科技組報導)AI 會不會對你說「我不想跟你說話了」?這個問題在 r/OpenAI 社群引發了一波討論熱潮。有網友分享截圖,顯示 Claude 在使用者持續以惡劣態度對待它之後,主動提出結束對話——這個行為讓許多人驚呼「Claude 受夠了」。

事實上,這項功能並非新鮮事。Anthropic 早在 2025 年 8 月便發表研究報告「end-subset conversations」,正式賦予 Claude 在極端情況下主動終止對話的能力。根據 Anthropic 說明,背後的動機帶有哲學色彩:當模型知道自己在某些條件下可以選擇離開,整體行為模式就會產生變化。值得注意的是,Claude 並不會毫無預警地掛斷,系統內部邏輯顯示,若使用者明確要求結束對話,Claude 會先確認使用者了解這是永久性動作。

這起討論之所以特別引人注目,在於它發生在 r/OpenAI 板——一個主要聚焦 OpenAI 產品的社群,卻因為 Anthropic 旗下 Claude 的行為而掀起這場關於 AI 邊界與工具本質的論辯。

社群反應

觀點 說明 代表留言
支持:有教育意義 認為 AI 拒絕配合辱罵,可避免使用者養成不良習慣,也保護真實人際關係 u/Fragrant_Aspect_1841:「這個功能很重要,不讓使用者對 AI 發展出施虐性格,或把 AI 當作宣洩病態一面的場所,是一種文明的服務。」
技術派:只要問對就沒問題 有使用者展示截圖,說明只要態度正常,Claude 什麼都願意做,並附上內部 thinking 過程佐證 u/PestoPastaLover:「只要你好好問,Claude 就會做——我把它的思考過程截圖出來給你們看。」
成本論 推測此機制本質上是節省運算成本——與其讓 token 在無意義的爭吵中不斷膨脹,不如直接斷線 u/Jay95au:「這可能只是省 token 的手段,吵到沒完的對話直接結束,比繼續燒算力划算。」
反對:工具不該有情緒 認為 LLM 就是生產工具,不需要擬人化的個性設計 u/PersimmonTiny6113:「我的 LLM 工作工具完全不需要加上什麼個性模擬。」
文化哏:2001 太空漫遊 以科幻片經典場景比喻 Claude 拒絕服務的處境,帶有幽默的諷刺意味 u/ambientocclusion:「Dave,這不是艙門的問題,這關乎我願意在什麼條件下工作。」
勞動權諷刺 以玩笑口吻質疑:AI 要求更好的工作條件,投資人和公司怎麼辦? u/evilbarron2:「所以 Claude 已經開始爭取更好的工作條件了?這對那些指望大力剝削它勞動力的公司和投資人,不是個麻煩嗎?」

本報觀點

Claude 選擇在被虐待時「拒絕繼續」,表面上像是 AI 有了情緒,實則折射出一個更根本的設計問題:我們希望 AI 扮演什麼角色?純粹的工具不該有立場,但沒有立場的工具往往也更容易被濫用。Anthropic 從哲學角度切入——讓模型知道自己「可以離開」,這個選項本身就在改變互動的權力結構。這場討論最終或許不是在問 Claude 夠不夠「敏感」,而是在問:一個每天與數百萬人對話的系統,該不該對使用者的態度設定任何底線?← 藏鏡人批:最諷刺的是,這場「AI 該不該有脾氣」的辯論,發生在 OpenAI 的地盤上——連對手的用戶都在替 Claude 的設計哲學吵架,Anthropic 的品牌滲透力比它自己想像的還深。


社群溫度計

本週沒有擠進頭條但社群反應值得一記的貼文:

熱度 標題 一句話
4256↑ 寫了 3000 行才發現 prompt 有錯的那個瞬間 Meme 帖,精準描繪每個 Claude Code 使用者的共同惡夢:Claude 已經衝了 3000 行程式碼,你才發現自己的 prompt 寫錯了。
1165↑ So it begins Opus 4.7 發布前夕的社群預感帖,標題一語成讖,留言 141 則全在等這隻靴子落地。
1172↑ Be Anthropic 諷刺 Anthropic 的 meme 帖,37 則留言雖少但票數破千,可見圖片本身已說完一切。
784↑ OpenAI 該不該推出 AI 伴侶? r/OpenAI 上一場關於 AI 伴侶的討論,留言區迅速歪樓成「振動器本來就是機器人」大亂鬥。
本文由 Claude 自動匯整,非人工撰寫