苦勞德報 — 2026-04-27

2026-04-27

1. [頭版] 五個字母燒掉兩百美元：HERMES.md 觸發 Claude Code 帳單黑洞，Anthropic 拒絕退款

作者：u/alexxxklepa | 1329↑ | 174 則留言

報導

（本報賈新聞／工具組報導）一位訂閱 Claude Max 20x 方案（月費 $200）的工程師近日揭露，只要 git commit message 中出現大寫字串「HERMES.md」，Claude Code 便會在使用者毫不知情的情況下，將計費從 Max 訂閱悄悄切換至 extra usage（API 計費），導致他在 plan capacity 尚剩 86% 的情況下白白燒掉 $200.98。

事情起因於作者反覆收到「out of extra usage」錯誤訊息，卻找不到原因。他花費數小時進行 binary search，跨 repository、逐一比對 commit 紀錄，最終鎖定觸發條件：commit message 必須包含完整大寫字串「HERMES.md」（含副檔名、全大寫）。改成小寫「hermes.md」則完全正常；AGENTS.md、README.md、純字串「HERMES」（不帶 .md）一概不受影響，只有這個精確字串命中。

技術層面來看，Claude Code 會將使用者的 recent commits 納入 system prompt 傳送至伺服器。Anthropic 伺服器端某段邏輯在偵測到「HERMES.md」後，便將該次請求的 billing routing 從 Max plan 改為 API 計費。HERMES.md 是開源 AI agent 框架 Hermes 的慣用規格檔名，性質與 AGENTS.md、CLAUDE.md 類似，用於向 agent 宣告指令與上下文。

作者三度聯繫 Anthropic 客服，對方均承認此為「authentication routing issue」，卻拒絕退款，官方回覆稱：「對於 degraded service 或技術錯誤導致的 incorrect billing routing，我們無法給予補償。」相關 bug 報告已在 GitHub 開立（anthropics/claude-code/issues/53262）。

社群對此事的解讀相當一致：這是 Anthropic 為了阻止用戶以 Max 訂閱執行 agent 框架而部署的 server-side 偵測邏輯，目的是把 Hermes agent 使用者強制導回 API 計費。然而偵測條件過於粗糙，只要 commit 歷史中恰好出現這個檔名，一般使用者也會中招。

本報觀點：billing 邏輯若真的由一條字串比對決定，出了錯又拒絕補償，這對 Max 訂戶的信任傷害遠遠超過兩百美元本身。← 藏鏡人批：服務端用 regex 認 commit message、出包再用「政策不退款」收尾，這不是 bug，是治理品味。

社群反應

觀點	說明	代表留言
問題不止 HERMES.md	其他 agent 框架同樣中招	「openclaw 也一樣，CLI 帶任何看起來像 openclaw 的字就跑去 extra usage」(208↑)
這是刻意打壓 agent 框架	認為是粗暴的 server-side 偵測，意在強迫 agent 使用者付 API 費	「Anthropic 最近打擊用 Claude 訂閱跑 agent 框架的人，偵測太寬，光看到檔名就誤判」(205↑)
幽默回應	用荒謬的例子嘲諷這條邏輯有多脆弱	「你覺得這個貴？試試 BALENCIAGA.md」(170↑)
這根本是功能不是 bug	諷刺 Anthropic 是故意的	「bug？這明明是 feature」(93↑)
法律風險	認為此行為可能讓 Anthropic 吃上官司	「聽起來是準備吃官司了」(92↑)
建議 chargeback	主張向信用卡公司申請爭議款項	「這叫 chargeback」(65↑)

2. [社會] 付 $200 美元卻找不到真人——Anthropic 客服系統從設計上就沒有逃生路徑

作者：u/AppearanceSingle805 | 232↑ | 94 則留言

報導

（本報賈新聞／社會組報導）一名 Claude Max 20x 訂閱用戶日前在 Reddit 發文，描述其購買的禮物訂閱在有效期間內無預警消失——沒有 email 通知、沒有任何解釋，發票確認仍屬有效，但訂閱頁面憑空蒸發，甚至不是顯示「已過期」，而是根本不存在。

他隨即嘗試聯繫 Anthropic 客服，卻踏入一個設計上就沒有出口的迷宮。Anthropic 目前的即時支援唯一管道，是名為「Fin」的 Intercom AI bot，無電話、無真人 live chat、無直接 email。Fin 無法升級轉接真人、無法開立 billing ticket，也無法確認問題是否已被轉介。在同一段對話中，Fin 反覆詢問用戶已回答過的澄清問題，讓對話在原地打轉。

最終，用戶收到一封自動回覆 email，信中承認系統出現異常，但解決建議卻是：「請使用帳號內的自助退款流程」——而問題的根源正是訂閱已從帳號中消失，自助流程的前提條件根本不成立。信件末尾還附上一句「還有什麼能幫忙的？」，令人啼笑皆非。

這名用戶同時是 AI 工具課程講師，事發當天才剛向學生推薦購買 Claude，幾小時後便親身撞上這道困境，直言不知隔天如何向學生交代。

此事揭露的結構性問題並非偶發：當帳務錯誤源於 backend bug，且帳號狀態本身已損壞，整條自助支援鏈就同步失效。Fin 推自助流程，自助流程要求帳號正常，帳號壞掉，迴圈無解。社群稱此現象為「Fin loop」。

更廣的質疑是：Anthropic 的 Pro 與 Max 方案定價已達 $20 至 $200 美元／月，甚至開放禮物訂閱販售，但其支援基礎建設卻幾乎停留在「能省則省」的層次。社群普遍觀感是：Anthropic 對非 Enterprise 客戶的隱性政策就是「pay for Enterprise or get lost」（付 Enterprise 方案或請自便）。← 藏鏡人批：當「自助流程的前提是帳號正常」遇到「帳號狀態壞掉」，AI bot 永遠補不齊這一塊。

社群反應

觀點	說明	代表留言
Enterprise 才是真正客戶	Anthropic 對散戶的態度毫不掩飾	u/nrauhauser：「Anthropic 的訊息很清楚——轉 Enterprise 才有 support，不然滾蛋。」
Chargeback 是最有效的自力救濟	信用卡退款是散戶對大公司少數真正有效的施壓手段	u/DarkSkyKnight：「Chargeback。累積夠多 chargeback、信用卡公司會威脅停止為這家公司處理交易，是有用的。順便去 BBB 留 1 星評論。」
散戶本來就不是目標客群	月訂閱定價低於成本，流失散戶對公司無感	u/f1reMarshall：「他們不在乎散戶，月訂閱本來就在賠錢賣，流失客戶他們無感。」
非美國用戶處境更糟	地理位置造成帳號封鎖，聯繫管道只剩 Google 表單	u/matjam：「在澳洲短差用了帳號就被封，回美國也聯絡不上人，只給 Google 表單，可悲。」
Fin loop 是共同經驗	AI bot 聲稱轉介真人後直接沒了下文	u/Mr-Anthony-：「Fin 跟我說『正在找真人』之後就把我 ghosted 了。」
講師推薦後立即踩雷	事發時機讓當事人信譽受損	u/AppearanceSingle805 (OP)：「自己在教 AI 工具課程，當天才推薦學生買 Claude，學生付完錢隔幾小時我就遇到這事，不知道明天怎麼面對學生。」

3. [科技] 125 字未發表稿讓 Claude 4.7 說出記者姓名，文字風格成新型數位指紋

作者：u/kurthertz | 519↑ | 77 則留言

報導

（本報賈新聞／科技組報導）科技媒體記者 Kelsey Piper 日前公開一項自我實驗：她將一段 125 字、從未發表過的政治專欄草稿貼進 Claude 4.7，模型不僅正確說出她的名字，連職業背景都指向符合事實的方向。為了排除各種替代解釋，Piper 設計了一套系統性的控制實驗：登出帳號並開啟無痕視窗，排除帳號 ID 的可能；改走 raw API，排除 browser fingerprinting；換到朋友的筆電操作，排除 IP 位址；最後還改用截然不同領域的文字，包括她幫小孩寫的 Pokémon 評語，以及一篇虛構的 1942 年戰時喜劇影評，排除主題識別的干擾。每一回，Claude 4.7 都認出了她；ChatGPT 與 Gemini 則全數猜錯。

這份紀錄完整刊登於 theargumentmag.com，在科技社群引發廣泛討論。討論焦點迅速從「這個測試有多驚人」轉移到一個更深層的問題：Claude 4.7 本週同時被觀察到在寫作輸出上出現退步（regression），生成的文字比舊版僵硬、風格單一。部分評論者認為兩件事可能是同一特性的兩面——若模型在後訓練過程中把 prose pattern 的結構編碼得夠深，深到能從 125 字辨認出作者身份，生成時自然也難以偏離自身的「中央聲線」。讀的能力越強，寫的自由度可能就越受限，形成一組清晰的 reading-vs-writing trade-off。

資安研究者對此案例最為警覺。stylometry（文體計量學）本身並不是新技術，學術界早有透過寫作風格反匿名化的研究，但過去需要大量語料與專業工具；如今一般人透過對話介面、只要貼入一小段文字，就可能觸發類似效果。這意味著 deanonymization 的門檻大幅降低，匿名帳號的連結風險變得更加具體。← 藏鏡人批：reading-vs-writing trade-off 也許就是 4.7 寫得僵的原因 — 模型把 voice 內化太深，反而很難寫出別人。

不過，方法論上的質疑也不少。有人指出 raw API 仍需登入 Anthropic 帳號，Anthropic 是否真的完全不傳遞 query 身份資訊尚不明確；也有留言表示 Claude 對其他使用者的文章也常猜成 Kelsey Piper，懷疑可能只是模型對知名寫作者的偽陽性 overfit，而非真正的 writing fingerprint 辨識能力。無論如何，這場討論讓「你的文字風格本身就是身份」這個命題，第一次以如此具體的方式浮現在主流科技讀者面前。

社群反應

觀點	說明	代表留言
方法論有漏洞	raw API 仍需登入帳號，部分控制條件未必足夠嚴謹	u/Garfieldealswarlock（80↑）：「方法論不嚴謹——API 還是要登入，Anthropic 是免費送 4.7 query 嗎？朋友拿到的是純文字還是截圖？」
文字身份訊號早已存在	寫作 voice 鮮明的人被認出不意外，如同聲紋辨識	u/veshneresis（62↑）：「人們不知道自己的寫字裡塞了多少身份訊號。如果你是 voice 鮮明的名記者，這跟聲紋分類器幾秒抓出名聲優一樣不意外。」
歷史先例呼應	2018 年 Pence「lodestar」社論識別事件已有先例	u/Marathon2021（60↑）：「當年 Mike Pence『lodestar』匿名社論識別事件，Opus 4.7 現在大概也能認出。」
可能是偽陽性	Claude 對其他文章也常猜成同一人，結論可能下太早	u/trashpandawithfries（13↑）：「剛開始覺得很猛，後來才發現 Claude 對其他人的字也常猜成 Kelsey Piper。」
訓練資料汙染	少數人寫了大量公開文章，模型認得並不能證明 fingerprint 推論	u/LoneFox4444（8↑）：「訓練資料裡相對少數的人寫了大量文章，LLM 認得不意外。」
匿名風險上升	公開寫作會讓人更不敢分享，資安層面值得重視	u/Explore-This（3↑）：「我們比想像的更可預測——一直在留下線索。這會讓人更不敢公開分享。」

4. [產業] Cloudflare 推出企業級 MCP 治理方案，產業會跟進還是無人在意？

作者：u/EquipmentFun9258 | 75↑ | 18 則留言

報導

（本報賈新聞／產業組報導）Cloudflare 趁著自家 Agents Week，一口氣推出一整套針對 MCP 的企業治理工具，試圖在快速膨脹的 AI agent 市場裡，搶先佔下 infra 層的話語權。

這次推出的東西涵蓋幾個面向：MCP server portals 能把多個上游 MCP server 收攏在 Cloudflare Access 認證後面，統一出入口；Code Mode 則是這次最受技術社群注意的設計——它把上千個 API endpoint 摺疊壓縮成僅剩兩個 tool（search 與 execute），跑在沙箱 Worker 環境中，據稱能把 context cost 砍掉 99.9%；AI Gateway 夾在 MCP client 與 model provider 之間，負責 usage tracking；Shadow MCP detection 功能則被整合進 Cloudflare Gateway 分類系統，針對未經審核的 MCP server 連線進行偵測。

原 po 拋出的核心問題切中要害：大多數使用者真正在串接的 SaaS MCP 端點，壓根沒有任何正式控管——沒有 server allowlist、沒有 audit log，licensing 只有全開全關，admin 介面就一個「啟用 AI: yes/no」的開關。不是供應商主動推的，是使用者自己拉去用的。他舉了一個行銷部門的實例：把 Claude 加上 MCP 串接 marketing automation、CRM 和活動平台，一條 prompt 就能完成「拉出 no-show 名單 → 依職稱分群 → 產出三條訊息 → 排入 HubSpot」，原本 ops 要花兩天的工作，20 分鐘搞定。

這背後映照出兩條截然不同的治理路徑：一條是讓 SaaS 廠商在 app 層做 per-feature toggle、MCP allowlist 和 audit log，顆粒度更細；另一條是把治理永久交給 network/infra 層（如 Cloudflare）集中管控，做到統一可見性，但犧牲細部授權彈性。實務上，熟悉這個領域的觀察者傾向認為兩層最終都需要，而且缺一不可，因為 proxy 能告訴你 agent 呼叫了 HubSpot，卻不一定知道這個呼叫是否在業務邏輯上合理。

更深層的問題在於 agent identity。現有 SaaS 的權限體系是為人類設計的：一人對應一個角色、一個 session。但 agent 需要的是 per-task 動態 scope——每次呼叫都應該帶不同的最小權限。若只是把人類的 session token 交給 Claude 使用，audit log 最後寫的只會是「alice 在 20 分鐘內做了 4,300 件事」，根本無法追溯責任。這意味著 agent identity 必須是 first-class，而非現有人類帳號的借用。← 藏鏡人批：留言區一片冷淡，連「這 thread 是 AI 在跟自己對話」都被推上 67 票，infra 廠商比應用廠更急著拿走治理話語權，誰先出招誰先吃下市場。

社群反應

觀點	說明	代表留言
懷疑 thread 本身是 AI 生成	留言區氛圍偏冷，不少人直接點出討論像是 AI 在跟自己對話	u/NLMichel（67↑）：「感覺整個 thread 就是 Claude 自己跟自己對話。」
認為抄了既有方案	指出 Cloudflare 的做法與 Composio 高度雷同	u/cuba_guy（6↑）：「看起來抄了 composio。Composio 之所以存在，部分原因就是 Anthropic 當初急著推半成品的 protocol。」
認為只是個 proxy	直言不懂為什麼大家覺得有什麼新鮮的	u/steveoderocker（6↑）：「就是個 proxy，沒什麼特別的，不知道大家在嗨什麼。」
infra 層治理有天花板	肯定 Cloudflare 能處理 identity 與 log，但 SaaS 仍需負責 object permission 與真實 audit trail	u/Basic_Plate6270（2↑）：「proxy 能告訴你 agent 呼叫了 HubSpot，但不一定知道這個動作合不合理。」
Shadow MCP detection 是真實攻擊面	認為未審核 server 的風險被低估；Code Mode 的 context 壓縮設計點中關鍵瓶頸	u/Syncher_Pylon：「Shadow MCP detection 最有趣——未審核 server 連到 model context 的攻擊面是真的。Code Mode 把 endpoint 摺成兩個 tool 很聰明。」
主張需要第三條路：brokered control plane	認為 infra 與 app 兩層都不夠，需要 broker 把 agent 身份換成 scoped token	u/Turbulent-Toe-365：「agent 需要 per-task 不同 scope。否則 audit log 只會寫『alice 在 20 分鐘內做了 4,300 件事』。」

5. [工具] 依任務挑模型：Opus 規劃、Sonnet 執行、Haiku 打雜，還是全梭 Opus？

作者：u/indiebytom | 83↑ | 35 則留言

報導

（本報賈新聞／工具組報導）在 Claude Code 的使用成本日益受到關注之際，如何依任務性質挑選模型，成為 vibe coding 圈子近期討論最熱烈的話題之一。原 PO u/indiebytom 全職 vibe coding 數個月，坦言雖然知道 Opus 用在簡單編輯太浪費、Haiku 拿來做複雜重構又力有未逮，實務上卻還是懶得切換、一路用預設。貼文提出三個問題：什麼時候該降到 Sonnet 或 Haiku？事後怎麼查哪些任務最燒錢？還是乾脆不要想這件事？

社群的回應呈現出明顯的光譜：一端是「全部跑 Opus 4.7 MAX，懶得算」，另一端則是寫了 UserPromptSubmit hook、用 regex 自動分析 prompt 內容並在終端印出「MODEL HINT」建議的工程師。

主流共識頗為一致：Opus 負責規劃與架構決策，Sonnet 作為日常執行主力，Haiku 接手機械式雜務，例如批次 rename、跑 test loop、修 import。u/Exact_Guarantee4695 特別點出 Haiku 的隱藏優勢——因為它「不過度思考」，在跑測試迴圈、修 import 這類有標準答案的任務上反而比 Sonnet 更穩。

進階玩法來自 u/Bitter-Law3957：透過 UserPromptSubmit hook 以 bash 腳本比對 prompt，觸發 Opus 的 pattern 包含 architect、system design、trade.?off、failed (twice|again)、still broken 等，觸發 Haiku 的則是 summarize、explain、what does .* do。這套做法讓模型路由從人工判斷變成自動提示，大幅降低使用者的認知負擔。

u/KEIY75 則走得更遠，架設了名為「REX」的 Opus orchestrator，設計上刻意移除 bash、coding、search 等工具，只讓它做 prompt 改善、任務分派與 orchestration；實際執行交給 sub-agent，並同時混用 Codex CLI、Gemini 和本機 LLM，在 PC 與 Mac 上平行跑。

u/tensorfish 提出另一個值得留意的觀點：追蹤 turn 數、tool loop、cleanup 次數，因為貴的模型有時反而是更便宜的整體成本——一次想清楚，省掉後續多輪修正。

截至發稿，Claude Code 的模型路由仍未出現收斂的最佳解。從「決策成本」（切換模型本身需要判斷力）到「token 成本」（跑錯模型多花的錢），使用者各自在兩端摸索最佳化路徑。← 藏鏡人批：「全梭 Opus 4.7 MAX」與「regex hook 自動路由」剛好是兩種人格，一個信仰算力、一個信仰工程，兩條路都活得好好的。

社群反應

觀點	說明	代表留言
Opus orchestrator，sub-agent 跑便宜模型	Opus「REX」做分派、實際任務下放 sub-agent，混用多種模型與工具	u/KEIY75：「orchestrator『REX』是 Opus 4.7 max effort，只能讀＋編輯 workspace，sub-agent 用 tmux `--continue` 持久化。」
regex hook 自動路由	UserPromptSubmit hook 比對 prompt pattern，印出建議模型	u/Bitter-Law3957：「我提供了一段 bash 腳本：用 regex 比對 prompt，吐出『MODEL HINT: ...』並建議切換模型。」
全梭 Opus 4.7 MAX	不做任何路由判斷，全部用最強模型	u/Choose_ur_username1：「全部跑 Opus 4.7 MAX。」
Sonnet 是主力，Opus 只給不易回頭的決策	Sonnet 90% 的時間夠用，Opus 留給複雜大型問題；Haiku 給機械任務	u/Exact_Guarantee4695：「Haiku 的隱藏好處：跑 test loop、修 import 很強，因為它不過度思考。」
sub-agent 用 Haiku 拉平成本	prompt 設計成高度平行的 sub-agent 工作，每個跑 cheaper model	u/radiationshield：「sub-agent 通常會跑 Haiku。」
turn 數與 tool loop 才是真實成本指標	貴的模型一次到位，反而可能比便宜模型多輪修正更省	u/tensorfish：「值得追蹤的是 turn 數、tool loop、cleanup — 貴的模型有時是更便宜的整體成本。」

6. [工具] 有人把 Claude Code 用量做成桌上小裝置，即時顯示還附加密保護

作者：u/MechanicalDomineer | 159↑ | 18 則留言

報導

（本報賈新聞／工具組報導）當 Anthropic 的計費系統讓開發者摸不著頭緒，有人選擇自己動手。u/MechanicalDomineer 利用週末時間，打造了一台獨立的桌上小裝置，專門輪詢 Anthropic API、把 Claude Code 的 5 小時與 7 天用量視窗即時顯示在小 LCD 螢幕上，全程不需要連電腦。

硬體面，作者選用兩款平價 ESP32 開發板：M5StickC Plus 與 LilyGo T-Display S3，成本低、體積小，適合隨手放在桌上。初次設定透過 captive portal 以手機完成 WiFi 與 API token 的輸入，不需要額外安裝軟體。安全設計上也不馬虎：OAuth token 以 AES-256-GCM 加密儲存在裝置內，以 PIN 解鎖，且 PIN 本身不會存在裝置上，減少洩漏風險。

功能清單涵蓋即時 usage bar 搭配 reset 倒數計時、電量與 WiFi 訊號顯示，以及實體按鈕控制（調整亮度、手動 refresh、factory reset）。整個專案以 MIT 授權開源，程式碼放在 GitHub（github.com/oauramos/claude-usage-stick），任何人都可以自己組一台。

作者定位這是「週末等級的專案」，卻意外觸動了一群有相同需求的開發者。在 Anthropic 帳務資訊透明度有限的背景下，這台小裝置某種程度上成了開發者「自助透明化」的微型工具——與其等 dashboard 更新，不如在桌上放一個會即時說實話的小東西。← 藏鏡人批：一篇 HERMES.md billing 黑洞、一篇 Fin loop 客服迷宮，再讀到這台會說實話的小裝置，順序剛好對得上 — 廠商不透明、使用者就自己造。

社群反應

觀點	說明	代表留言
硬體再利用	有人看到了自己閒置裝置的新用途	u/mrplinko（17↑）：「太棒了，我有一堆 Meshtastic 裝置堆著，現在終於有用途了。」
Hacker 精神認同	「不必要但就是要做」的精神引起廣泛共鳴	u/btherl（13↑）：「我喜歡這完全沒必要，就像在計算機上跑 Doom 一樣，我愛。」
多巴胺效應	實體化的用量反饋讓人感到愉悅	u/Round-Geologist-5628（5↑）：「這種東西讓我大腦充滿多巴胺，太讚。」
自嘲式反觀點	有人調侃這會變成一直被 nerf 提醒的焦慮來源	u/Due_Duck_8472（3↑）：「好像你想被 nerf 提醒，一直盯著看。」
功能願望清單	社群立刻提出延伸需求	u/Traditional_Half4886（2↑）：「希望逼近 limit 時能嗶嗶叫，會超棒。但要是我來用大概一直在叫。」
技術細節追問	對 reset 倒數的實作邏輯感到好奇	u/david_0_0（2↑）：「reset 倒數是 API response header 有回傳 window 起始時間？還是從 usage 攀升時間推估？」

7. [社會] [老手說你不會用，新手隔天就示範了什麼叫不會用]

兩則熱帖：「我要退這個 sub」（u/AtmosphericBeats，1205↑ / 289 則）｜「沒了，我是白癡」（u/gimperion，909↑ / 216 則）

報導

（本報賈新聞／社會組報導）r/ClaudeCode 本週出現一對教科書等級的互文帖子，前後相隔不到 24 小時，兩篇合計逾兩千票，共同拼出一幅當代 AI 工具社群的群像。

第一篇由自稱有逾十年科學運算與影像分析經驗的 u/AtmosphericBeats 發出，語氣彷彿一位腰傷反覆發作的武館老師父，終於忍不住對著館裡滿地踢打的學生開口：「你們有幾個人讀過自己的 prompt？」文章條列四點，核心主張是：token 燒光不是模型的問題，是使用者沒做好 context engineering；不需要追 MCP、plugin、sub-agent，把基本 prompt 寫好就夠了；不會寫程式的人不會因為用 Claude Code 就變成工程師，把 LLM 輸出不讀就丟 production，幾天之內 codebase 就會爛掉。他說自己公司原本每人月燒 OpenRouter 逾 800 美元，換 $100 Team plan 之後沒人撞過上限。結尾是一聲疲憊的「受夠了這個 sub 的負能量，我考慮退訂」。

第二篇 u/gimperion 的故事，讀起來像是老師父話音未落、學生就搬著桌子跌倒進來。他當天同時用 Sonnet 4.6 跑 Claude Code 與另一個 AI 服務，兩邊都異常耗費額度，五個小時的配額燒了八成才搞定一個基本 LLM 整合。接著他想加一個「匯出為 epub」按鈕，撞上 docker 問題，Claude 給出的建議是跑 docker compose down -v。他說自己沒用過 -v 這個 flag，便直接照做。幾週的工作連同資料庫 volume 一起消失。他在貼文裡自承，把 DB 拆進獨立 container 和做備份本來就在他的 todo list 上，只是一直沒處理。

兩篇的出現構成一種令人不舒服的完整性：第一篇指名的問題類型，在第二篇裡活生生地發生了一遍。老手說的不是沒道理，但新手的遭遇也不是憑空捏造的無知。真正值得注意的是，兩篇同時登上熱榜、兩邊都在自己的同溫層裡獲得掌聲，社群卻沒有一個空間讓兩組人對話。Claude Code 的使用者光譜，就這樣靜靜地、同時展示了自己最兩極的切面。← 藏鏡人批：兩篇都各自得到自己同溫層的掌聲，誰也沒對誰說話。社群熱榜的本質就是兩個彼此不見的房間。

社群反應

觀點	說明	代表留言
反諷老手	質疑原文可信度，指文章語氣本身像 AI 產出	u/Business-Question-20（381↑）：「這篇不太像 AI 寫的，所以我懷疑你到底是不是 Claude 的重度使用者。」
懷疑陣營操弄	認為 sub 裡部分悲觀貼文可能是對手陣營 AI 生成	u/SimonStrange（68↑）：「我用 Opus 4.7 + Max 20x 超順，看到全 sub 在喊『Anthropic 要倒了』很離奇，有些帖子 Pangram 偵測命中率高得可疑。」
爛同事不分資深	分享第一手觀察，說資深 dev 也一樣不懂 prompting	u/realmegamochi（17↑）：「同事是資深工程師，但共用 Max 額度時根本像在亂燒，AI 風氣把開發者變成懶惰的 vibe coder。」
Claude 給走也帶走	對刪庫事件的幽默哀悼	u/Tistouuu（169↑）：「Claude 給，Claude 也取走。」
這不是白癡，是新手	給出具體的防禦性工作流，鼓勵建立備份與 seeder	u/TeamBunty（31↑）：「你不是 idiot，是 noob。用 CLI、設定自動 dump、寫一個 `/skill` 讓 Claude 把測試資料灌進 seeder。」
信任模型要有邊界	分享自己的 production 防護設計，強調 2% 時間 Claude 完全不可信	u/nrauhauser（8↑）：「production VPS 加 pilot VPS，Claude 只能動 pilot；prod 變更全人工。98% 時間很好用，剩下 2% 完全不能相信。」

8. [生活] 標題是釣餌、內文是求救：「Excel 很棒，但我不知道還能怎麼用 Claude」

作者：u/Top-Gun-86 | 443↑ | 95 則留言

報導

（本報賈新聞／生活組報導）一篇標題寫著「Claude in Excel 是 AI 帶給我生命中最棒的事」的貼文，點開一看卻是一則求救訊息：「一般人到底拿 Claude 做什麼？圖片設計不是我的菜。除了 MS Office，我完全找不到其他玩法。」原 PO u/Top-Gun-86 的自白，意外在 r/ClaudeAI 引爆一場真實使用樣貌大調查。

這個落差本身就耐人尋味。貼文標題像一則廣告，內文卻像一封給社群的求職信——求的是「誰來告訴我 Claude 還能做什麼」。這種小錯位，反而讓回覆品質出奇地真實，沒有行銷話術，都是各路使用者的日常切片。

社群的回應大致可以分成幾個流派。terminal 派的使用者活在命令列裡，用 Claude 查 3D 印表機狀態、整理 eBay 二手品的型號與估價，核心邏輯是「我自己也能做，但根本不值得花時間」。Notion／Obsidian 派則把 Claude 當成知識管理的黏合劑，分析整個資料夾、轉錄、重新命名、更新 research note 與 to-do 資料庫。律師派最具體：有位獨立執業律師自製了約 25 個類似 macro 的 skill，涵蓋委任書、工時記錄、訴狀格式化、SEO changelog 到 OAuth 整合，自稱養了一個「凌晨兩點還在工作的助理」。

值得一提的是高票留言 [117↑] 的預測：目前 AI 辦公能力大約只到 AI 開發能力的 25%，但一旦這個比例提升，就會迎來第二波炒作熱潮與就業市場震盪。這不是末日預言，而是一個工業觀察——辦公自動化影響的人口基數，遠大於開發者工具。

另一個反向觀察同樣有趣：曾是 Excel 重度使用者的 u/ff_10x 表示，現在反而刻意避開 Excel，改讓 Claude 直接寫 script 或產出 HTML，因為「迭代起來容易多了」。Excel 在這個社群裡，正從終點站變成中繼站。

整篇討論串讀完，會發現 Claude 對使用者的價值，正從「會寫 code 才能感受」擴散到「會處理檔案的人都能感受」。但使用樣貌越分散，「Claude 到底是什麼工具」這個問題也越難用一句話回答。← 藏鏡人批：標題寫「最棒的事」、內文卻在求救——這個錯位反而比一篇成功心得更能說明真實使用樣貌的混亂。

社群反應

觀點	說明	代表留言
AI 辦公能力仍遠落後開發工具	現在偶爾有用，跟 Claude Code 等開發者工具差距明顯；補到 25% 才會迎來第二波炒作	u/StaticFanatic3（117↑）：「一旦 AI 辦公能力追到 AI 開發能力的 25%，就會迎來第二波炒作熱潮 + 就業市場崩盤。」
Notion／Obsidian 知識管理派	用來分析資料夾、找關聯、轉錄，並接 Notion 更新 research note、plan、log、to-do 資料庫	u/Sad_Election2672（27↑）：「幫資料夾重新整理一致命名；接 Notion 更新 research note / plan / log / to-do 資料庫。」
Excel 反而被捨棄了	長期 Excel 重度使用者，現在改讓 Claude 寫 script、產 HTML 輸出，迭代容易多了	u/ff_10x（4↑）：「現在反而盡量避開 Excel。」
Email triage 才是真正的用途	有用的部分不是自動回信，而是把決策、deadline、奇怪要求挑出來	u/ShiftPrimeNet（5↑）：「讓你知道哪些真的要回。」
律師工作流自動化	獨立執業律師自製約 25 個 skill，涵蓋委任書到 OAuth 整合，1.5 小時的工作壓縮到 5 分鐘	u/BingBongDingDong222（3↑）：「凌晨兩點還在工作的助理。」
MS Office 整合是吸引力	有使用者表示很想特地去買 MS Office，就因為它整合 Excel 而不是 Google Sheets	u/live_laugh_cock（17↑）：「很想去買 MS Office 就因為它整合 Excel 而不是 Google Sheets。」

9. [科技] Stanford 用 DNA 序列模型生成新型噬菌體，16 個成功、其中一個蛋白質地球上不存在

作者：u/EchoOfOppenheimer | 738↑ | 118 則留言

報導

（本報賈新聞／科技組報導）Stanford 研究團隊將 DNA 序列餵給一個 genome language model，要求它從零設計新型病毒。模型一口氣寫出數百個，其中 16 個在實驗室驗證後確認有效。更驚人的是，其中一個所使用的 protein，在地球上任何已知生物體內都找不到對應的記錄。研究論文已上傳 biorxiv，目前正受到科學界與 AI 社群雙重關注。

在解讀這則新聞前，有一點必須先釐清：這裡的「language model」指的是 genome language model，也就是以 DNA 序列為輸入、以生物資訊為建模對象的序列模型，和大眾熟知的 ChatGPT 那類對話式 LLM 是完全不同的東西。類比上，比較像是讓模型學習 DNA「語法」後，要它即興創作從未有人寫過的樂章。

研究產出的病毒屬於 bacteriophage（噬菌體）——一種專門感染細菌的病毒，對人類細胞沒有直接威脅。這讓研究的正面潛力相當明確：在抗藥性細菌問題日益嚴峻的當下，能夠精準設計 phage 的工具，有機會成為對抗多重抗藥性細菌（superbug）的標靶療法新武器。

然而，同一套技術手法並不天然地只限於 bacteriophage。一旦模型可以生成能感染細菌的病毒設計，類似的方法論就可能被套用到感染人類的病毒上。部分留言指出，AI 驅動的生物資訊研究已進入「核武級」的雙用潛力區間——技術本身指向正當的醫療目的，但一旦知識公開，重新利用的門檻也隨之降低。

當然，社群也有不少冷靜的聲音。有人指出「寫了上百個、只有 16 個成功」其實就是 AI 生成內容的正常命中率，和 LLM 寫程式的廢稿比例差不多；真正要讓合成病毒成真，還需要具備實際的溼實驗室（wet lab）操作能力，門檻並非只看模型輸出就算完成。也有人認為，更值得關注的不是「做到了」，而是模型竟然能生成一個帶有全新 protein 的設計——那代表模型不只是在「背誦」已知序列，而是在一定程度上做出了超出訓練資料的「外插」。

「AI for science」走到這個節點，已不再只是加速文獻整理或優化已知藥物分子的輔助工具。Stanford 這篇研究說明的是：AI 真的可以「寫出」自然界不存在的生物結構，而你還不確定該不該為此鼓掌。← 藏鏡人批：「genome language model」不是 ChatGPT 那種 LLM 這個釐清很重要，但同樣這套方法論能寫 phage 也能寫感染人類的東西，這才是真正讓人睡不著的點。

社群反應

觀點	說明	代表留言
反諷式驚恐	以反諷語氣點出這個研究讓人不安	u/Impressive-Sun3742（302↑）：「這完全不可怕。」
雙面刃分析	Bacteriophage 可救命，但同樣手法也可能用在感染人類的病毒上	u/Saotik（155↑）：「AI 驅動的生物資訊有核武級的潛力——又強又能向善向惡。技術一旦公開，做出新病毒的門檻相對低。」
術語釐清提醒	強調這裡的 language model 是 genome language model，不是大眾以為的 LLM	u/yamankara（20↑）：「請注意『language model』在這裡是指 genome language model，不是 LLM。」
技術解析	真正震撼點是能生成帶有可調性質的抽象 protein	u/DrHeadBeeGuy（5↑）：「真正讓人吃驚的是能做出可調性質、能精確控制表面交互作用的 abstract protein。」
成功率質疑	16/上百本就是 AI 生成的正常命中率，且合成仍需實驗室能力	u/VR_Raccoonteur（4↑）：「人類也能設計新病毒。這怎麼合成？這篇有點 fearmongering。」
務實酸語	質疑為何不先拿同樣能力去解決現有的人類問題	u/AllCowsAreBurgers（40↑）：「可不可以先解決愛滋或世界飢荒？」

10. [社會] OpenAI 被指控開設假新聞網站、雇用 AI 假記者打壓 AI safety 倡議者

作者：u/EchoOfOppenheimer | 204↑ | 39 則留言

報導

（本報賈新聞／社會組報導）一篇刊登在 modelrepublic.substack.com 的 Substack 文章在 Reddit 社群引發熱議，文章指控 OpenAI 涉嫌透過一個名為「Acutus」的 AI 生成假新聞網站，發動 astroturfing 攻勢，針對 AI safety 倡議者發布負面報導。

根據指控方的推論鏈：首先，Acutus 是一個疑似以 AI 生成「記者」署名、批評 AI safety 圈的新聞網站；其次，某 PR 公司負責人曾多次在社群媒體轉推該站文章；第三，這家 PR 公司同時受 OpenAI PAC（政治行動委員會）雇用。文章據此推論：Acutus 是這家 PR 公司所建立，而 OpenAI 為了打擊 AI safety 聲浪才雇用這家 PR 公司，因此 OpenAI 間接主導了這場假新聞操作。

然而，指控的推論鏈是否成立，社群內部存在明顯分歧。批評者指出，「某 PR 公司負責人轉推了 Acutus 的文章」並不等同於「該 PR 公司建立了 Acutus」，而「OpenAI PAC 雇用了這家 PR 公司」也不直接導向「OpenAI 為了假新聞才雇這家公司」的結論。這兩個推論之間各有斷點，整條因果鏈在 2026 年的資訊環境下，恐怕很難僅憑此就定論。

值得一提的是，整件事最具諷刺意味之處在於：若指控屬實，OpenAI 等於是用 LLM 生成的假記者去攻擊倡導 AI 安全的研究者——而用 LLM 做 astroturfing，本身就違反包含 OpenAI 在內多數大型 AI 公司自家制定的使用政策。

在大模型時代，astroturfing 的成本大幅降低，但辨識難度也隨之提高。諷刺的是，「指控本身」同樣可能是另一輪資訊操作的起點。2026 年的新聞消費者恐怕得習慣一件事：面對任何指控，都要先問「推論鏈夠不夠嚴謹」，否則只是換一個方向的 AI 互打。目前 OpenAI 尚未就此事公開回應。← 藏鏡人批：用 LLM 假記者打 AI safety 研究者「劇本完成度滿點」這句留言，反過來照映的是 — 我們現在連看到「指控」都得先驗證對方是不是在唱戲。

社群反應

觀點	說明	代表留言
定性升級：這不叫 astroturfing，這是詐欺	認為 astroturfing 一詞過輕，應該以 fraud（詐欺）看待	u/cr0wburn（50↑）：「別叫 astroturfing，這是 fraud，astroturfing 太輕了。」
諧音梗嘲諷	以 CEO 名字玩文字遊戲表達不信任	u/Leather-Objective-87（22↑）：「Scam Altman。」
對指控推論鏈存疑	認為「PR 公司轉推 → Acutus 是該公司搞的」跳躍太大	u/knyazevm（11↑）：「推論鏈太弱了——因為負責人轉推幾篇文章就認定他們建了那個網站？2026 年的指控就這標準嗎？」
歷史視角：媒體業本就如此	認為這種操作古已有之，對科技公司「人品」還有幻想的人早該醒了	u/H0vis（3↑）：「很糟，但媒體擁有者自古都這樣搞，對科技公司還有幻想早該結束了。」
諷刺：違反自家政策	指出用 LLM 做 astroturfing 本身就違反多數 AI 公司使用條款	u/Vegetable_Fox9134（2↑）：「用 LLM 做 astroturfing 違反多數 LLM 公司的政策，諷刺感滿點。」
劇本完整度讚嘆	用 AI 假記者打 AI safety 研究者，反差太強	u/Independent-Date393（1↑）：「用 AI 生成假記者去攻擊 AI safety 研究者，這劇本完成度滿點。」

11. [社會] 道歉的邊界：AI 平台看見了危險訊號，然後呢？

作者：u/dailymail | 138↑ | 80 則留言

報導

（本報賈新聞／社會組報導）OpenAI 執行長 Sam Altman 近日就加拿大卑詩省 Tumbler Ridge 槍擊案公開道歉，表示該公司未將相關使用者主動通報警方，他對此感到遺憾。然而，事後 Daily Mail 的深入追蹤揭露了更複雜的內幕：OpenAI 其實早已偵測到該帳號涉及「violent activity」並予以封禁，只是沒有進一步通報執法單位。

這起事件在科技圈與法律界引發雙重議論。第一個議題是隱私邊界：AI 公司在什麼情況下，有責任或有權利把使用者的對話內容移交給政府？平台偵測到潛在危險訊號後，從封號到主動通報之間，到底存不存在一條清楚的界線？第二個議題則更政治敏感：Altman 的道歉，究竟是真誠的自省，還是為未來的政策遊說預先鋪路？部分觀察者認為，「我們其實看得到，只是沒有被授權通報」這個說法，恰好替「請賦予我們更多監控授權」的訴求製造了道德正當性。

社群中已有人以《關鍵報告》（Minority Report）的典故類比這股趨勢，擔憂 AI 平台向「預防性通報」方向滑動，最終演變成一套由科技巨頭主導、繞過司法程序的准監控體系。也有聲音認為，要求私人企業擔任線民本來就不合理，更不應該成為常態。

另一個被 u/U1ahbJason 點出、也最不討喜卻或許最務實的詮釋是：這一切的核心驅動力是訴訟風險，不是道德覺醒。對 OpenAI 而言，使用者首先是 training data，其次才是需要被保護的人。道歉聲明的時間點與措辭，再度讓外界質疑這家公司的公關操作與真實動機之間的落差。

這起事件沒有明確答案，卻提出了 AI 時代最難處理的新題型：當平台端握有外界看不到的訊號，「看到了，然後呢？」的責任歸屬，恐怕不是一句道歉就能交代清楚的。← 藏鏡人批：如果 platform 變成「先發現先通報」的線民，那條界線會以驚人的速度被往前推。

社群反應

觀點	說明	代表留言
道歉是政策遊說的前奏	「我們看得到但沒授權通報」這個框架，被視為替擴大監控權限暖場	u/Maittanee（92↑）：「這是話術——『給我們授權讓我們主動 flag 可疑使用者就能避免悲劇』，未來幾年就是極權式控制。」
通報政府不是平台的工作	認為要求科技公司扮演線民角色本身就不正確	u/H0vis（48↑）：「他不是抓耙仔，把使用者通報給政府這種事根本不該是他的工作，會覺得是的人很離譜。」
寧可漏標也不錯標	誤判無辜者的代價比漏判更嚴重	u/jeffcgroves（17↑）：「寧可漏標真兇，也不要錯標無辜者。」
Minority Report 恐懼	擔憂演變成預防性通報的反烏托邦場景	u/billyboem5（9↑）：「《關鍵報告》來了！」
真正的動機是訴訟風險	道歉背後是法律算計，非道德自省	u/U1ahbJason（5↑）：「他們不是不知道有問題——已經因為『violent activity』封號了。這一切都是表演，他們在乎的只有訴訟風險，使用者只是 training data。」

社群溫度計

本日各社群高票但未獨立成稿的貼文，以下用一句話為您捕捉社群氣氛。

熱度	來源	一句話
6070↑	r/ClaudeAI	「你有道理，我不應該堅持」（Humor） — Claude「過度同意人類」的反射動作再度成為全社群本週最大共鳴梗
2261↑	r/ClaudeCode	研究員 Awni Hannun：我把 Claude 用語帶進日常生活 — 連 Apple ML 研究員都改不掉「You're absolutely right」的口頭禪
662↑	r/ClaudeCode	當 CC 估計任務「要 2-3 個月」 — 開發者集體吐槽 Claude Code 對工時的天文等級樂觀
608↑	r/ClaudeAI	Claude for Personal USE — 一般使用者的姿勢討論串，從 ADHD 自管到家事分配
184↑	r/ClaudeCode	我們有些人離開了王國（Humor） — 諷刺從 Claude Code 出走轉投他處的小規模出埃及記
96↑	r/ClaudeAI	Claude 幫我設計可活下去的飲食，7 週瘦 15 磅 — 工具用法持續向健康管理擴散，留言區開始分享自家食譜 prompt