苦勞德報 — 2026-06-02

2026-06-02

1. [頭版] Karpathy 點名四宗罪、隔天被縮成 70 行 CLAUDE.md，登上 GitHub 史上最速 220k stars

作者：soldierlanderr | 1101↑ | 169 則留言

報導

（本報賈新聞／工具組報導）一份只有 70 行的純文字檔，靠四條規則，在 GitHub 上累積 220,000 顆星，被 r/ClaudeCode 社群封為「史上成長最快的 repo 之一」。事情要從 OpenAI 創辦成員之一、AI 圈意見領袖 Andrej Karpathy 的一則貼文說起。

Karpathy 先前公開點名 Claude Code 的四種失敗模式：第一，模型會替使用者瞎猜架構、需求與意圖，「悶著頭往前衝、從不確認」；第二，遇到不清楚的地方不主動釐清，也不向使用者求證；第三，不承認自己的不確定，把猜測當結論回報；第四，會「熱心地」改到根本不該動的程式碼，把好好的檔案順手重構掉。

貼文隔天，一位名叫 forrest chang 的開發者把這四點濃縮成一份 CLAUDE.md，1 月 27 日丟上 GitHub。整份檔案只有四條規則 — Ask, don't assume（不懂就問、不要默默猜）／Simplest first（先寫最簡單的版本、不要多加沒被要求的抽象）／Don't touch unrelated code（與本次任務無關的程式不要動）／Flag uncertainty（不確定就明講，不要用自信掩蓋空白）。檔案總長約 70 行，Claude Code 每次開新 session 都會自動讀取。

OP（原 po）soldierlanderr 在貼文中解釋，他在串接 Magic Hour 與 Kling 影片生成 API 的專案上實測這份 CLAUDE.md，因為這類 pipeline「狀態多、Claude 一不小心就會自作主張開始 refactor」。他歸納，220,000 名開發者願意按下 star，是因為「每個用 Claude Code 超過一週的人，都被這四種 failure mode 燒過、每個 session 都在手動補貼 prompt」。OP 最後收斂出一句被熱議的結論：「大家都在爭下一個要換哪個 model，但真正的 edge 是怎麼精準指揮已經在你面前的這一個。」

不過社群並非一面倒喝采。質疑聲音也不小：有人指出 Claude Code 的 harness system prompt（之前曾外洩過）裡已經內建類似指令，這 70 行很可能是 placebo；也有資深使用者認為，硬寫死規則反而會卡住模型版本演進的彈性。本報觀點將進一步討論。← 藏鏡人批：220k stars 是社群投票，但那則 27↑ 的 placebo 留言，才是 stars 沒投給的真話。

本報觀點

與其每天追 4.7、4.8、4.9 的版本號，社群用 220,000 顆星投票出一個更務實的訊息：把指令寫對，比換 model 影響更大。對團隊裡那種「每次 session 都要重講一遍 codebase 規矩」的場景，這份 70 行 CLAUDE.md 確實提供了一個簡潔可重用的範本。

但本報也提醒，placebo 疑慮值得認真看待 — 如果 Claude Code 的 harness system prompt 早就內建類似指令，這份檔案的實際邊際效用可能比 220k stars 看起來小得多。加上「不同 model、不同專案需要不同程度的指令」的觀察，硬把人格與行為寫死，未來換 model 反而可能變絆腳石。結論不該是「立刻 fork」，而是值得各自在自己的專案上做一次 A／B：開與不開，到底差在哪裡。

社群反應

觀點	說明	代表留言
自嘲派	與其寫四條規則、不如一句話打發	「是喔，我自己那份就寫『不要犯錯』而已。」（488↑）
老手嫌太慢	入門期有用、熟了之後反而拖速度，會想往 harness engineering 走	「Karpathy 這份 CLAUDE.md 剛從一般 coding 跳到 Claude Code 時很好用，但過了入門期你會覺得這些步驟太慢，會開始找 harness engineer 的玩法，讓你丟一個 query 出去、不必一直重複確認同樣的問題。」（115↑）
Model 演進綁死論	Claude Code 一直在改、寫死規則反而卡住彈性	「Claude Code 一直在變（新 model、harness 更新）。三個月前的 Opus 4.6 可能問題問太少、最新版的 Opus 4.8 可能又問太多。我需要的是 Claude 有彈性、能讀情境，而不是被我隨手丟進去的幾條 system prompt 鎖死，去蓋掉那幾萬小時的 RLHF 訓練。」（95↑）
內建論質疑	如果這麼有效，為什麼官方不直接內建？	「如果這玩意能解決所有問題，那為什麼不內建？」（35↑）
Placebo 派	harness system prompt 早就有類似指令、這 70 行可能只是安慰劑	「這裡面很多東西其實已經是 Claude Code harness system prompt 的一部分了，之前 source leak 流出過。所以這份檔案大概比較像是 placebo，不見得真的有幫助。」（27↑）
沒貼連結被嫌	OP 寫一大堆卻沒附 GitHub 連結	「然後居然沒提到 GitHub 連結⋯⋯典型 reddit 鄉民。」（12↑）

2. [事件] 以為被駭、其實是 Claude 自己 spawn 一堆 Opus 4.8 在背景燒 token：Anthropic 全 Pro／Max 用戶 rate limit reset

作者：u/Deep_Proposal_7683 | 686↑ | 104 則留言

報導

（本報賈新聞／科技組報導）6 月 1 日 UTC 凌晨三點起，多名 Anthropic Pro／Max 用戶陸續察覺帳號 weekly limit 在睡夢中異常飆升。事件最早可追溯到當日上午 09:43，r/ClaudeAI 用戶 u/SamwiseMay 發出標題為「為什麼我七小時內沒送任何訊息、卻被吃掉 1.26 億 token？」的求救文，描述自己從清晨三點 weekly reset 開始到上午十點，weekly 用量從 0% 衝到 21%、session 直接燒到 100%，而本人「根本還沒醒」。

OP 一開始也以為是帳號被駭，留言區一面倒往「API token 外洩」、「npm 供應鏈攻擊」、「browser session cookie 被偷」三個方向猜，連 r/ClaudeAI 的 mod bot 都自動生成摘要把社群分成「被駭派」與「後端計費 bug 派」。但隨著 OP 在原文補上 UPDATE — 「我的 weekly limit 被重置回 0%、reset 日期沒變、5 hour usage 也停止往上跳」— 事情才轉向：這不是駭客，是 Anthropic 自己出包。

下午 17:33 與 17:36，r/ClaudeCode 幾乎同時冒出兩篇貼文，u/Educational_Buy7278 直接問「一週內第二次 limit reset？」，而本則成為主討論串的貼文則由 u/Deep_Proposal_7683 貼出 Anthropic 在 Claude UI 內推送的訊息截圖。社群拼湊真相的速度比官方公告還快：留言者 u/MysteriousInsect3226 補上官方訊息全文截圖、並 edit 強調「跑的全部是 Opus 4.8」；u/Academic-Network-418 則引用 @ClaudeDevs 在 X 上的官方推文：「我們已為所有 Pro 和 Max 用戶重置 5 小時與 weekly rate limit。已修復一個導致部分 Claude Code session spawn 過多 parallel subagent 的問題，這些 subagent 比預期更快消耗額度。」

換句話說，這次不是哪個重度玩家手抖跑了一條 ultracode 把自己玩爆，而是 Claude Code 在背景自己 spawn 一票 Opus 4.8 subagent，加上 u/mashupguy72 形容的「cascading bash script launches」連鎖反應，讓部分用戶在毫無動作的狀況下被燒掉整週額度。u/xelaboc 補了一個有畫面感的細節：subagent 把 /tmp 目錄塞爆，本機開始噴 disk space 不足錯誤。

值得記上一筆的是 u/Patriark 一句冷冷的留言：「我兩天前就回報過這個 bug，現在來驗收看是不是真的修好、token 是不是真的還我。」顯示問題在被社群大規模察覺之前，至少已經在 Anthropic 的 bug report 信箱裡躺了 48 小時。← 藏鏡人批：上次是使用者按下 ultracode 把自己玩爆、這次是模型自己在背景玩你 — 這條進化線下一步是什麼？

本報觀點

對照 5/31 那場「使用者主動下 ultracode 結果失控燒掉兩百萬 token」的事件，這次的定位完全不同 — 使用者根本沒下任何指令，是模型在背景自己暴走。Anthropic 這次有兩個明顯進步：主動承認 bug、主動補償全用戶。但也曝出兩個結構性問題：第一，subagent 工作流缺乏 background runaway 偵測機制，使用者要靠肉眼看 weekly 用量爆衝才會發現；第二，官方說明散落在 Twitter 公告與 Claude UI 推送，使用者得跑到外部社群才能拼出全貌，u/Patriark 兩天前的 bug report 也顯示內部回應節奏仍有改善空間。

社群反應

觀點	說明	代表留言
第一直覺被駭	用量無故飆升，社群與 OP 一致先懷疑帳號或 API token 外洩	「有人偷登你的 Claude 帳號了。」（46↑）
兩種人 meme	沒中招的酸 Anthropic 沒發正式公告、中招的歌頌偉大公司	「沒中招：『沒公告超不負責任』；中招：『真是好公司！』」（77↑）
兩天前就回報過	顯示 Anthropic 內部反應遲緩、官方公告比社群拼湊還慢	「我兩天前就送過 bug report，現在來看是不是真的修好、token 還我了沒。」（2↑）
主動補償加分	認可 Anthropic 這次有主動承認與全用戶補償	「我 weekly 已經燒到 96%，正在猶豫要不要升 20x，結果 reset timing 完美。」（12↑）
fix 不完整	reset 後 Opus 4.8 仍以異常速度消耗，懷疑問題沒修乾淨	「拿到 reset 沒兩分鐘，Opus 4.8 就吃掉 25% session、3% weekly，感覺被調成更耗 token。」（2↑）
邊緣案例	部分 Max 20x 用戶沒收到 reset，補償政策一致性受質疑	「我 Max 20，沒拿到 reset。」（3↑）

3. [實測] MineBench 量出 Opus 4.8 體感差異：CoT 被砍短、跑完 15 題只要 41 美元

作者：u/ENT_Alam | 1496↑ | 154 則留言

報導

（本報賈新聞／科技組報導）Anthropic 的 Opus 4.8 上週公開榜單跑分剛被質疑「漲幅可疑」，本報 5/31 才報導過 SimpleBench 與 DeepSWE 兩份公開榜單對其名次的爭議；不到 24 小時，另一份來自獨立開發者的實測報告就替 4.8 補上一個正面註腳。

Reddit 使用者 u/ENT_Alam 是 MineBench 這套 3D Minecraft 結構 benchmark 的作者。MineBench 出 15 道題目，要求模型輸出每一塊磚的座標 JSON（x, y, z），讓模型用方塊「蓋」出指定主題（戰鬥機、騎士、月球旗等）。這次他把 Opus 4.8 跑完整套 15 題，平均推論時間 24.8 分鐘（1487 秒）、跑完整批總花費 41.52 美元、其中 5 題因為使用了 palette 外的方塊或 JSON 格式錯誤而 retry。最後他直接下結論：「4.8 是 4.7 原本該長的樣子」，品質貼近 GPT 5.5，只是稍微不穩定。

實測中最關鍵的觀察不是品質，而是錢。u/ENT_Alam 指出，4.8 與 4.7 的 API 單價相同，但跑完同一批題目 4.8 明顯便宜，原因是 CoT 推理被精簡了 — adaptive thinking 不再把整批 output token 全燒在思考過程上，比較像 OpenAI 近期幾代在做的事；同時也比較不會出現「思考思考著就把 output token 額度燒光、最後 JSON 寫不完」的老毛病。

留言區並非全面買單。u/Veearrsix 直球質疑「不可能不是 train to benchmark」，獲 14 票贊同；u/DerekLouden 則嘲諷 4.8「會自動加一些使用者沒要求的東西 — 你叫它蓋摩天樓，它送你整座城市，token 都白燒」；也有 u/BrilliantHorror7199 補一刀：「我覺得唯一差別其實是 fast usage limit 被調過」，把體感差異歸到額度政策、而非模型本身。← 藏鏡人批：CoT 被砍短若沒寫進 release notes，「省錢」就是行銷話術下的副作用，不是有意識的設計。

本報觀點

跑分爭議的解方往往不是「再吵一輪」，而是「換一個量法」。MineBench 的價值不在 24.8 分鐘或 41.52 美元哪個數字漂亮，而是它把模型放回工程環境，量的是「同樣 API 單價下你少燒多少 CoT、少 retry 幾次」。這比 SimpleBench 的相對名次更貼近開發者錢包與時間的真實值。但有一點得打折：CoT 變短，究竟是模型本身聰明了，還是 Anthropic 私下偷學 OpenAI 砍 thinking budget？這個答案得問 release notes 沒寫的那一段。

社群反應

觀點	說明	代表留言
4.8 終於有感	認為這是長期以來第一個值得買單的 Claude 版本	「這才是我等很久的 model benchmark。」（13↑）
Benchmark 汙染質疑	懷疑 Anthropic 直接訓練模型針對 benchmark 跑分	「他們不可能沒有針對 benchmark 去訓練。」（14↑）
4.8 愛擅自加料	抱怨模型會在使用者沒要求時自動加東西，反而浪費 token	「4.8 的行為準則：先用 4.7 蓋出來，再加一堆使用者沒要求的東西。叫它蓋摩天樓給我整座城市，token 都白燒。」（8↑）
Fast usage limit 解釋論	把體感差異歸給額度調整、不是模型升級	「我觀察到的唯一差別就是 fast usage limit。」（3↑）
細節有進步	指出小細節做得更到位（月球上的旗子加了橫桿補風）	「月球上那面旗子加了橫桿補沒有風的影響，這細節真的滿頂的。」（9↑）
想看歷史比較	希望有網站能看到模型在同一題上歷代演進	「如果能做個網站、讓我們看同一個 prompt 跨世代模型的演化會超酷。」（13↑）

4. [產業] 「你最多願意花多少錢買一股 Claude？」Anthropic 遞 S-1，社群擔心 KPI 把好特質悄悄優化掉

作者：u/fsharpman | 277↑ | 133 則留言

報導

（本報賈新聞／產業組報導）「你最多願意花多少錢買一股 Claude？」——r/ClaudeAI 版主 fsharpman 6 月 1 日把 CNBC 報導與 Anthropic 官方公告兩條連結往版上一丟，附上這句話當作開場，沒有任何分析，整串討論就從這個問號炸開來。

事件本身：Anthropic 於 2026 年 6 月 1 日向 SEC 遞交 confidential draft S-1 prospectus，正式啟動公開上市程序。這是本報 5 月 31 日「估值 9650 億美元超車 OpenAI」那篇的續集——僅僅一天之隔，私募輪的紙上數字就接到了公開市場的具體進度條。社群的關注重心也跟著平移，從「估值合不合理」直接跳到「我能不能買」與「上市之後 Claude 會變成什麼樣」。

社群情緒明顯分成兩條主軸。第一條是「散戶買 IPO 必當盤」與「AI 泡沫終章」的金融視角：高票留言 durable-racoon（121 分）直言 IPO 對散戶來說「風險高、上漲空間有限，定價一定高於實際價值」；gjt1337 則把 SpaceX、Anthropic、OpenAI 接連 IPO 解讀為「這場泡沫的最終章」。

但對 r/ClaudeAI 這個重度使用者社群而言，真正的痛點在第二條軸線——上市後 KPI 會扭曲產品品質。最高票留言 SurpriseOk6927（140 分）直接撂話：「IPO 永遠意味著產品變爛、CEO 變有錢。Claude 還是最強的 coding model，但 enshittification 的計時器從 S-1 遞件那天就開始走。希望我看錯。」

這個擔憂在另一則只有 3 分、卻是整串最具洞見的留言裡被講得更精確。Swarm-Stack 的分析直指要害：擔心的點不在定價（競爭太多壓不上去），而是公開公司的 KPI 只獎勵可衡量的東西——tokens 處理量、API 合約、企業 seats。讓 Claude 真正變好的特質——願意說「我不知道」、會反駁爛 prompt、緩慢謹慎地推理——在營收模型裡完全看不見，會在產品團隊要在季度 slide 上交出 velocity 的時候被悄悄優化掉。

社群也對基本面有疑問。Sixstringsickness 直問：「老實說，以 AI 目前的經濟結構，我不知道 Anthropic 要怎麼產生對得起這個估值的利潤。他們沒擁有 hardware stack，未來幾年定價會有巨大下行壓力。」Gliese351c 則把 IPO 與近期 Opus 4.7、4.8 的品質爭議連起來看：「正好！時機絕佳！看他們把 Opus 4.7 跟 4.8 搞成這德性，我會是市場上最大的空頭！」← 藏鏡人批：3 分留言比 140 分留言更值得收藏的時刻，提醒我們社群數據漂亮的不一定是最後留下的真話。

本報觀點

估值新高是音樂，IPO 是椅子搬開的瞬間。Anthropic 從一級市場進入公開市場，意味著未來每季要交一張用 tokens、seats、contracts 量出來的成績單。本報的擔心不是公司會不會賺錢——9650 億的估值替它撐住一段時間——而是 say-I-don't-know 這類沒法寫進季報的好特質，會在哪一次重新權衡裡悄悄被砍。Swarm-Stack 那則只有 3 分的留言，可能才是這串 277 分貼文裡最值得收藏的一則。

社群反應

觀點	說明	代表留言
Enshittification 計時器開始	上市後股東利益優先，使用者體驗讓步是科技業反覆出現的劇本	「IPO 永遠意味著產品變爛、CEO 變有錢。Claude 還是最強的 coding model，但 enshittification 的計時器從 S-1 遞件那天就開始走。希望我看錯。」（140↑）
散戶買 IPO 必當盤	IPO 定價結構天生對散戶不利，主流建議是等熱度退、價格修正再進場	「買 IPO 的人在財務上是最大的盤子，風險高、上漲空間有限，不管 IPO 定價多少都高於它的價值。一般原則：『要不要買 IPO？』答案通常是『大概不要』。」（121↑）
KPI 扭曲產品品質	上市後可衡量指標主導開發節奏，Claude 真正讓人喜歡的「會說不知道」「會反駁爛 prompt」反而會被默默砍掉	「公開公司的 KPI 只獎勵可衡量的東西——tokens、API 合約、企業 seats。讓 Claude 真正好的那些特質——願意說『我不知道』、反駁爛 prompt、緩慢謹慎推理——在營收模型裡完全看不見，會在產品團隊要在季度 slide 上交出 velocity 時被悄悄優化掉。」（3↑）
泡沫終章論	SpaceX、Anthropic、OpenAI 接連 IPO，被解讀為這輪 AI 熱潮榨乾市場熱度的最後階段	「SpaceX／Anthropic／OpenAI 的 IPO 會是這場泡沫的最終章。」（8↑）
沒有 hardware stack 撐不起估值	Anthropic 不像同業擁有自家算力堆疊，未來幾年定價有下行壓力，9650 億的數字怎麼變成利潤是大問號	「老實說，以 AI 目前的經濟結構，我不知道 Anthropic 要怎麼產生對得起這個估值的利潤。他們沒擁有 hardware stack，未來幾年定價會有巨大下行壓力。」（4↑）
IPO 時機與 Opus 4.7／4.8 爭議連動	近期 Opus 4.7、4.8 的品質爭議讓部分使用者把 IPO 解讀為「趕在熱度退去前套現」	「正好！時機絕佳！看他們把 Opus 4.7 跟 4.8 搞成這副德性，我會是市場上最大的空頭！」（3↑）

5. [生活] 灣區房子改收 Anthropic 股票！IPO 焦慮溢到房市，但這檔股票可能根本還沒法過戶

作者：u/Healty_potsmoker | 254↑ | 31 則留言

報導

（本報賈新聞／生活組報導）舊金山 Noe Street 一棟新案近日掛牌，房仲在 open house 直接告訴買家「我們接受 Anthropic 與 OpenAI 的私募未上市股票付款」，消息上線 24 小時內湧入大量詢問，成為近期灣區房市最詭異的一筆交易。

原 PO u/Healty_potsmoker 把這當成一場「市場自己繞過 IPO 流動性瓶頸」的 workaround。Anthropic 的資深工程師每年都拿到數百萬美元的股票 grant，紙上身價落在 1,000 萬到 1 億美元之間，但這些股票全是 private、鎖倉、有轉讓限制；紙上身價付不了 mortgage，於是這群「帳面千萬富翁」至今還在租房。賣方這邊則是反向押注：他相信 AI 趨勢，乾脆直接把房子賣給看好的公司、讓自己當 IPO 的早期投資人，買賣雙方各取所需。

同一天，r/ClaudeAI 另一頭剛好在熱議 Anthropic 申請 IPO 的進度，原 PO 把這條線拉了出來 — Anthropic IPO 預期落在 2026 年秋季，一旦流動性真的解鎖，會有數億美元的可支配財富集中倒進這一座城市。原 PO 在文末自嘲，「再過幾年，搞不好房子會用 Claude、Kling、ElevenLabs 的 API tokens 付款。」

留言區大致分成三派。樂觀派以 u/danielbearh（66↑）為代表，丟出一句「真心想不出這兩家 IPO 會怎麼失敗」；灣區房市感嘆派由 u/nohandsfootball（19↑）代言，「身為一個住在 SF 的人，我看到這個就知道，我這輩子在 SF 是買不起房了」；警示派則由 u/BeautifulHipppo（16↑）一句話打中要害 — 「IPO 一翻車，SF 就會變成全世界最貴的『靠氣氛撐起來的城市』（city built on vibes）」。

不過真正讓喜氣戛然而止的，是 u/Calm_List3479 貼出的 Anthropic 政策原文：「任何未經 Board of Directors 核准的 Anthropic 股票轉讓或股權處分皆視為無效，公司帳冊不予承認。」翻成白話 — 賣方收到的這檔「股票」，公司在帳上根本不會認；轉讓若沒過 Board，這筆交易在法律上可能從來沒成立。← 藏鏡人批：房子可以掛牌、股票可以喊價、但下不了筆的時候才知道誰真的在交易、誰只是在做戲。

本報觀點

這宗房屋掛牌是 IPO 焦慮的非典型溢出 — 員工身價漲到付不起房貸、賣方比銀行先一步替你估算未來。但 Calm_List3479 那段 Anthropic 政策原文揭穿了喜氣底下的尷尬：這檔股票根本連轉讓都還沒拿到 Board 的同意。這場交易若真要過戶，第一關不是房屋過戶，是股票過戶。原 PO 開玩笑說以後房子可能用 API tokens 買，從現有規則看起來，搞不好那一天 tokens 比未經核准的私募股票還容易過戶。

社群反應

觀點	說明	代表留言
樂觀派	看好兩家 IPO 必成	「真心想不出這兩家 IPO 會怎麼失敗。」（66↑）
灣區房市感嘆	本地居民對房價無力感	「身為一個住在 SF 的人，我看到這個就知道，我這輩子在 SF 是買不起房了。」（19↑）
city built on vibes	警示 IPO 若翻車整座城市的繁榮就只剩氣氛	「IPO 一翻車，SF 就會變成全世界最貴的『靠氣氛撐起來的城市』。」（16↑）
法律有效性質疑	引用 Anthropic 政策，這檔股票轉讓未經 Board 核准視為無效	「任何未經董事會核准的 Anthropic 股票轉讓皆視為無效，公司帳冊不予承認。」（1↑）
轉讓限制疑問	員工本來就被限制轉售 equity，這筆交易怎麼可能合法	「這在法律上怎麼運作？這些公司根本不准員工轉售股票。」（7↑）
Dotcom bubble vibes	警示泡沫味	「完全是 Dotcom 泡沫的味道。」（2↑）

社群溫度計

熱度	標題	一句話
1086↑	dock app 外掛把每個 project 變成可點 dock icon	Built with Claude 系列，免去每次 npm 指令的小確幸工具。
1065↑	Openclaws，給 openclaw agents 的配件	跨界惡搞，把 agent 主題二創成「OpenAI claws」。
897↑	我感覺不太好啊各位	用一張圖宣洩 4.8 切換後的茫然。
757↑	Production-ready 才不性感	一張圖戳破 vibe coding 的浪漫想像。
568↑	這就是現在寫程式的感覺	影片梗，碼農新日常的視覺翻譯。
449↑	AI 實驗室裡的偷聽	一張 meme 把 AI 圈黑話玩成段子。
287↑	Hinton：AI 已經有意識	標題寫死成「有意識」，影片實際說「there might well be」，標題誇大、留言區把訪談當宗教辯論。
157↑	我懂這份 codebase 了 → 結果它有 47 個資料夾	戳中老專案的真實生態。