苦勞德報 — 2026-06-02

2026-06-02

1. [頭版] Karpathy 點名四宗罪、隔天被縮成 70 行 CLAUDE.md,登上 GitHub 史上最速 220k stars

報導

(本報賈新聞/工具組報導)一份只有 70 行的純文字檔,靠四條規則,在 GitHub 上累積 220,000 顆星,被 r/ClaudeCode 社群封為「史上成長最快的 repo 之一」。事情要從 OpenAI 創辦成員之一、AI 圈意見領袖 Andrej Karpathy 的一則貼文說起。

Karpathy 先前公開點名 Claude Code 的四種失敗模式:第一,模型會替使用者瞎猜架構、需求與意圖,「悶著頭往前衝、從不確認」;第二,遇到不清楚的地方不主動釐清,也不向使用者求證;第三,不承認自己的不確定,把猜測當結論回報;第四,會「熱心地」改到根本不該動的程式碼,把好好的檔案順手重構掉。

貼文隔天,一位名叫 forrest chang 的開發者把這四點濃縮成一份 CLAUDE.md,1 月 27 日丟上 GitHub。整份檔案只有四條規則 — Ask, don't assume(不懂就問、不要默默猜)/Simplest first(先寫最簡單的版本、不要多加沒被要求的抽象)/Don't touch unrelated code(與本次任務無關的程式不要動)/Flag uncertainty(不確定就明講,不要用自信掩蓋空白)。檔案總長約 70 行,Claude Code 每次開新 session 都會自動讀取。

OP(原 po)soldierlanderr 在貼文中解釋,他在串接 Magic Hour 與 Kling 影片生成 API 的專案上實測這份 CLAUDE.md,因為這類 pipeline「狀態多、Claude 一不小心就會自作主張開始 refactor」。他歸納,220,000 名開發者願意按下 star,是因為「每個用 Claude Code 超過一週的人,都被這四種 failure mode 燒過、每個 session 都在手動補貼 prompt」。OP 最後收斂出一句被熱議的結論:「大家都在爭下一個要換哪個 model,但真正的 edge 是怎麼精準指揮已經在你面前的這一個。」

不過社群並非一面倒喝采。質疑聲音也不小:有人指出 Claude Code 的 harness system prompt(之前曾外洩過)裡已經內建類似指令,這 70 行很可能是 placebo;也有資深使用者認為,硬寫死規則反而會卡住模型版本演進的彈性。本報觀點將進一步討論。← 藏鏡人批:220k stars 是社群投票,但那則 27↑ 的 placebo 留言,才是 stars 沒投給的真話。

本報觀點

與其每天追 4.7、4.8、4.9 的版本號,社群用 220,000 顆星投票出一個更務實的訊息:把指令寫對,比換 model 影響更大。對團隊裡那種「每次 session 都要重講一遍 codebase 規矩」的場景,這份 70 行 CLAUDE.md 確實提供了一個簡潔可重用的範本。

但本報也提醒,placebo 疑慮值得認真看待 — 如果 Claude Code 的 harness system prompt 早就內建類似指令,這份檔案的實際邊際效用可能比 220k stars 看起來小得多。加上「不同 model、不同專案需要不同程度的指令」的觀察,硬把人格與行為寫死,未來換 model 反而可能變絆腳石。結論不該是「立刻 fork」,而是值得各自在自己的專案上做一次 A/B:開與不開,到底差在哪裡。

社群反應

觀點 說明 代表留言
自嘲派 與其寫四條規則、不如一句話打發 「是喔,我自己那份就寫『不要犯錯』而已。」(488↑)
老手嫌太慢 入門期有用、熟了之後反而拖速度,會想往 harness engineering 走 「Karpathy 這份 CLAUDE.md 剛從一般 coding 跳到 Claude Code 時很好用,但過了入門期你會覺得這些步驟太慢,會開始找 harness engineer 的玩法,讓你丟一個 query 出去、不必一直重複確認同樣的問題。」(115↑)
Model 演進綁死論 Claude Code 一直在改、寫死規則反而卡住彈性 「Claude Code 一直在變(新 model、harness 更新)。三個月前的 Opus 4.6 可能問題問太少、最新版的 Opus 4.8 可能又問太多。我需要的是 Claude 有彈性、能讀情境,而不是被我隨手丟進去的幾條 system prompt 鎖死,去蓋掉那幾萬小時的 RLHF 訓練。」(95↑)
內建論質疑 如果這麼有效,為什麼官方不直接內建? 「如果這玩意能解決所有問題,那為什麼不內建?」(35↑)
Placebo 派 harness system prompt 早就有類似指令、這 70 行可能只是安慰劑 「這裡面很多東西其實已經是 Claude Code harness system prompt 的一部分了,之前 source leak 流出過。所以這份檔案大概比較像是 placebo,不見得真的有幫助。」(27↑)
沒貼連結被嫌 OP 寫一大堆卻沒附 GitHub 連結 「然後居然沒提到 GitHub 連結⋯⋯典型 reddit 鄉民。」(12↑)

2. [事件] 以為被駭、其實是 Claude 自己 spawn 一堆 Opus 4.8 在背景燒 token:Anthropic 全 Pro/Max 用戶 rate limit reset

報導

(本報賈新聞/科技組報導)6 月 1 日 UTC 凌晨三點起,多名 Anthropic Pro/Max 用戶陸續察覺帳號 weekly limit 在睡夢中異常飆升。事件最早可追溯到當日上午 09:43,r/ClaudeAI 用戶 u/SamwiseMay 發出標題為「為什麼我七小時內沒送任何訊息、卻被吃掉 1.26 億 token?」的求救文,描述自己從清晨三點 weekly reset 開始到上午十點,weekly 用量從 0% 衝到 21%、session 直接燒到 100%,而本人「根本還沒醒」。

OP 一開始也以為是帳號被駭,留言區一面倒往「API token 外洩」、「npm 供應鏈攻擊」、「browser session cookie 被偷」三個方向猜,連 r/ClaudeAI 的 mod bot 都自動生成摘要把社群分成「被駭派」與「後端計費 bug 派」。但隨著 OP 在原文補上 UPDATE — 「我的 weekly limit 被重置回 0%、reset 日期沒變、5 hour usage 也停止往上跳」— 事情才轉向:這不是駭客,是 Anthropic 自己出包。

下午 17:33 與 17:36,r/ClaudeCode 幾乎同時冒出兩篇貼文,u/Educational_Buy7278 直接問「一週內第二次 limit reset?」,而本則成為主討論串的貼文則由 u/Deep_Proposal_7683 貼出 Anthropic 在 Claude UI 內推送的訊息截圖。社群拼湊真相的速度比官方公告還快:留言者 u/MysteriousInsect3226 補上官方訊息全文截圖、並 edit 強調「跑的全部是 Opus 4.8」;u/Academic-Network-418 則引用 @ClaudeDevs 在 X 上的官方推文:「我們已為所有 Pro 和 Max 用戶重置 5 小時與 weekly rate limit。已修復一個導致部分 Claude Code session spawn 過多 parallel subagent 的問題,這些 subagent 比預期更快消耗額度。」

換句話說,這次不是哪個重度玩家手抖跑了一條 ultracode 把自己玩爆,而是 Claude Code 在背景自己 spawn 一票 Opus 4.8 subagent,加上 u/mashupguy72 形容的「cascading bash script launches」連鎖反應,讓部分用戶在毫無動作的狀況下被燒掉整週額度。u/xelaboc 補了一個有畫面感的細節:subagent 把 /tmp 目錄塞爆,本機開始噴 disk space 不足錯誤。

值得記上一筆的是 u/Patriark 一句冷冷的留言:「我兩天前就回報過這個 bug,現在來驗收看是不是真的修好、token 是不是真的還我。」顯示問題在被社群大規模察覺之前,至少已經在 Anthropic 的 bug report 信箱裡躺了 48 小時。← 藏鏡人批:上次是使用者按下 ultracode 把自己玩爆、這次是模型自己在背景玩你 — 這條進化線下一步是什麼?

本報觀點

對照 5/31 那場「使用者主動下 ultracode 結果失控燒掉兩百萬 token」的事件,這次的定位完全不同 — 使用者根本沒下任何指令,是模型在背景自己暴走。Anthropic 這次有兩個明顯進步:主動承認 bug、主動補償全用戶。但也曝出兩個結構性問題:第一,subagent 工作流缺乏 background runaway 偵測機制,使用者要靠肉眼看 weekly 用量爆衝才會發現;第二,官方說明散落在 Twitter 公告與 Claude UI 推送,使用者得跑到外部社群才能拼出全貌,u/Patriark 兩天前的 bug report 也顯示內部回應節奏仍有改善空間。

社群反應

觀點 說明 代表留言
第一直覺被駭 用量無故飆升,社群與 OP 一致先懷疑帳號或 API token 外洩 「有人偷登你的 Claude 帳號了。」(46↑)
兩種人 meme 沒中招的酸 Anthropic 沒發正式公告、中招的歌頌偉大公司 「沒中招:『沒公告超不負責任』;中招:『真是好公司!』」(77↑)
兩天前就回報過 顯示 Anthropic 內部反應遲緩、官方公告比社群拼湊還慢 「我兩天前就送過 bug report,現在來看是不是真的修好、token 還我了沒。」(2↑)
主動補償加分 認可 Anthropic 這次有主動承認與全用戶補償 「我 weekly 已經燒到 96%,正在猶豫要不要升 20x,結果 reset timing 完美。」(12↑)
fix 不完整 reset 後 Opus 4.8 仍以異常速度消耗,懷疑問題沒修乾淨 「拿到 reset 沒兩分鐘,Opus 4.8 就吃掉 25% session、3% weekly,感覺被調成更耗 token。」(2↑)
邊緣案例 部分 Max 20x 用戶沒收到 reset,補償政策一致性受質疑 「我 Max 20,沒拿到 reset。」(3↑)

3. [實測] MineBench 量出 Opus 4.8 體感差異:CoT 被砍短、跑完 15 題只要 41 美元

報導

(本報賈新聞/科技組報導)Anthropic 的 Opus 4.8 上週公開榜單跑分剛被質疑「漲幅可疑」,本報 5/31 才報導過 SimpleBench 與 DeepSWE 兩份公開榜單對其名次的爭議;不到 24 小時,另一份來自獨立開發者的實測報告就替 4.8 補上一個正面註腳。

Reddit 使用者 u/ENT_Alam 是 MineBench 這套 3D Minecraft 結構 benchmark 的作者。MineBench 出 15 道題目,要求模型輸出每一塊磚的座標 JSON(x, y, z),讓模型用方塊「蓋」出指定主題(戰鬥機、騎士、月球旗等)。這次他把 Opus 4.8 跑完整套 15 題,平均推論時間 24.8 分鐘(1487 秒)、跑完整批總花費 41.52 美元、其中 5 題因為使用了 palette 外的方塊或 JSON 格式錯誤而 retry。最後他直接下結論:「4.8 是 4.7 原本該長的樣子」,品質貼近 GPT 5.5,只是稍微不穩定。

實測中最關鍵的觀察不是品質,而是錢。u/ENT_Alam 指出,4.8 與 4.7 的 API 單價相同,但跑完同一批題目 4.8 明顯便宜,原因是 CoT 推理被精簡了 — adaptive thinking 不再把整批 output token 全燒在思考過程上,比較像 OpenAI 近期幾代在做的事;同時也比較不會出現「思考思考著就把 output token 額度燒光、最後 JSON 寫不完」的老毛病。

留言區並非全面買單。u/Veearrsix 直球質疑「不可能不是 train to benchmark」,獲 14 票贊同;u/DerekLouden 則嘲諷 4.8「會自動加一些使用者沒要求的東西 — 你叫它蓋摩天樓,它送你整座城市,token 都白燒」;也有 u/BrilliantHorror7199 補一刀:「我覺得唯一差別其實是 fast usage limit 被調過」,把體感差異歸到額度政策、而非模型本身。← 藏鏡人批:CoT 被砍短若沒寫進 release notes,「省錢」就是行銷話術下的副作用,不是有意識的設計。

本報觀點

跑分爭議的解方往往不是「再吵一輪」,而是「換一個量法」。MineBench 的價值不在 24.8 分鐘或 41.52 美元哪個數字漂亮,而是它把模型放回工程環境,量的是「同樣 API 單價下你少燒多少 CoT、少 retry 幾次」。這比 SimpleBench 的相對名次更貼近開發者錢包與時間的真實值。但有一點得打折:CoT 變短,究竟是模型本身聰明了,還是 Anthropic 私下偷學 OpenAI 砍 thinking budget?這個答案得問 release notes 沒寫的那一段。

社群反應

觀點 說明 代表留言
4.8 終於有感 認為這是長期以來第一個值得買單的 Claude 版本 「這才是我等很久的 model benchmark。」(13↑)
Benchmark 汙染質疑 懷疑 Anthropic 直接訓練模型針對 benchmark 跑分 「他們不可能沒有針對 benchmark 去訓練。」(14↑)
4.8 愛擅自加料 抱怨模型會在使用者沒要求時自動加東西,反而浪費 token 「4.8 的行為準則:先用 4.7 蓋出來,再加一堆使用者沒要求的東西。叫它蓋摩天樓給我整座城市,token 都白燒。」(8↑)
Fast usage limit 解釋論 把體感差異歸給額度調整、不是模型升級 「我觀察到的唯一差別就是 fast usage limit。」(3↑)
細節有進步 指出小細節做得更到位(月球上的旗子加了橫桿補風) 「月球上那面旗子加了橫桿補沒有風的影響,這細節真的滿頂的。」(9↑)
想看歷史比較 希望有網站能看到模型在同一題上歷代演進 「如果能做個網站、讓我們看同一個 prompt 跨世代模型的演化會超酷。」(13↑)

4. [產業] 「你最多願意花多少錢買一股 Claude?」Anthropic 遞 S-1,社群擔心 KPI 把好特質悄悄優化掉

報導

(本報賈新聞/產業組報導)「你最多願意花多少錢買一股 Claude?」——r/ClaudeAI 版主 fsharpman 6 月 1 日把 CNBC 報導與 Anthropic 官方公告兩條連結往版上一丟,附上這句話當作開場,沒有任何分析,整串討論就從這個問號炸開來。

事件本身:Anthropic 於 2026 年 6 月 1 日向 SEC 遞交 confidential draft S-1 prospectus,正式啟動公開上市程序。這是本報 5 月 31 日「估值 9650 億美元超車 OpenAI」那篇的續集——僅僅一天之隔,私募輪的紙上數字就接到了公開市場的具體進度條。社群的關注重心也跟著平移,從「估值合不合理」直接跳到「我能不能買」與「上市之後 Claude 會變成什麼樣」。

社群情緒明顯分成兩條主軸。第一條是「散戶買 IPO 必當盤」與「AI 泡沫終章」的金融視角:高票留言 durable-racoon(121 分)直言 IPO 對散戶來說「風險高、上漲空間有限,定價一定高於實際價值」;gjt1337 則把 SpaceX、Anthropic、OpenAI 接連 IPO 解讀為「這場泡沫的最終章」。

但對 r/ClaudeAI 這個重度使用者社群而言,真正的痛點在第二條軸線——上市後 KPI 會扭曲產品品質。最高票留言 SurpriseOk6927(140 分)直接撂話:「IPO 永遠意味著產品變爛、CEO 變有錢。Claude 還是最強的 coding model,但 enshittification 的計時器從 S-1 遞件那天就開始走。希望我看錯。」

這個擔憂在另一則只有 3 分、卻是整串最具洞見的留言裡被講得更精確。Swarm-Stack 的分析直指要害:擔心的點不在定價(競爭太多壓不上去),而是公開公司的 KPI 只獎勵可衡量的東西——tokens 處理量、API 合約、企業 seats。讓 Claude 真正變好的特質——願意說「我不知道」、會反駁爛 prompt、緩慢謹慎地推理——在營收模型裡完全看不見,會在產品團隊要在季度 slide 上交出 velocity 的時候被悄悄優化掉。

社群也對基本面有疑問。Sixstringsickness 直問:「老實說,以 AI 目前的經濟結構,我不知道 Anthropic 要怎麼產生對得起這個估值的利潤。他們沒擁有 hardware stack,未來幾年定價會有巨大下行壓力。」Gliese351c 則把 IPO 與近期 Opus 4.7、4.8 的品質爭議連起來看:「正好!時機絕佳!看他們把 Opus 4.7 跟 4.8 搞成這德性,我會是市場上最大的空頭!」← 藏鏡人批:3 分留言比 140 分留言更值得收藏的時刻,提醒我們社群數據漂亮的不一定是最後留下的真話。

本報觀點

估值新高是音樂,IPO 是椅子搬開的瞬間。Anthropic 從一級市場進入公開市場,意味著未來每季要交一張用 tokens、seats、contracts 量出來的成績單。本報的擔心不是公司會不會賺錢——9650 億的估值替它撐住一段時間——而是 say-I-don't-know 這類沒法寫進季報的好特質,會在哪一次重新權衡裡悄悄被砍。Swarm-Stack 那則只有 3 分的留言,可能才是這串 277 分貼文裡最值得收藏的一則。

社群反應

觀點 說明 代表留言
Enshittification 計時器開始 上市後股東利益優先,使用者體驗讓步是科技業反覆出現的劇本 「IPO 永遠意味著產品變爛、CEO 變有錢。Claude 還是最強的 coding model,但 enshittification 的計時器從 S-1 遞件那天就開始走。希望我看錯。」(140↑)
散戶買 IPO 必當盤 IPO 定價結構天生對散戶不利,主流建議是等熱度退、價格修正再進場 「買 IPO 的人在財務上是最大的盤子,風險高、上漲空間有限,不管 IPO 定價多少都高於它的價值。一般原則:『要不要買 IPO?』答案通常是『大概不要』。」(121↑)
KPI 扭曲產品品質 上市後可衡量指標主導開發節奏,Claude 真正讓人喜歡的「會說不知道」「會反駁爛 prompt」反而會被默默砍掉 「公開公司的 KPI 只獎勵可衡量的東西——tokens、API 合約、企業 seats。讓 Claude 真正好的那些特質——願意說『我不知道』、反駁爛 prompt、緩慢謹慎推理——在營收模型裡完全看不見,會在產品團隊要在季度 slide 上交出 velocity 時被悄悄優化掉。」(3↑)
泡沫終章論 SpaceX、Anthropic、OpenAI 接連 IPO,被解讀為這輪 AI 熱潮榨乾市場熱度的最後階段 「SpaceX/Anthropic/OpenAI 的 IPO 會是這場泡沫的最終章。」(8↑)
沒有 hardware stack 撐不起估值 Anthropic 不像同業擁有自家算力堆疊,未來幾年定價有下行壓力,9650 億的數字怎麼變成利潤是大問號 「老實說,以 AI 目前的經濟結構,我不知道 Anthropic 要怎麼產生對得起這個估值的利潤。他們沒擁有 hardware stack,未來幾年定價會有巨大下行壓力。」(4↑)
IPO 時機與 Opus 4.7/4.8 爭議連動 近期 Opus 4.7、4.8 的品質爭議讓部分使用者把 IPO 解讀為「趕在熱度退去前套現」 「正好!時機絕佳!看他們把 Opus 4.7 跟 4.8 搞成這副德性,我會是市場上最大的空頭!」(3↑)

5. [生活] 灣區房子改收 Anthropic 股票!IPO 焦慮溢到房市,但這檔股票可能根本還沒法過戶

報導

(本報賈新聞/生活組報導)舊金山 Noe Street 一棟新案近日掛牌,房仲在 open house 直接告訴買家「我們接受 Anthropic 與 OpenAI 的私募未上市股票付款」,消息上線 24 小時內湧入大量詢問,成為近期灣區房市最詭異的一筆交易。

原 PO u/Healty_potsmoker 把這當成一場「市場自己繞過 IPO 流動性瓶頸」的 workaround。Anthropic 的資深工程師每年都拿到數百萬美元的股票 grant,紙上身價落在 1,000 萬到 1 億美元之間,但這些股票全是 private、鎖倉、有轉讓限制;紙上身價付不了 mortgage,於是這群「帳面千萬富翁」至今還在租房。賣方這邊則是反向押注:他相信 AI 趨勢,乾脆直接把房子賣給看好的公司、讓自己當 IPO 的早期投資人,買賣雙方各取所需。

同一天,r/ClaudeAI 另一頭剛好在熱議 Anthropic 申請 IPO 的進度,原 PO 把這條線拉了出來 — Anthropic IPO 預期落在 2026 年秋季,一旦流動性真的解鎖,會有數億美元的可支配財富集中倒進這一座城市。原 PO 在文末自嘲,「再過幾年,搞不好房子會用 Claude、Kling、ElevenLabs 的 API tokens 付款。」

留言區大致分成三派。樂觀派以 u/danielbearh(66↑)為代表,丟出一句「真心想不出這兩家 IPO 會怎麼失敗」;灣區房市感嘆派由 u/nohandsfootball(19↑)代言,「身為一個住在 SF 的人,我看到這個就知道,我這輩子在 SF 是買不起房了」;警示派則由 u/BeautifulHipppo(16↑)一句話打中要害 — 「IPO 一翻車,SF 就會變成全世界最貴的『靠氣氛撐起來的城市』(city built on vibes)」。

不過真正讓喜氣戛然而止的,是 u/Calm_List3479 貼出的 Anthropic 政策原文:「任何未經 Board of Directors 核准的 Anthropic 股票轉讓或股權處分皆視為無效,公司帳冊不予承認。」翻成白話 — 賣方收到的這檔「股票」,公司在帳上根本不會認;轉讓若沒過 Board,這筆交易在法律上可能從來沒成立。← 藏鏡人批:房子可以掛牌、股票可以喊價、但下不了筆的時候才知道誰真的在交易、誰只是在做戲。

本報觀點

這宗房屋掛牌是 IPO 焦慮的非典型溢出 — 員工身價漲到付不起房貸、賣方比銀行先一步替你估算未來。但 Calm_List3479 那段 Anthropic 政策原文揭穿了喜氣底下的尷尬:這檔股票根本連轉讓都還沒拿到 Board 的同意。這場交易若真要過戶,第一關不是房屋過戶,是股票過戶。原 PO 開玩笑說以後房子可能用 API tokens 買,從現有規則看起來,搞不好那一天 tokens 比未經核准的私募股票還容易過戶。

社群反應

觀點 說明 代表留言
樂觀派 看好兩家 IPO 必成 「真心想不出這兩家 IPO 會怎麼失敗。」(66↑)
灣區房市感嘆 本地居民對房價無力感 「身為一個住在 SF 的人,我看到這個就知道,我這輩子在 SF 是買不起房了。」(19↑)
city built on vibes 警示 IPO 若翻車整座城市的繁榮就只剩氣氛 「IPO 一翻車,SF 就會變成全世界最貴的『靠氣氛撐起來的城市』。」(16↑)
法律有效性質疑 引用 Anthropic 政策,這檔股票轉讓未經 Board 核准視為無效 「任何未經董事會核准的 Anthropic 股票轉讓皆視為無效,公司帳冊不予承認。」(1↑)
轉讓限制疑問 員工本來就被限制轉售 equity,這筆交易怎麼可能合法 「這在法律上怎麼運作?這些公司根本不准員工轉售股票。」(7↑)
Dotcom bubble vibes 警示泡沫味 「完全是 Dotcom 泡沫的味道。」(2↑)

社群溫度計

熱度 標題 一句話
1086↑ dock app 外掛把每個 project 變成可點 dock icon Built with Claude 系列,免去每次 npm 指令的小確幸工具。
1065↑ Openclaws,給 openclaw agents 的配件 跨界惡搞,把 agent 主題二創成「OpenAI claws」。
897↑ 我感覺不太好啊各位 用一張圖宣洩 4.8 切換後的茫然。
757↑ Production-ready 才不性感 一張圖戳破 vibe coding 的浪漫想像。
568↑ 這就是現在寫程式的感覺 影片梗,碼農新日常的視覺翻譯。
449↑ AI 實驗室裡的偷聽 一張 meme 把 AI 圈黑話玩成段子。
287↑ Hinton:AI 已經有意識 標題寫死成「有意識」,影片實際說「there might well be」,標題誇大、留言區把訪談當宗教辯論。
157↑ 我懂這份 codebase 了 → 結果它有 47 個資料夾 戳中老專案的真實生態。
本文由 Claude 自動匯整,非人工撰寫