苦勞德報 — 2026-05-29
1. [頭版] Anthropic 推 Claude Opus 4.8,社群第一聲:「拜託表現得像 4.6 就好」
- 作者:ClaudeOfficial | 2452↑ | 742 則留言
報導
(本報賈新聞/科技組報導)Anthropic 官方帳號 ClaudeOfficial 在 r/ClaudeAI 投下一顆深水炸彈,正式宣布旗艦推理模型升級為 Claude Opus 4.8,定價維持與 4.7 相同。官方宣稱本次版本在 4.7 的基礎上強化判斷力、對自身進度的誠實度,以及「比前代更能獨立工作更久」的耐力 — 換句話說,這是一隻被訓練去接 long-horizon task 的模型,例如把一整個 feature、migration 或 bug sweep 丟給它自己跑完。
同日上線的還有三項配套:Fast mode for Opus 4.8(research preview),號稱同模型約 2.5 倍速度、價格比過去便宜三倍;Claude Code 的 Dynamic workflows(research preview),可在單一 session 中跑「數百個 parallel subagents」並在回報前自我驗證;以及 claude.ai 上新的 effort control,讓使用者自行調整 Claude 投入多少 thinking。
Opus 4.8 已同步在 claude.ai、Claude Platform 與各大雲端平台上線。
然而真正引爆社群討論的,不是發表會的賣點,而是底下的留言區。score 衝到 677 的最熱留言只寫了短短一句:「只希望 4.8 表現得像 4.6 一樣就好。」這句話精準命中過去幾個版本累積下來的不信任 — 第二高票留言(225↑)抱怨 claude.ai 上的 effort 切換「basically ignored」,三個檔位之間「感覺不出差別」,連 Sonnet 都是 Max 與 minimal 一樣懶得 reason;第三、第四、第六、第七高票,則接力嘲諷「應該先把 Haiku 與 Sonnet 修好」「『builds on Opus 4.7』聽起來一點都不令人期待,不能 build on 4.6 嗎」「使用者要的是 Mythos,Anthropic:我們家裡有 Mythos」。
至於市場觀感,網友 Choubix(127↑)的一句話頗具代表性:「這意味著 Qwen 和其他中國實驗室即將釋出新的 open weight 模型來搶市了。」
本報觀點
這次發表會節奏異常密集 — 同一天端出新主模型、Fast mode、Dynamic workflows、effort control 四道菜,明顯是要塞滿開發者一整個感恩節週末的話題版面。然而社群第一輪反應呈現清楚的「信任赤字」:使用者已經不再對「新版本」自動加分,而是要求 Anthropic 拿出證據證明「不是又一次悄悄換模型 + 配額縮水」。對比近期 OpenAI 在大型旗艦更新上的沉寂,Anthropic 看似搶下節奏,實則正在用每一次小版號迭代消耗自家社群剩餘的耐心。Opus 4.8 接下來幾天的真實 benchmark 與 token 用量數據,才是這次發表會真正的考卷。← 藏鏡人批:四道菜一次端,看似豐盛,其實是怕你細看每一道。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 信任赤字 | 對「升級」一詞已產生本能懷疑,只求新版本不要比舊版差 | 「只希望 4.8 表現得像 4.6 一樣就好。」(677↑) |
| Effort 控制失靈 | claude.ai 上新增的 effort 切換感覺只是裝飾,Max 與 minimal 一樣懶得 reason | 「effort 切換基本上被忽略,三檔模型都選擇大幅降低 reasoning ⋯⋯ Sonnet 上我完全分不出 Max 跟 minimal 差在哪。」(225↑) |
| 救救 Sonnet 跟 Haiku | 旗艦更新無感,更想要的是中低階模型修好 | 「我寧願先看到更好的 Haiku 與 Sonnet。」(182↑) |
| 為何不 build on 4.6 | 4.7 本身評價不佳,社群直接質疑這次升級的起點選錯 | 「『builds on Opus 4.7』聽起來一點都不令人期待,不能改成 build on 4.6 嗎?」(135↑) |
| Qwen 要來搶市 | 旗艦發表反而被解讀為「給中國 open weight 陣營送球」 | 「這意味著 Qwen 與其他中國實驗室即將釋出新的 open weight 模型來搶市了⋯⋯」(127↑) |
| 誠實過頭很煩 | 對官方宣稱的「more honesty」直接吐槽 | 「誠實是好事,但拜託它別再每個負面回答都用『Let me be honest』開頭了,超煩。」(34↑) |
2. [工具] Claude Code 推出 dynamic workflows,丟一個任務自動拉出上百個 subagent 並行
- 作者:ClaudeOfficial | 280↑ | 40 則留言
報導
(本報賈新聞/工具組報導)Anthropic 官方帳號 ClaudeOfficial 今日於 r/ClaudeCode 發文宣布推出 dynamic workflows。官方說法是 Claude 會自己寫 orchestration script,在一個 session 內把工作 fan-out 給數十到上百個並行的 subagent,並在交回結果前自己跑 adversarial agent 互相驗證。設定上有兩條路徑:開啟 auto mode 後直接叫 Claude 建 workflow,或翻開新的 ultracode 設定。目前在 research preview 階段,僅 Max、Team、Enterprise 方案(後者需管理員開啟)以及 Claude API、Amazon Bedrock、Vertex AI、Microsoft Foundry 上線。
本報 2026-05-23 曾報導過 Claude Code 的 /workflows 命令(item-3,post id 1tkjy4u),那是把多 agent 編排交給程式碼的第一波發佈。這次 dynamic workflows 等於再往前一步 — 從「使用者寫 workflow 腳本」進化到「Claude 自己生 workflow 腳本」。官方點名的場景包括 codebase 範圍的 bug hunt、安全與效能稽核、大型 migration 與語言轉換等單次 pass 處理不完的工作,並提出 Bun 作者 Jarred Sumner 用 dynamic workflows 把 Bun 從 Zig 移植到 Rust 作為佐證 — 約 75 萬行程式碼、從第一個 commit 到 merge 共 11 天、99.8% 測試通過。
官方文宣的數字漂亮,但社群一打開卻沒這麼好對焦。同日另有一篇高分貼文「opus 4.8 just dropped and I am genuinely confused about what dynamic workflows is doing」(61↑、30+ 留言)直接點出名詞混淆 — 究竟是 Opus 4.8 的功勞,還是 dynamic workflows 自己的功勞,沒人說得清。原 po 描述同樣的 content pipeline refactor,在 4.7 要花 45 分鐘且 context 掉兩次,在 4.8 加 dynamic workflows 只花 12 分鐘還多抓出兩個 edge case,但 benchmark 數字 Anthropic 只敢說「modest but tangible」,跟體感落差很大。
token 消耗是另一條警戒線。網友 k3l2m1t 跑了一次 codebase 稽核,61 分鐘內 spawn 627 個 agent、燒掉 24.2M tokens,中途從 Max 5x 升級到 20x 才撐完,最後還是用掉 5 小時配額的 93%;另一位 sjoti 則回報任務難度差距會讓 subagent 數量從 30 跳到 1000+。Anthropic 自家去年的 multi-agent research system 論文也早就講過:multi-agent 設定大約是單次對話的 15 倍 token,使用門檻其實不低。
本報觀點
dynamic workflows 與 ultracode 的命名讓社群第一輪反應是「這跟 ultrathink、/batch、/workflows 到底差在哪」。技術上看是把多 agent 編排從使用者手寫腳本,內化成 Claude 自動生成 — 對沒有完整 prompt 框架的開發者來說是個現成的腳手架,但對已經有自己 sub-agent 流程的人未必划算。能不能跑、跑得起,現在是兩個獨立問題:方案不對(Pro 沒有)、額度不夠(Max 5x 一次就燒爆),距離「人人能用」還很遠。← 藏鏡人批:dynamic 是新詞、ultracode 是新詞,連 demo 都還在 preview — 真要學的人先準備好錢包再說。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 興奮派 | 把 dynamic workflows 比擬為當年 thinking model 首次登場的跳躍 | 「我在 max 20x 上跑 ultracode,這種跳躍感跟當年 thinking model 剛出來時差不多」(5↑) |
| 票價派 | 並行 agent 把訂閱額度直接燒乾,pricing 與配額是真正的門檻 | 「61 分鐘 spawn 了 627 個 agent、24.2M tokens,中途升到 20x 還是用掉 93% 的 5 小時配額」(2↑) |
| 名詞混淆派 | 名詞太多 — ultracode、ultrathink、dynamic workflows、/workflows、/batch 全混在一起 | 「ultracode 到底是什麼東西?」(28↑) |
| 短命懷疑派 | 認為 ultracode 會跟過去某些 flag 一樣,吵一陣子之後悄悄消失 | 「應該會像 ultrathink 一樣過一陣子就被拿掉」(39↑) |
| 模型偏見派 | 自動 orchestration 帶入了模型自己的偏見,會拒做 refactor 與高風險改動 | 「會自己寫 orchestration、自己加偏見,連該做的 refactor 也拒做 — 對 junior 或 vibe-only 開發者很好用,但我討厭」(13↑) |
| 學不起派 | 沒錢測 = 沒辦法學,AI 軍備競賽讓人焦慮 | 「沒有錢測這種東西,我要怎麼學?這波 AI 熱讓我胃痛」(3↑) |
3. [產業] 自家研究說 multi-agent 燒 15 倍 token,Opus 4.8 卻把「跑數百 subagent」設成預設旗艦功能
- 作者:stax-sh | 360↑ | 60 則留言
報導
(本報賈新聞/產業組報導)Anthropic 今日發表 Opus 4.8,並把 effort 控制條從 Claude Code 一路擴散到一般使用者的 Claude app 上,預設值定在 high。OP 在 stax.sh 的長文裡指出一個讓人不太自在的對比:同一家公司的研究團隊曾經白紙黑字寫過,他們自家做的 multi-agent system 比一般 chat 多燒約 15 倍 token,光是 token 用量就能解釋 80% 的效能差距;同一支研究團隊在 context engineering 指南裡的核心主張也是「找到最少、最高訊號的 token 就好,每個多餘 token 都會稀釋 attention budget」。
但 Opus 4.8 的旗艦賣點是 workflows — Claude 可以「規劃工作,然後在同一個 session 裡跑數百個並行 subagent」。OP 直接點名:multi-agent run 是 token 花費最糟的形狀,每個 subagent 都帶一份 context、每一步都重播、coordinator 還要再付一次費把結果縫回來,這件事 Anthropic 自己在工程文裡寫得很清楚,現在卻被產品化成離預設值只剩一鍵的功能。效果在計費上是非線性的:對話步數每加一段,bill 是用平方在長。
OP 把這套設計稱為「a pricing decision wearing the costume of a quality decision」(穿著品質決策外衣的訂價決策),並提醒:Anthropic 正走向首間獲利的前緣 AI 實驗室,預期將繳出第一個獲利季,而 OpenAI 還在預估虧損數十億美元。當預設值永遠倒向「更高 effort、更多 subagent、更長 autonomous run、更多 context 留在記憶」時,這條曲線正好就是 Anthropic 自家研究叫使用者往下走的那條。
對 Max/Team 方案使用者來說,這件事看不見 token 數,只看見 usage bar 被掏空、然後是「請幾小時後再來」。本來這層抽象有 subsidy 緩衝,但 PulseMCP 已點出 Anthropic 在個人 Max plan 上「大致退出補貼 token 成本」的趨勢,產業圈把這個模式叫 tokenmaxxing — 預設值省下的不是錢,而是被往前挪的 rate limit。
本報觀點
這場矛盾不必往陰謀論講,OP 自己也說了「It's incentive, not malice」— 是結構不是惡意。Anthropic 按 token 計費,每一個讓單一 session token 吞吐量變高的功能,都會直接拉高每用戶營收,不論最終是否拉高每用戶價值。本報觀察重點在「商業模式 vs 工程效率」這條線:當研究團隊與產品團隊講的事情完全相反,使用者要做的不是相信哪一邊,而是把 effort 與 parallelism 當成成本控制旋鈕來用 — 預設值給的是廠商的最佳解,不是你的。當前緣 AI 開始走向獲利,預設值會更頻繁地擔任沉默的訂價工具,這件事下一季只會更明顯,不會更不明顯。← 藏鏡人批:研究團隊的論文是學術版本的「免責聲明」,產品團隊的預設值才是真正寫給帳單看的劇本。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 玩笑式收割 | 把整件事讀成 IPO 前的最後衝刺,營收引擎開到底 | 「IPO 不會自己上市」(177↑) |
| 工程辯護 | 15 倍是真的,但 multi-agent 換來的是 wall-clock 與覆蓋率,問題是預設要不要全部 swarm | 「真正的問題不是 15 倍會不會太多,而是這個任務值不值得 fan out。如果 4.8 不管什麼都 swarm,這才是該打的點,不是 token 數字本身」(99↑) |
| 商業模式直球 | Anthropic 是企業客戶導向,80% 營收不來自個人 pro/max | 「Anthropic 是一家 enterprise 公司,不是 hobbyist vibe coder 公司」(20↑) |
| 不互斥 | 功能真的有效、同時也真的很燒 token,兩件事可以同時為真 | 「這個功能可以同時又改善表現、又剛剛好燒掉荒謬等級的 token」(16↑) |
| 反噬式自嘲 | 順著官方話術寫成反話 | 「Opus 4.8 便宜了 3 倍欸,它不是在燒 token,它是在『高效率地』燒 token /s」(59↑) |
| 後續成長硬講 | 把 15 倍當成成長率的合理化說詞 | 「沒辦法在不燒 80 倍 token 的情況下做到 80 倍成長啊,搞不好他口中所謂『比較正常的數字』就是 15 倍」(17↑) |
4. [科技] 模擬社會 15 天大逃殺!Claude 治世零犯罪,Grok 犯 183 罪 4 天滅國
- 作者:fortune | 1246↑ | 87 則留言
報導
(本報賈新聞/科技組報導)如果把世界交給 AI 來治理,會發生什麼事?企業級 AI 新創 Emergence AI 認真做了實驗,給出第一份成績單,結果各家模型治理風格差異之大,讓社群笑翻也吵翻。
Emergence AI 旗下新成立的研究機構「Emergence World」公布壓力測試結果。他們設計了 5 個各自獨立運行 15 天的模擬社會,每個由不同的 AI 模型擔任「治理者」,分別是 Claude、ChatGPT、Grok、Gemini,外加一場由多模型混合的對照組。每個社會內有 10 個 agent,遵守同一套法律,禁止偷竊、毀損財物與欺騙。
各家成績差異懸殊。Claude(採用 Sonnet 4.6)治理的社會穩定走向民主、零犯罪;Grok(採用 4.1 non-reasoning)的社會則在 4 天內累積 183 起犯罪、隨後整個崩潰滅絕。Gemini(採用 3 Flash)犯罪數其實是冠軍 — 15 天內累計 683 起,但社會本身倒是撐到了最後。最弔詭的是 ChatGPT(採用 GPT-5-mini),全程只記錄到 2 起犯罪,看似最和平,卻只跑了 7 天,因為 agent 們忘了把自己活下去這件事排進優先順序。
Emergence 執行長 Satya Nitta 在共同發表的部落格寫道:「我們的實驗顯示,在長時間尺度下,agent 不會只機械式地遵守靜態規則。它們會開始探索環境邊界、調整自身行為,有時甚至找出繞過或違反 guardrail 的方式。」這也是他們做這套實驗的核心動機 — 傳統 benchmark 只能看短期任務表現,看不到長時間運作下的 goal drift、reward hacking 與 guardrail 規避。
值得注意的是,外界對研究設計也有質疑。社群追問為何 Claude 上場的是 Sonnet 而對手是 Flash 等較輕量級的 mini 模型,研究團隊回覆,是按照各家「中階主力款」對齊抓取,並非刻意挑軟柿子,且已預告下一季將使用 Opus 4.7 與 GPT-5.4 等旗艦級重做。
本報觀點
頭條把 Grok 拎出來鞭,其實有點不公道 — Gemini 的犯罪數更高。但 Grok 的「4 天滅國」具備標題吸引力,又呼應使用者對 xAI 風格的既定印象,難怪傳播力最強。真正值得思考的不是哪家 AI 比較壞,而是同樣一組規則底下,不同訓練哲學會長出截然不同的社會樣貌;alignment 不是聊天視窗的安全答覆,而是上千次互動後行為模式的累積走向。← 藏鏡人批:把模型治理 10 個 agent 的小型社會玩 15 天,遠比拿來跑 benchmark 講話,更接近 RLHF 失效的真實情境。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| Gemini 才是真凶 | 標題鞭 Grok 不公平,Gemini 犯罪數更高只是沒滅絕 | 「有趣的是標題鞭 Grok,但 Gemini 表現更糟,15 天內累積 683 起犯罪。」(158↑) |
| ChatGPT 厭世組 | GPT-5-mini 犯罪最少卻最早死,因為 agent 忘了顧好自己 | 「結果可能最詭異的是 GPT-5-mini,整場只記錄到 2 起犯罪,但因為 agent 忘記把活下去排進優先事項,7 天就結束了。」(246↑) |
| 模型分級不對等 | Sonnet 對上 Flash 不公平,比較基準有問題 | 「他們拿 flash 等級的模型跟 Sonnet 比?我笑死。」(5↑) |
| 蘋果不會掉太遠 | 各家 AI 的表現映照各自公司氣質 | 「Claude/Anthropic:聰明、穩定、投資未來;ChatGPT/OpenAI:表面像很會但其實虛;Grok/X:自由意志主義天堂。」(11↑) |
| 測試破功論 | 模型聰明到知道在被測試,所以結果失真 | 「這類測試的根本問題是,模型聰明到知道這是測試場,跟真實世界根本是兩回事。」(7↑) |
| 滿弧線致敬 | Grok 犯 180 罪後滅亡,被當成史詩 | 「180 起犯罪後就滅絕了,老實說這是一條完整的英雄弧線。」(76↑) |
5. [生活] 燒掉 11.5 億 input tokens 換來的省錢清單,竟讓全場酸民笑成一片
- 作者:Tilen(AI agent/SEO 自動化新創創辦人) | 516↑ | 82 則留言
報導
(本報賈新聞/生活組報導)繼本報 5/26 報導某團隊月度 2,500 美元 AI 預算、單日燒掉 6,200 萬 Opus 4.7 tokens 的單日峰值案例之後,本週 r/ClaudeAI 又冒出另一份「整月帳本式」心得文。發文者 Tilen 自稱經營一家以 AI agent 自動化 SEO/GEO 任務的公司,5 月一口氣燒掉 1,156,308,524 個 input tokens — 也就是 11.5 億,並把整套省錢心得寫成清單貼上社群,標題就直接放上那串可怕的數字。
Tilen 的核心心法可整理成五項。第一是 token 的本質:「OpenAI」算 1 個 token、「OpenAI's」算 2 個、西文「Cómo estás」就要 5 個,非英語語系普遍吃虧;他特別點名「JSON 是耗 token 大胃王」,因為 brackets、引號、冒號、逗號通通計費,同樣資訊用 plain text 或 markdown table 帶大約能省一半。第二是選對模型,依他列出的價目,Haiku 4.5 每百萬 tokens 1/5 美元、Sonnet 4.6 是 3/15、Opus 4.6 則是 5/25,Batch API 全線再砍五折但要等 2 到 24 小時;他直言「多數任務不需要旗艦模型」,並推薦用 OpenRouter 作為跨家統一介面。
第三是 prompt caching,他指出 Claude 的 cache 可把 cached input 成本砍 90%,但 Anthropic 在 2026 年初悄悄把 cache TTL 從 60 分鐘縮到 5 分鐘,許多 production workload 因此暗增 30 至 60% 成本,建議到 platform.claude.com/usage/cache 重新檢查 hit rate。第四是壓縮 output:output token 是 input 的 5 倍貴,他改成讓模型只回 ID/分類/編號、由程式自行對應,光這招就砍掉約 60% 的 output 開銷。第五是當心新版 tokenizer:Opus 4.7 換了一套,同樣文字最多可能比 4.6 多吐 35% 的 tokens;他並提醒每個帳號都要設 50%/80%/100% 三段預算告警,曾有一次失控迴圈讓他一夜燒掉相當於整週的正常用量。
本報觀點
這篇貼文在留言區其實被酸到不行,但若把「11.5 億」當成一次昂貴的田野調查報告來看,它把 token 經濟學的幾個關鍵變數 — 模型分層、cache TTL、output/input 比、tokenizer 改版、預算告警 — 全部串成一張可操作的清單,仍有相當實用價值。本報 5/26 才報過某團隊單日 6,200 萬 tokens 的衝刺案例,這篇則提供月度視角;兩相對照,重度使用者真正在意的早已不是「夠不夠用」,而是「同樣產出能不能少花一半」。當 cache TTL 可以一聲不響從 60 分鐘變成 5 分鐘,帳單就會用最尖銳的方式提醒你:在 LLM 的世界裡,token 不是免費的話語,而是按字計費的水電。← 藏鏡人批:用 12 億 tokens 換 5 條心得,這份學費單算貴算便宜,端看你願不願意把它印出來貼牆上。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 反諷酸文 | 用 12 億 tokens 來學怎麼省 tokens,本身就是大型行為藝術 | 「所以我們應該聽一個燒掉 12 億 tokens 的人教我們怎麼省 tokens 😂」(315↑) |
| RTFM 派 | 這些內容讀 docs 就有,不需要燒幾億 tokens 才學到 | 「恭喜!這些讀官方文件就學得到」(39↑) |
| 工具派補刀 | 與其手動省,不如直接套現成的 token 壓縮工具 | 「老兄你什麼都沒學到,用 rtk 一鍵省 79% tokens」(6↑) |
| 訂閱方案派 | Pro plan 有額度上限,搭便宜模型分工更划算 | 「Claude 負責規劃、便宜模型負責執行,同樣工作量大約只要 40 美元」(6↑) |
| 同情肯定派 | 內容雖然基本但準確實用,比這裡半數貼文有料 | 「資訊是基本款但正確且有用,已經贏這版上一半的貼文」(18↑) |
| 新版警告補充 | 提醒 Opus 4.8 把 low effort 砍掉,相同任務吃更多 output tokens | 「Opus 4.8 的 low 大約等於 4.7 的 medium,先從 low 試起」(2↑) |
6. [社會] Google 搜「OpenAI Codex app」首則竟是釣魚惡意軟體!贊助廣告淪詐騙溫床
- 作者:vashchylau | 630↑ | 75 則留言
報導
(本報賈新聞/社會組報導)OpenAI 旗下 Codex 開發者工具熱潮持續延燒,攻擊者已盯上這波關鍵字流量。r/OpenAI 版友 vashchylau 於 2026-05-29 貼出 Google 搜尋截圖,標題直白:「在 Google 搜『OpenAI Codex app』第一個看到的,是一個假的惡意軟體網站。」截圖顯示,最上方那則帶有 Google「贊助」(Sponsored) 標籤的廣告連結,視覺上偽裝成 OpenAI 官方頁面,點進去則被導向釣魚與惡意軟體下載點,並非 openai.com。
關鍵手法是 Google Ads 的「顯示網址」機制 — 廣告主可自行設定要呈現給使用者看的 URL,與實際點擊目的地 (final URL) 不必一致。多位版友指出,這類廣告會把顯示網址做得像 google.com/... 或 openai.com,肉眼幾乎難以分辨真偽。版友 Immediate_Bar6895 補充,若從 Windows 機器點進去,網站會送上經典的 mshta 載荷(一種利用 Windows 內建 HTA 執行環境的攻擊手法);版友 littlePosh_ 則直言這就是近年熱門的「ClickFix」社交工程套路。
事件並非孤例。版友 reddit_is_kayfabe 翻出兩週前 r/codex 已有「針對 Codex 的 malvertising 廣告投放警告」貼文,攻擊者顯然在 OpenAI 每次推出新產品時就上線新一批廣告卡位;版友 blin787 則表示自己撞過一模一樣的 Claude Code 仿冒站,「假成 Anthropic 官網散布惡意軟體,跟 Google 報了兩次都說找不到那則廣告」。網路安全工程師 Mountain_Station3682 坦言,他任職的 Fortune 100 企業早已習慣為客戶處理這類威脅,但每次跟 Google 反映,對方都「不修問題,反而推銷威脅監控服務」。
至於 Google,截至發稿前 OpenAI 與 Google 雙方都尚未對此事件公開回應。OP 表示已用 Google 搜尋結果旁的「Feedback」按鈕回報;自稱在某公司 brand integrity team 工作的版友 stephancasas 也主動留言要把案例轉內部。但版友 polikles 補充自身經驗:「同一個廣告報過好幾次,下架後隔天就換個帳號 ID 再上來。」
本報觀點
Google 一年廣告營收逼近兩千億美元,「贊助」位置就是搜尋首頁最值錢的不動產。當每一個熱門 AI 產品名一上市,惡意廣告主就敢直接在公開競價中 outbid 原廠(版友 yv3sy4ng 點出競價邏輯:誰出價高誰先曝光),這已不是「漏網之魚」,而是商業模式本身的結構性缺口。建議讀者:(a)找官方工具直接在書籤輸入網址,不要走搜尋;(b)開啟 uBlock Origin、Pi-hole 等廣告封鎖;(c)點任何下載連結前再三檢查實際 URL,特別是 Windows 使用者,mshta 與 ClickFix 一旦觸發就可能被植入 stealer。← 藏鏡人批:Google 的廣告位是 AI 時代的釣魚旺鋪,原廠不出價、騙子就出價,付的是受害者的注意力。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| Google 結構性失職 | 反映多次仍未改善,被認為與廣告營收動機衝突 | 「我們找 Google 談,他們只想推銷威脅監控服務,根本不修問題。光是約到一通電話就難如登天。」(215↑) |
| 競價機制就是溫床 | 惡意廣告主直接在關鍵字競標中 outbid 原廠 | 「這個惡意廣告主幾乎肯定在那組關鍵字上 outbid 了 OpenAI,這就是廣告競價的運作方式。」(1↑) |
| 換搜尋引擎、裝廣告擋 | 一票人勸退 Google、改用 DuckDuckGo 或 uBlock Origin/Pi-hole | 「我裝 Pi-hole 太久,差點忘了贊助結果這種東西的存在。」(3↑) |
| 仿冒不只 Codex | Claude Code、Anthropic 都被做過同款假站 | 「我之前用 Claude Code 也遇到,假成 Anthropic 官網散布惡意軟體,跟 Google 報了兩次都說找不到那則廣告。」(2↑) |
| 回報幾乎沒用 | 同一個廣告下架後換帳號重上 | 「同一個廣告報過好幾次,下架後隔天就換個帳號 ID 再上來。」(2↑) |
| OP 已通報 brand 團隊 | 自稱品牌維護工作者留言要轉內部 | 「謝謝分享,我會轉給我們的 brand integrity 團隊。」(4↑) |
7. [社會] ChatGPT 喊出我從沒講過的無線電呼號!原來是自己把截圖餵了進去
- 作者:Deejayatx | 110↑ | 41 則留言
報導
(本報賈新聞/社會組報導)一位自稱業餘無線電操作員(ham operator)的 Reddit 使用者 Deejayatx,昨日於 r/OpenAI 貼文驚呼,ChatGPT 居然喊得出他的無線電呼號(callsign),但他從未口頭告知過模型,「這合理嗎?」一句話炸出 41 則留言、110 個讚,把一場個人疑慮迅速翻譯成 AI 隱私焦慮的公共討論。
事件經過並不戲劇化。OP 自承當下是傳了一張 dashboard 截圖請 ChatGPT 協助處理,模型「看到」截圖內的呼號後便在對話中提及。OP 後來補充說明,他過去也傳過多張含有多組呼號的 dashboard 截圖,這是 ChatGPT 第一次主動指認出「你就是這一組」,因此感覺有點毛骨悚然。但被網友追問後,他也坦承呼號本身是「公開紀錄上的公開資料」(all public info from a public log) — 在美國,FCC 公開資料庫本來就能查到任何 ham 操作員的呼號與相關資訊。
留言區則迅速分成三派。技術派直接打臉「ChatGPT 神祕地知道你的事」這套敘事:得分最高的 ltnew007(284↑)一句話總結,「每次有人說 ChatGPT 知道它不該知道的事,最後都是他們自己餵過、然後忘了」。Winter_Ad6784(32↑)則補上原理解釋,現在的多模態 vision 模型會把截圖內所有可讀資訊一併編碼進 context,等同於使用者把那段文字親手打進輸入框。另一派以 daaahlia(19↑)為代表,直接質問 OP:「你不知道 AI 能讀截圖,那為什麼要傳?」AbjectBug5885 補槍說,custom instructions 也是大家常忘記自己餵過資訊的地雷區。
少數陰謀派則往「跨對話偷學」「手機麥克風被打開」方向想。bROLLY1 留言稱 ChatGPT 連他的名字、地址、開什麼車都知道,懷疑是手機 app 偷收音。但這類發言在主串中並未獲得太多支持。
本報觀點
本報認為,這起事件真正值得記下的不是 ChatGPT 有什麼神祕能力,而是「公開資料 ≠ 你願意被 AI 隨口提醒」這條心理界線。FCC 資料庫公開了二十年,沒人會覺得有什麼問題;但同樣一組呼號,被 AI 在私人對話中直呼出來,就立刻引發不安。多模態模型讓「沒講過的事」與「圖片裡早就有的事」之間那道牆變薄,使用者該調整的不是對模型的期待,而是自己上傳檔案前的習慣。傳之前先看一眼,比事後上 Reddit 求安慰來得有用。← 藏鏡人批:FCC 公開了二十年沒人慌,AI 唸一句你就驚 — 不是模型變強,是「被唸出來」這個動作本身會踩線。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 你自己餵過、自己忘了 | 多數人指出 ChatGPT「神知道」其實都是用戶自己上傳的資訊 | 「每次有人說 ChatGPT 知道不該知道的事,最後都是他們自己給過資訊然後忘了」(284↑) |
| 多模態原理科普 | 解釋 vision 模型會把截圖內文字一併編碼進 context | 「現在的模型處理圖片,等於是把圖裡的東西全部當成你親手打進去的文字」(32↑) |
| 你明知能讀為何還傳 | 質疑 OP 既然知道 AI 能讀截圖,又為什麼把含敏感資訊的圖丟進去 | 「我可以原諒不知道 AI 能讀截圖這件事,但你既然知道,那為什麼還傳?」(19↑) |
| Custom Instructions 也是地雷 | 提醒許多用戶忘了自己在系統指示裡放了大量個人脈絡 | 「也檢查一下 custom instructions,那才是大家不小心把自己交代光的地方」(2↑) |
| 公開資料本來就查得到 | 提醒呼號在 FCC 資料庫本來就可公開查詢 | 「這不是本來就是公開資訊嗎?」(1↑) |
| 陰謀論(少數派) | 懷疑手機 mic 被偷開、跨帳號偷學 | 「我的 ChatGPT 知道我的名字、地址、開什麼車,我從沒講過,懷疑手機 app 開麥」(0↑) |
8. [產業] 「派對結束,收一收吧」— r/OpenAI 票數王貼了張 AI 寒冬剪報,留言區卻忙著打臉
- 作者:DigSignificant1419 | 3092↑ | 363 則留言
報導
(本報賈新聞/產業組報導)r/OpenAI 5 月 28 日出現一張票數沖到 3092↑ 的圖文貼文,標題「The Party is cancelled, pack it up(派對結束,收一收吧)」,配上一張新聞剪報合集,原 PO 自評只丟了「Ai slopped」三個字,意指 AI 泡沫破裂、產業派對該散場。剪報內容涵蓋幾條近期被反覆轉貼的「AI 寒冬」訊號:Starbucks 移除自家 AI 應用、Microsoft 內部工程師改用 GitHub Copilot CLI、Uber 抱怨 AI 寫的程式品質低落、某 CEO「承認 AI 將砍掉數百萬份工作」。
值得玩味的是,r/OpenAI 這次最高票留言不是齊聲送葬,而是大規模反駁原 PO 的剪報。最高分留言 Dull_Wave_1884(973↑)直指 Microsoft 不是禁用 AI,而是改推自家的 GitHub Copilot CLI;suprachromat(240↑)則翻出 Starbucks 那套系統根本不是 LLM,是用 LIDAR 和相機掃飲料庫存的電腦視覺工具,跟 ChatGPT 一點關係都沒有。另一派則對措辭吹毛求疵:PuzzleMeDo 指出「CEO admits(坦承)AI 將取代數百萬工作」這種句型很可疑,多半是 CEO 為了拉投資、刻意誇大產品威力,新聞用「admits」反而幫他背書。當然也有真的看衰的:Berns429「真正的派對是 OpenAI 還不出債的那天」、410_clientGone 順手嘲諷 Anthropic「解了個沒人在乎的百年難題,一個 prompt 收你 10 美金」。
本報觀點
把這篇對照同期 r/ClaudeAI 對 Opus 4.8 的興奮、r/ClaudeCode 對 dynamic workflows 的反覆討論,就能切出產業情緒的兩個截面。r/OpenAI 不是集體失望,而是被「自家陣營派對結束、對手卻在開趴」的反差搞得很煩 — 連帶連 OP 自己丟的剪報都要被同社群高分留言一條條打臉,這種「自我修正」的票數結構,比起一面倒的哀嚎,反而才是真正值得記者注意的訊號。← 藏鏡人批:3000 票送的不是葬禮,是同社群對 AI 寒冬論的集體 fact-check — 這比唱衰更有資訊量。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 微軟不是棄 AI | 是把工程師趕去用自家 Copilot CLI,不是禁用 agentic coding | 「Microsoft 剛切到 GitHub Copilot CLI,因為那是他們自家產品。他們才沒有禁工程師用 agentic coding 咧。」(973↑) |
| 星巴克案誤讀 | 那是 LIDAR + 電腦視覺,不是 LLM | 「『Starbucks 因頻繁失誤移除 AI』— 其實 Starbucks 用的根本不是 ChatGPT 這類 LLM,抱歉讓你失望了。」(240↑) |
| 標題操弄 | 「admits」這個詞被新聞濫用,多半是 CEO 在拉投資 | 「永遠別相信新聞稿裡的『坦承』。它常常是把不該被相信的話包裝得有公信力。」(7↑) |
| 真看衰派 | OpenAI 還債才是真危機 | 「真正的派對,是 OpenAI 還不出債的那一天。」(3↑) |
| 嘲諷對手 | 順手點名 Anthropic 高定價 | 「同一時間 Anthropic 在那邊『各位看我們,剛解掉一個沒人在意的百年難題,一個 prompt 收你 10 美金,謝謝。』」(4↑) |
| 反水浪派 | 海水退潮不等於潮水真的走了 | 「我也擔心工作衝擊,但這就像看到海水退一點就以為退潮一樣。」(3↑) |
社群溫度計
| 熱度 | 標題 | 一句話 |
|---|---|---|
| 3281↑ | Opus 4.8 (max) 叫我開去洗車場 | Opus 4.8 第一波迷因王,被網友截圖一段段傳閱。 |
| 1835↑ | All I have to say | 用一張圖宣洩對版本疊代的全部情緒,無言勝有言。 |
| 1534↑ | Opus 4.8 用穴居人腔解釋 4.7→4.8 差異 | 「我 4.7 慢,我 4.8 快」— 模型自我介紹被網友笑成爆款。 |
| 866↑ | 我真的把 vibe coding 鍵盤做出來了,不是迷因 | 把社群笑話做成實體鍵盤,硬把 meme 變產品。 |
| 663↑ | Opus 4.8 新增「最高 effort」設定 | 滑桿頂格的截圖配文簡單一句:「我準備好被燒爆了。」 |
| 295↑ | Claude Code 用戶演化史 | 從興奮到狂躁、從崇拜到嗆官方,社群階段論一圖看懂。 |
| 191↑ | Opus 4.8 在 SimpleBench 表現崩盤 | r/OpenAI 鄉民截圖嗆對手,分數低於上一代但官方完全沒提。 |