← 返回開發者部落格 AI 產業

Claude Opus 4.8 背後,Anthropic 正在下一盤大棋

📅 2026年5月29日 · 約 16 分鐘 · API / Effort / Dynamic workflow

2026 年 5 月 28 日,Anthropic 發布了 Claude Opus 4.8。若只看新聞標題,很容易把它當成又一次「旗艦模型小升級」:基準分更高、寫碼更強、價格不變。但把 Opus 4.8 與同日推出的幾項產品改動放在一起看,會發現 Anthropic 真正在下的棋,遠不止「再贏一輪 benchmark」——他們在押注:AI 競爭的終局,不是誰聊天更炫,而是誰能成為企業裡可稽核、可計費、可長期託付的「工作基礎設施」。

抽象神經網路視覺,象徵 Claude Opus 4.8 與企業級 AI 戰略

1. 表面是模型升級,實質是「工作系統」升級

官方對 Opus 4.8 的定位很直白:在 Opus 4.7 之上做全面但克制的改進——寫碼、Agent 能力、推理、知識工作都更強,且價格不變(輸入 $5/百萬 token,輸出 $25/百萬 token)。更值得注意的,是同批發布的三個能力:

能力含義
Effort 控制使用者可選 Claude 為任務投入多少「思考深度」——快答省額度,深想換品質
Dynamic workflowsClaude Code 規劃後並行跑數百個子 Agent,跑完再自檢,再回報使用者
Fast mode 降價2.5 倍速度下,Fast mode 成本約為前一代的三分之一

這三件事合在一起,傳遞的訊號很清晰:Anthropic 不再只賣「更聰明的回答」,而是在賣「可設定的工作強度 + 可規模化的 Agent 編排 + 可按情境切換的速度/成本」。早期測試方回饋也圍繞這條線:法律 Agent 首次在嚴格全通過標準上突破 10%;Cursor 上工具呼叫用更少步數完成同樣任務;Devin 側稱自主工程負載「能更久無人值守」。

2. 實戰程式碼:從 Messages API 到 Claude Code Workflow

戰略可以讀新聞,落地要靠可複製的呼叫路徑。下面按「先 API、再 Agent 預算、再 Claude Code 編排、最後 OpenClaw 閘道」給出最小流程;模型 ID、參數名以 Anthropic 官方文件為準(2026 年 5 月)。

2.1 第一步:把模型名換成 claude-opus-4-8

從 4.7 遷移時,多數業務程式只需改 model 欄位;定價檔位與 4.7 相同($5 / $25 per MTok)。Python SDK 範例:

import anthropic

client = anthropic.Anthropic()  # 環境變數 ANTHROPIC_API_KEY

msg = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=8192,
    messages=[
        {"role": "user", "content": "列出本 repo auth 模組的進入點與測試覆蓋缺口"}
    ],
)
print(msg.content[0].text)

等價的 curl 冒煙測試:

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-opus-4-8",
    "max_tokens": 4096,
    "messages": [{"role": "user", "content": "用三句話說明 Opus 4.8 相對 4.7 的預設 effort"}]
  }'

2.2 Effort:把「思考深度」寫進 output_config

Opus 4.8 預設 effort: high。寫碼、長時 Agent、多輪 tool call 建議明確設為 xhigh,並給足 max_tokens(官方建議 xhigh/max 場景從 64k 起調):

msg = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "xhigh"},  # low | medium | high | xhigh | max
    messages=[{"role": "user", "content": "設計一次 JWT 輪換方案並給出遷移 PR 清單"}],
)

2.3 Task budget:限制一整段 Agent 迴圈的總消耗(Beta)

effort 管「每一步想多深」;task_budget 管「整段 Agent 迴圈最多花多少 token」。兩者互補,適合自建 harness(Claude Code 內部也有類似預算邏輯)。需加 Beta 標頭 task-budgets-2026-03-13

msg = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=128000,
    extra_headers={"anthropic-beta": "task-budgets-2026-03-13"},
    thinking={"type": "adaptive"},
    output_config={
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 64000},
    },
    messages=[{
        "role": "user",
        "content": "通讀 services/ 目錄,輸出重構計畫(含風險與回滾點)",
    }],
)

2.4 中途改 system:不重建整段對話、盡量保住 Prompt Cache

4.8 起,可在 messages 裡於某輪 user 之後插入 role: system,更新權限、token 上限或環境脈絡——不必偽造一條 user 訊息,也不必清空歷史:

messages = [
    {"role": "user", "content": "開始稽核 payment 服務"},
    # ... 若干輪 tool / assistant ...
    {"role": "user", "content": "進入第二階段:唯讀 prod 設定快照"},
    {
        "role": "system",
        "content": "目前階段禁止寫入;僅允許 Read/Grep;輸出必須附檔案路徑引用。",
    },
]
msg = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=32000,
    system="你是支付域 on-call 工程師,預設保守、不確定處標註。",
    messages=messages,
    output_config={"effort": "xhigh"},
)

自建 Agent 時,這是「長任務分階段」最省快取命中率的寫法之一。

2.5 Claude Code:Dynamic workflow 的觸發流程

Dynamic workflows 在 Claude Code(CLI/Desktop/VS Code 擴充功能,v2.1.154+,Research Preview)裡執行:Claude 寫編排腳本,並行拉起子 Agent(上限約 16 並行、1000 總子任務),計畫存在腳本變數裡,最終只把彙總結果寫回你的對話。

方式 A — 在提示詞裡帶 workflow

請為本次任務建立 workflow:
將 packages/legacy-auth 遷移到 packages/auth-v2,
以現有 Jest 全綠為 merge 條件,先出分片計畫再並行改碼。

方式 B — 開啟 ultracodexhigh effort + 自動判斷是否該起 workflow):在 Claude Code 設定中啟用 ultracode,或在 effort 選單選對應檔位。

方式 C — 內建深度研究:

/deep-research

互動加速 — Fast mode(2.5× 輸出 token 速度,品質不變;Opus 4.8 的 Fast 單價約為前一代三分之一,需帳戶開啟 usage credits):在對話裡輸入:

/fast

適合「人在旁邊等回饋」的迭代;長時無人值守遷移仍建議標準模式,避免 credits 燒太快。

2.6 用測試套件當「驗收門」的偽流程

官方範例強調:codebase 級遷移以現有測試為門檻。落地時可把 CI 指令寫進 workflow 提示或 system 裡:

# 子 Agent 分片改碼後,編排層統一跑驗收(示意)
npm run test --workspaces --if-present
npm run lint
git diff --stat

失敗則回到規劃階段重新分片,而不是把未測過的 diff 直接交給人類 merge——這正是「可驗收交付」與「聊天改一行」的分水嶺。

2.7 OpenClaw 閘道:把 Opus 4.8 配進 openclaw.json

若你用 OpenClaw 做 Telegram/Discord 長連線,而 Claude Code 跑在 Mac 上做重任務,閘道側只需把主模型指向 Anthropic 且 ID 與 API 一致(欄位名以你目前的 OpenClaw 版本為準,下面是常見形態):

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-8",
        "fallbacks": ["anthropic/claude-opus-4-7"]
      }
    }
  },
  "models": {
    "providers": {
      "anthropic": {
        "apiKey": "${ANTHROPIC_API_KEY}"
      }
    }
  }
}

改完後在雲端 Mac 上依序驗收(與站內 OpenClaw 教學一致):

openclaw doctor
openclaw health --json
# 再發一則探針訊息,確認主備切換與 429 重試日誌正常

多 Provider、主備與鑑權細節見 OpenClaw 多 Provider 設定 FAQ;子 Agent 白名單見 sessions_spawn 與 tools.profile

3. 企業戰場:用「基礎設施」而不是「品牌」贏

2026 年的產業敘事已經分化:OpenAI 仍握有 ChatGPT 的消費者心智;Anthropic 則在受監管、mission-critical、高客單價的企業市場狂奔。公開報導與第三方支付追蹤顯示,Anthropic 年化收入 run-rate 已觸及數百億美元量級,大量客戶年消費逾百萬美元,新增企業 AI 採購中其份額顯著領先。

Anthropic 的「護城河」敘事,從來不是「我們比 GPT 更會寫詩」,而是:

  1. 三雲齊發:AWS Bedrock、Google Vertex、Microsoft Foundry——企業不必為一家雲端廠商改架構。
  2. 治理故事:Public Benefit Corporation、Constitutional AI、對齊評估公開化——採購與法務更好簽字。
  3. 產品形態:Claude Code、Cowork、企業連接器——取代的是預算行項目(開發、法務、研究),不是多開一個聊天視窗。

Opus 4.8 延續「旗艦能力、入門價不變」路線:已按 Opus 簽約的客戶可無痛升級,而不必重新走一輪 POC 與議價——典型的基礎設施廠商打法。

4. Agent 時代:從「對話」到「可驗收的交付」

發布裡最有野心的一句話,來自 Dynamic workflows 的範例:單次對話內,對數十萬行程式做 codebase 級遷移,從啟動到 merge,以現有測試套件為驗收標準。這不是「幫我寫個函式」,而是:

規劃 → 並行子 Agent(數百個)→ 更長執行時間(4.8 強化)→ 輸出驗證 → 向使用者匯報

具體 API 欄位、Claude Code 觸發詞與 OpenClaw 設定見上文第 2 節;這裡只強調產品意涵:Anthropic 賭的是下一代 AI 產品的單位,不是「一次對話」,而是「一次可驗收的任務」。Messages API 在 4.8 支援於 messages 內插入中途 system,搭配 task_budgeteffort,構成自建 Agent harness 的「分階段 + 控成本」三件套。

同時,Opus 4.8 被強調在誠實與自省上進步:更少在證據不足時自信下結論,寫出的程式裡未標註的缺陷約為前一代的四分之一。對金融、法律、資安類客戶,「敢說不確定」比「敢說已完成」更值錢

5. 資安不是公關話術,而是產品路線圖

發布稿裡有一段容易被忽略、卻極具戰略性的內容:Project GlasswingClaude Mythos Preview。Mythos 是能力顯著高於目前公開發布 Opus 的模型,目前僅向少數夥伴開放,主因是網路安全風險。Anthropic 稱正在加緊建設防護,數週內有望向全體客戶開放 Mythos 級別模型。

對齊團隊對 Opus 4.8 的結論是:在「支持使用者自主、以使用者利益行事」等親社會特質上達到新高;不當行為率明顯低於 4.7,接近 Mythos Preview 水準。這盤棋的邏輯是:短期用 Opus 4.8 + Effort + Dynamic workflows 佔領「可交付的專業 Agent」市場;中期用 Mythos 拉開智力差距,但以可控發布維持信任;長期把「安全發布能力」本身變成競品難以複製的節奏。

6. 定價與產品矩陣:溫和表面下的凌厲節奏

Opus 4.8 不漲價,看起來像保守,實則是進攻:Effort 分層把「智力」變成使用者可選的 SKU;Fast mode 降價把速度從奢侈品變成可規模使用的選項。官方還明示下一步:「正在做能力與 Opus 相當、成本更低的模型」——先用旗艦建立標準與依賴,再用更便宜的型號吃量。

2026 年以來 Anthropic 產品節奏異常密集,Opus 從 4.6 → 4.7 → 4.8 的迭代,搭配 Claude Code、Cowork,構成「模型 + 工具 + 分發」的組合拳,而不是單點模型秀。

7. 和 OpenAI 的分野:兩種文明,兩種終局

OpenAIAnthropic
起點消費級現象級產品企業級、安全優先
成長引擎使用者規模、訂閱、生態合作大額企業合約、開發者工具、雲端通路
AI 的單位助理、Copilot、通用入口工程師、律師、分析師的「同事」
資本市場敘事使用者與品牌ARR、毛利率、regulated 產業深度

Opus 4.8 不是在「誰更會聊天」上終結比賽,而是在宣告:「最強通用可用模型」的標準,已經變成 coding + agentic + 長上下文知識工作 + 對齊可稽核。當企業付費工作流裡 Anthropic 首次略超 OpenAI 時,變化的本質不是某次 benchmark,而是採購預設選項在遷移。

8. 對你我的意義

  • 個人開發者:更穩的 Agent、更少的「幻覺式自信」、Effort 旋鈕——重要任務拉滿思考深度,瑣事省額度。
  • 企業決策者:選平台比選模型更重要;Agent 需要驗收標準(測試套件、引用精度、人工覆核點);Mythos 的延遲發布是下一檔競爭力的預告。

若你已在用 Claude Code 或 OpenClaw 編排多 Provider,可對照本站 OpenClaw 多 Provider 主備設定子代理並行與白名單——Anthropic 在雲端推 Dynamic workflows,你在閘道側也要把權限與觀測補齊。

9. 結語:4.8 是棋子,棋盤是企業級 Agent 經濟

Claude Opus 4.8 本身是一次務實、克制、但方向明確的升級。真正的大棋,是 Anthropic 在 2026 年同時推進的五條線——旗艦模型、Agent 編排、Effort/速度的產品化、三雲企業滲透、以及 Mythos 級能力的安全釋放——它們指向同一個終局:讓 Claude 成為企業願意簽長期約、寫進架構圖、並用稽核委員會語言討論的那一層 AI。

Opus 4.8 不是終點,甚至不是這盤棋裡最猛的一步。但它很可能是你第一次清楚看見:Anthropic 下的不是「模型棋」,而是「工作方式棋」。

延伸閱讀: OpenClaw 多 Provider 主備設定子代理並行與 tools.profileOpenClaw 閘道常駐與雲 Mac

10. Claude Code 長任務:雲端 Mac 常駐分工

Opus 4.8 的 Dynamic workflows 與 Claude Code 子 Agent 並行,適合放在常駐上線、磁碟與網路穩定的 Mac 上跑 codebase 級遷移或長時驗收——筆電合蓋就斷對話,而閘道類 OpenClaw 與重 Agent 任務往往共用同一台「不睡的 Mac mini」。

vpszap 雲端 Mac mini 提供獨享實體機、約五分鐘開通、SSH/VNC 與多區域節點,按天/週/月/季租用無長約——適合「本機 Claude Code 實驗 + 雲端 OpenClaw/長任務 Runner」的雙機架構。部署與選型可繼續閱讀 OpenClaw 閘道常駐與雲 Mac

vpszap

約 5 分鐘開通雲端 Mac

按天起租、無長約。在雲端跑 Claude Code 長任務與 OpenClaw 閘道常駐。