← 返回開發者部落格 AI Agent

從 Agent 到 Skill:OpenHuman 憑什麼成為 GitHub 現象級專案?

📅 2026年5月28日 · 約 14 分鐘 · Agent 架構、SKILL.md 生態與 GitHub 走紅邏輯

2026 年 5 月,OpenHumantinyhumansai/openhuman,GPL-3)在 GitHub 上已是數萬 star 級的開源桌面 Agent——主儲存庫 2026 年 2 月才公開,這成長曲線足以稱現象。社群討論常把它與 OpenClaw 並列,但值得深入拆解的不只是 star 曲線,而是產品敘事裏清晰的貫穿線:從單體 Agent 到可組合 Skills。OpenHuman 把 Gmail、Notion、GitHub 等拆成可安裝的 SKILL.md 單元,用 Memory Tree 與 auto-fetch 餵上下文,並在每一輪對話透過 prompt injection 寫入指令——與 2026 年 Personal AI 與開源 Agent 堆疊收斂的方向一致。

開發者在 Mac 上編寫程式,象徵 OpenHuman 桌面 Agent 與 Skill 開發場景

1. GitHub 上的「現象」:數字到底代表什麼

Star 會漲會跌,把它當 KPI 崇拜很傻。但 OpenHuman 的成長曲線確實異常陡峭。截至 2026 年 5 月,主儲存庫落在約 2 萬 star 區間,2k+ fork、100+ 貢獻者,發佈節奏活躍(例如 v0.54.x)。相較其他 Personal AI / 桌面 Agent,它同時踩中四個「star 放大器」:

  • 時機 — 2026 年初,Agent hype 從 demo 轉向「我能不能裝在自己機器上?」
  • 形態 — Tauri + Rust 桌面,數分鐘 onboarding;比純 CLI 閘道更貼近知識工作者。
  • 敘事 — 「Personal AI 超級智慧」加上本機 Memory Tree,直指 ChatGPT 式對話失憶(見 Personal AI 正在取代 ChatGPT)。
  • 授權 — GPL-3,可審計、易 fork;在資料託管焦慮下,local-first 加分。

2. 從 Agent 到 Skill:2026 年可擴展性的主流答案

早期 Agent 常是「一個大模型 + 寫死的工具」。每接一個 SaaS 就要改核心、發版、做安全審查。2025–2026 年社群標準化為 Skill 作為邊界——能力封裝成可發現、可安裝、可版本化的單元;核心只負責排程與持有上下文。

幾種方言並存:

  • Claude Code / Cursor — MCP server 加專案規則檔。
  • OpenClaw — 閘道 Skills 與渠道外掛,由 SKILL.md 驅動。
  • OpenHuman — 獨立的 openhuman-skills 儲存庫,加上桌面 Skill 目錄與 prompt injection。

共通點:靠新增目錄條目擴展,而不是 fork 核心。分歧在 Skill 是純指令注入,還是沙箱內可執行套件——OpenHuman 2026 上半年正是從後者痛苦遷移到前者,讀懂這段轉折是理解其 GitHub 熱度的關鍵。簡短口訣:Memory 回答「你是誰?」Skills 回答「你能叫什麼?」——正交兩層,彼此放大。

3. OpenHuman Skill 架構:SKILL.md 與 prompt injection

依主儲存庫 2026 年 4 月合併的 feat(skills): agentic loop wiring for SKILL.md bodies 及相關工作,Skill 路徑今日大致如下:

3.1 發現與安裝

桌面 App 維護已安裝 Skill 目錄;預設目錄可指向 GitHub openhuman-skills(開發時可用 VITE_SKILLS_GITHUB_REPO 覆寫)。使用者也可從 HTTPS URL 安裝單一 .md(有大小與 scheme 限制——請查當前原始碼)。

本機開發時,把 Skills 指向你 fork 的 registry:

# 桌面開發環境(範例;欄位名稱隨版本可能不同)
export VITE_SKILLS_GITHUB_REPO="your-org/openhuman-skills"

# 從 HTTPS 安裝單一 Skill(僅 .md、僅 HTTPS)
# 安裝器會驗證 scheme、路徑副檔名與 body 大小上限

3.2 匹配與注入

每次使用者回合,Agent 會:

  1. 將「可用 Skills」清單(名稱 + 描述)渲染進 system prompt;
  2. 透過明確 @mention 或關鍵字/tag 啟發式匹配 Skills;
  3. 讀取匹配到的 SKILL.md body,以 [SKILL:name] 區塊注入;
  4. 強制每回合約 8 KiB 總注入上限——實務上的 token 預算。

社群作者通常這樣結構化 SKILL.md(YAML frontmatter + Markdown 指令):

---
name: gmail
description: Read and draft Gmail, using mail summaries in Memory Tree
tags: [email, google, productivity]
trust: user
---

# Gmail Skill

使用者提到郵件、收件匣或待跟進時:
1. 查 Memory Tree 過去 48 小時的 mail chunk
2. 僅在需要全文時呼叫 gmail.read_thread
3. 草稿寫入本機 vault;僅在使用者確認後才寄出

未經確認不得呼叫 gmail.send

回合內注入形狀(示意,非完整 prompt):

## Available Skills
- gmail — 讀取與撰寫 Gmail…
- notion — Notion 頁面與資料庫…

[SKILL:gmail]
(SKILL.md body;總注入位元組 ≤ 8192)

3.3 與舊 QuickJS runtime 脫鉤

早期版本在 QuickJS 沙箱執行 Skill 套件;2026 年中 roadmap 移除了該 runtime。Skills 今日偏向 metadata 目錄 + 指令注入,而非第三方可執行外掛——貢獻者仍在 openhuman-skills 維護 Notion、Gmail 等,但載入行為請依當前 release notes。

4. Memory Tree + auto-fetch:Skills 能發揮作用的先決條件

光有 Skill 清單仍會變成「有工具卻不認識你」。OpenHuman 另一條腿是持續記憶流水線(與 Skills 正交,但彼此放大):

  • 118+ 整合(文件用語;隨版本而異)— OAuth 接入 Gmail、GitHub、Slack、Linear 等,暴露為 typed tools。
  • Auto-fetch — 約每 20 分鐘,活躍連線器拉新資料到 Memory Tree(SQLite + 可讀 Markdown chunk)。
  • Obsidian 相容層 — 同一份記憶可落入你可審計、可編輯的 vault——Skills 呼叫 tools;Memory Tree 回答「這使用者昨天在做什麼?」

這是 OpenHuman 常勝過「只做閘道」Agent 之處:Skills 界定能力邊界;Memory Tree 界定個人上下文深度。只裝 Skills 不連資料源,體驗很快變薄——不是 bug,是架構假設。

可選:與 Claude Code / Cursor 共用 agentmemory 後端(路徑與欄位依 release 文件):

# config.toml 摘錄(示意)
[memory]
backend = "agentmemory"   # 預設本機 Memory Tree;可切換自託管 agentmemory

[memory.agentmemory]
endpoint = "http://127.0.0.1:8765"
namespace = "personal"

資料流一行話:OAuth → auto-fetch 進 Memory Tree → 使用者回合觸發 Skill 匹配 → 注入 SKILL.md body(≤8 KiB)

5. openhuman-skills 生態與社群飛輪

主儲存庫 star 飆升,很大程度靠獨立 Skills 儲存庫降低貢獻門檻:

  • 核心 Skills(gmailnotion、參考 server-ping)在 openhuman-skills/src/core/
  • 貢獻者改 Skills、跑驗證腳本、開 PR——不必 fork 整個 Tauri App;
  • 使用者感知是 App Store 式安裝,而不是「clone monorepo 編譯三天」。

與 Homebrew formula 或 VS Code 擴充同一套飛輪:穩定核心、快速生態。GitHub「現象」常來自「一週內有人能幫我加整合嗎?」——OpenHuman 把它拆成公開儲存庫加文件化的 SKILL.md 慣例。

典型 openhuman-skills 目錄(簡化):

openhuman-skills/
├── src/core/
│   ├── gmail/          # Gmail OAuth + tools
│   ├── notion/         # Notion integration
│   └── server-ping/    # reference / health-check Skill
├── docs/
│   └── SKILL_AUTHORING.md
└── scripts/
    └── validate-skills.sh

貢獻者迴圈:改 Skill → validate → PR 到 registry;桌面拉目錄——主 openhuman 儲存庫不必為每個 SaaS 發版。

6. 對照:OpenHuman Skills vs OpenClaw SKILL.md

維度OpenHuman SkillOpenClaw Skill
預設 runtime本機桌面(Tauri)本機或雲端閘道程序
核心 KPI個人上下文 + 桌面 copilot7×24 渠道觸達、對外 Bot
Skill 形態(2026 年中)目錄 + SKILL.md 注入SKILL.md + 閘道工具鏈
記憶內建 Memory Tree / ObsidianSession + 自建儲存,維運成本高
典型使用者「記住關於我的一切」「在 Telegram 找到我的 Bot」

非零和。成熟團隊常筆電跑 OpenHuman 做記憶與 Skill 實驗,雲端 Mac 跑 OpenClaw 做 Telegram/Discord 長連線——見 OpenHuman vs OpenClaw 對照

7. 誰該現在裝?誰該再等等?

今日適配:

  • 產品與工程人員,想親手驗證 Personal AI / Skill injection 模式;
  • Obsidian + Markdown 工作流,願意 auto-fetch Gmail/GitHub;
  • Apple Silicon Mac 使用者,規劃 Ollama/MLX 本機推理;
  • 準備貢獻 openhuman-skills 整合、需要真實桌面試跑的人。

再等等或降低期望:

  • 生產自動化需要可執行第三方 Skill 沙箱(今日:prompt injection 優先);
  • 多渠道支援、對外 SLA、WhatsApp 群 Bot——OpenClaw 類閘道優先;
  • 零 OAuth、零連線器,卻期待全知——Memory Tree 不會憑空出現;
  • 企業嵌入需要已發布審計與商業 SLA——仍是 Beta 能量。

8. 邊界與常見錯誤

8.1 硬邊界(寫進選型文件)

  • Skill runtime 變動中 — 勿依 QuickJS 外掛時代的教學部署;跟當前 release + GitBook。
  • 注入上限 — 每回合 Skill body 約 8 KiB、每次資源讀取約 128 KiB(原始碼常數;可能變更)——長 SOP 要拆分或外置文件。
  • 118+ 來源 ≠ 你的都有 — 核對你的堆疊;缺整合意味自訂 Skills 或等社群。
  • GPL-3 — 易 fork;商業 OEM 需法務審 copyleft 範圍。

8.2 常見誤解

  • Star 代表「ChatGPT Enterprise 替代品」——它是個人上下文 OS,不是通用 SaaS。
  • 裝完 Skills 就自動跑 cron——許多 Skills 今日是指令層;排程仍靠 Agent 回合與既有 tools。
  • 只調 Skill 清單、忽略 Memory Tree——沒有 auto-fetch,Personal AI 敘事就塌了。
  • OpenClaw 或 OpenHuman 二選一——power user 通常是Skills + 記憶本地,閘道 + 渠道在雲

9. 結論:現象 = Agent 核心 + Skill 生態 + 本機記憶

OpenHuman 在 GitHub 走紅,不是因為 flashy demo——它同時押中 2026 三個賭注:桌面 Agent 回歸可組合 Skills可審計本機記憶。Agent→Skill 遷移讓它像 npm 時代的 Node——核心精瘦,能力靠社群目錄成長;Memory Tree 確保 Skills 不是在真空裏打 API,而是服務持續更新的「你」。

Personal AI 更長弧線(不只 Skill 機制),見 OpenHuman 與 Personal AI 浪潮;對外 Bot 與常駐硬體,續看 OpenClaw 閘道與雲端 Mac 部署指南。

延伸閱讀: OpenHuman 與 Personal AI 浪潮OpenHuman 與 OpenClaw 對比OpenClaw 閘道常駐與雲 Mac

10. Skills 本地、閘道在雲:Mac 分工

OpenHuman Skills 與 Memory Tree 適合放在你的筆電或桌面 Mac;OpenClaw 的 Telegram/Discord 長連線、Cron 與渠道密鑰更適合常駐 Mac mini。Apple Silicon 可疊 Ollama 做推理,雲端閘道處理訊息——Skill 架構沒有消滅「總得有東西 7×24 醒著」,只是把這份工作從 Personal AI 控制台拆出去。

vpszap 雲端 Mac mini 提供獨享硬體、約五分鐘開通、SSH/VNC、多區域節點、按天/週/月/季租用且無長約——本機 OpenHuman + 雲端 OpenClaw,不必為閘道單獨買第二台實體 Mac。

vpszap

約 5 分鐘開通雲端 Mac

按天起租、無長約。本地 OpenHuman Skill 實驗 + 雲端 OpenClaw 閘道常駐。