📚 Harness Engineering 兩本書精華整理

Posted Apr 2, 2026

By your_full_name

5 min read

📖 第一本：Claude Code 設計指南

核心主題

「模型不可靠，但系統仍然可以可靠；前提是你把可靠性做進 harness，而不是寄托在模型身上。」

十條原則

  #
  原則
  核心概念

  
  

  1
  **模型是不穩定部件**
  不要當同事，模型不會自動獲得穩定性和責任感


  2
  **Prompt 是控制面**
  System prompt + runtime + tool schema + memory + hook = 控制平面


  3
  **Query Loop 是心跳**
  持續執行循環、輸入治理、流式消費、工具調度、恢復分支、停止條件


  4
  **工具是受管執行介面**
  Shell、Git、網路等危險工具必須被調度、授權、中斷、補账


  5
  **上下文是工作內存**
  長期規則、持久記憶、會話連續性應分層治理；compact 的目標是保住繼續工作的語義底座


  6
  **錯誤路徑是主路徑**
  Prompt too long、max tokens、interrupt、hook 回環、compact 失敗 = 日常天氣


  7
  **恢復的目標是繼續工作**
  截斷後最好的動作是續寫；工程系統的禮貌在於別把用戶困在失敗態裡


  8
  **多代理的意義是分區不確定性**
  研究、實現、驗證放進不同職責容器；coordinator 收束理解


  9
  **驗證必須獨立**
  不能讓系統自己給自己打分；驗證應成為獨立階段


  10
  **團隊制度比個人技巧重要**
  分層 CLAUDE.md、明確 approval、可執行 skill、lifecycle hook、可追蹤 transcript

最後一句話

「Harness Engineering 關心的是：在模型並不可靠的前提下，系統仍然能表現出工程系統應有的行為。」

📖 第二本：Claude Code 和 Codex 的 Harness 設計哲學

核心主題

「兩套系統如何承認模型不可靠，並把這種不可靠驯化成可持續工作的工程秩序。」

殊途同歸

兩者都承認：

Prompt 不等於控制全部
工具必須受約束
長會話需要狀態治理
本地規則必須進入系統
多代理必須有分工和驗證

各表一枝

  面向
  Claude Code
  Codex

  
  

  **哲學**
  運行時共和制
  控制面立憲制


  **主軸**
  從 Query Loop 出發，在運行時處理連續性
  從模塊邊界和控制層顯式化出發


  **權力分配**
  集中在主循環和現場調度
  首先寫進類型、片段、策略、線程和事件系統


  **像**
  從機械經驗裡長出來的系統
  從制度設計裡長出來的系統

對後來者的啟發

  錯誤
  解決

  以為只要學功能表就夠了
  先決定主要矛盾是什麼（失控 vs 規則散乱）

  把兩者特性不加判斷地拼在一起
  等主矛盾穩住，再逐步補另一邊

最終判斷

「籠子的位置決定了系統會長成什麼樣。」

📊 總結

  書籍
  重點

  **第一本**
  Claude Code 的運行時結構設計原則

  **第二本**
  Claude Code vs Codex 的架構哲學差異

兩本書都在問同一個問題：如何把不穩定的模型收束進可持續運行的工程秩序。

整理來源：Harness Engineering 書籍 GitHub

This post is licensed under CC BY 4.0 by the author.