Post

📚 Harness Engineering 兩本書精華整理

📚 Harness Engineering 兩本書精華整理

📖 第一本:Claude Code 設計指南

核心主題

「模型不可靠,但系統仍然可以可靠;前提是你把可靠性做進 harness,而不是寄托在模型身上。」

十條原則

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
  #
  原則
  核心概念

  
  

  1
  **模型是不穩定部件**
  不要當同事,模型不會自動獲得穩定性和責任感


  2
  **Prompt 是控制面**
  System prompt + runtime + tool schema + memory + hook = 控制平面


  3
  **Query Loop 是心跳**
  持續執行循環、輸入治理、流式消費、工具調度、恢復分支、停止條件


  4
  **工具是受管執行介面**
  Shell、Git、網路等危險工具必須被調度、授權、中斷、補账


  5
  **上下文是工作內存**
  長期規則、持久記憶、會話連續性應分層治理;compact 的目標是保住繼續工作的語義底座


  6
  **錯誤路徑是主路徑**
  Prompt too long、max tokens、interrupt、hook 回環、compact 失敗 = 日常天氣


  7
  **恢復的目標是繼續工作**
  截斷後最好的動作是續寫;工程系統的禮貌在於別把用戶困在失敗態裡


  8
  **多代理的意義是分區不確定性**
  研究、實現、驗證放進不同職責容器;coordinator 收束理解


  9
  **驗證必須獨立**
  不能讓系統自己給自己打分;驗證應成為獨立階段


  10
  **團隊制度比個人技巧重要**
  分層 CLAUDE.md、明確 approval、可執行 skill、lifecycle hook、可追蹤 transcript

最後一句話

「Harness Engineering 關心的是:在模型並不可靠的前提下,系統仍然能表現出工程系統應有的行為。」

📖 第二本:Claude Code 和 Codex 的 Harness 設計哲學

核心主題

「兩套系統如何承認模型不可靠,並把這種不可靠驯化成可持續工作的工程秩序。」

殊途同歸

兩者都承認:

  • Prompt 不等於控制全部

  • 工具必須受約束

  • 長會話需要狀態治理

  • 本地規則必須進入系統

  • 多代理必須有分工和驗證

各表一枝

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
  面向
  Claude Code
  Codex

  
  

  **哲學**
  運行時共和制
  控制面立憲制


  **主軸**
  從 Query Loop 出發,在運行時處理連續性
  從模塊邊界和控制層顯式化出發


  **權力分配**
  集中在主循環和現場調度
  首先寫進類型、片段、策略、線程和事件系統


  **像**
  從機械經驗裡長出來的系統
  從制度設計裡長出來的系統

對後來者的啟發

1
2
3
4
5
6
7
8
9
10
11
12
  錯誤
  解決

  
  

  以為只要學功能表就夠了
  先決定主要矛盾是什麼(失控 vs 規則散乱)


  把兩者特性不加判斷地拼在一起
  等主矛盾穩住,再逐步補另一邊

最終判斷

「籠子的位置決定了系統會長成什麼樣。」

📊 總結

1
2
3
4
5
6
7
8
9
10
11
12
  書籍
  重點

  
  

  **第一本**
  Claude Code 的運行時結構設計原則


  **第二本**
  Claude Code vs Codex 的架構哲學差異

兩本書都在問同一個問題:如何把不穩定的模型收束進可持續運行的工程秩序。

整理來源:Harness Engineering 書籍 GitHub

This post is licensed under CC BY 4.0 by the author.