📚 Harness Engineering 兩本書精華整理
📚 Harness Engineering 兩本書精華整理
📖 第一本:Claude Code 設計指南
核心主題
「模型不可靠,但系統仍然可以可靠;前提是你把可靠性做進 harness,而不是寄托在模型身上。」
十條原則
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
#
原則
核心概念
1
**模型是不穩定部件**
不要當同事,模型不會自動獲得穩定性和責任感
2
**Prompt 是控制面**
System prompt + runtime + tool schema + memory + hook = 控制平面
3
**Query Loop 是心跳**
持續執行循環、輸入治理、流式消費、工具調度、恢復分支、停止條件
4
**工具是受管執行介面**
Shell、Git、網路等危險工具必須被調度、授權、中斷、補账
5
**上下文是工作內存**
長期規則、持久記憶、會話連續性應分層治理;compact 的目標是保住繼續工作的語義底座
6
**錯誤路徑是主路徑**
Prompt too long、max tokens、interrupt、hook 回環、compact 失敗 = 日常天氣
7
**恢復的目標是繼續工作**
截斷後最好的動作是續寫;工程系統的禮貌在於別把用戶困在失敗態裡
8
**多代理的意義是分區不確定性**
研究、實現、驗證放進不同職責容器;coordinator 收束理解
9
**驗證必須獨立**
不能讓系統自己給自己打分;驗證應成為獨立階段
10
**團隊制度比個人技巧重要**
分層 CLAUDE.md、明確 approval、可執行 skill、lifecycle hook、可追蹤 transcript
最後一句話
「Harness Engineering 關心的是:在模型並不可靠的前提下,系統仍然能表現出工程系統應有的行為。」
📖 第二本:Claude Code 和 Codex 的 Harness 設計哲學
核心主題
「兩套系統如何承認模型不可靠,並把這種不可靠驯化成可持續工作的工程秩序。」
殊途同歸
兩者都承認:
Prompt 不等於控制全部
工具必須受約束
長會話需要狀態治理
本地規則必須進入系統
多代理必須有分工和驗證
各表一枝
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
面向
Claude Code
Codex
**哲學**
運行時共和制
控制面立憲制
**主軸**
從 Query Loop 出發,在運行時處理連續性
從模塊邊界和控制層顯式化出發
**權力分配**
集中在主循環和現場調度
首先寫進類型、片段、策略、線程和事件系統
**像**
從機械經驗裡長出來的系統
從制度設計裡長出來的系統
對後來者的啟發
1
2
3
4
5
6
7
8
9
10
11
12
錯誤
解決
以為只要學功能表就夠了
先決定主要矛盾是什麼(失控 vs 規則散乱)
把兩者特性不加判斷地拼在一起
等主矛盾穩住,再逐步補另一邊
最終判斷
「籠子的位置決定了系統會長成什麼樣。」
📊 總結
1
2
3
4
5
6
7
8
9
10
11
12
書籍
重點
**第一本**
Claude Code 的運行時結構設計原則
**第二本**
Claude Code vs Codex 的架構哲學差異
兩本書都在問同一個問題:如何把不穩定的模型收束進可持續運行的工程秩序。
This post is licensed under CC BY 4.0 by the author.