
自2026岁首以来,对于AI编码的扣问迟缓发生变化。
畴前的重心是使用哪个模子、编写什么指示词以及高下文不错多长。天然,这些事情仍然很关键。
然则,从主要参与者的实践中不错了了地看出,仅靠这些无法科罚经久、高质地和抓续运行的问题。
约莫六个月前,我仅使用Claude.md运行一个式样。
若是你写下编码商定、目次结构和技巧栈,AI频频会按预期使命。至少在一运行是这么。
问题在式样变大后运行出现。
质地各异:即使使用换取的指示"添加API端点",文献摈弃和装假处理细节也可能因会话而异。
会话断开:当你要求他们不时昨天的使命时,你得到的兑现忽略了以前的筹算决策。
技巧添加失败:在添加了20多个技巧(如/write-test)后,治理践诺规矩和先决要求变得难以治理。
换句话说,Claude的markdown只不外是一个"肯求"。
莫得机制来检测违纪。
莫得机制来翔实规矩何时变得落伍。
若是你寄予给他们一个经久任务,一个装假意味着他们将不得不重新运行。
这里的问题不单是是指示词的编写方法。
实质上,这源于AI智能体运行的环境莫得被正确筹算这一事实。
因此,自2026岁首以来引起暖和的一个宗旨是Harness Engineering。
Harness Engineering是什么?
什么是harness?
Harness是一匹迅速衣裳的"马具",由缰绳、马鞍和笼头构成——一套圆善的用具,用于勾通一匹浩大但不能揣摸的动物朝着正确的方上前进。
Harness Engineering是什么?
Harness Engineering是对于筹算允许AI智能体重大、自主运行的"环境自己"。
就像你用马具限定马一样,思法是限定AI并勾通它朝着正确的方上前进!
• AI模子就像马。它们很浩大,但不知谈我方要去那儿。
• Harness是一套缰绳、马鞍和笼头。它代表勾通AI朝着正确方上前进的环境、握住和用具的总额。
字据Michael Hashimoto的说法,目标是"创建一个看管AI智能体失败再次发生的环境"。
我不知谈目下是否有普通的行业公认术语,但我照旧运行称之为"Harness Engineering"。它的理念是,每当你发现智能体犯错时,你花时分筹算一个科罚决策,使智能体长久不会再犯一样的装假。
进化的真确体验:
AI智能体限定照旧履历了三个阶段。
咱们将追思每个阶段变得可能的事情和穷乏的东西。
第一阶段:CLAUDE.md时期(指示词工程,2023岁首)
在式样根目次摈弃一个CLAUDE.md文献,并在其中写入你的技巧栈和编码商定。仅此一项就权臣改善了AI的输出。
CLAUDE.md
技巧栈
• Next.js 15(App Router)
• TypeScript 5.x
• Prisma + PostgreSQL
博亚体育2026世界杯中国官方入口商定
• 组件必须放在src/components/中
• API路由必须放在src/app/api/中
• 类型界说必须聚合在src/types/中
当今不错作念什么:AI了解技巧栈并生成妥当商定的代码。
穷乏什么:规矩只是"肯求"。会话收尾时先前的高下文丢失了。当多东谈主设备时,Claude.md的证明注解因智能体而异。
第二阶段:AGENTS.md时期(高下文工程)
CLAUDE.md变得太大,尊龙凯时2026世界杯中国官网无法在单个文献中治理。这导致引入了分辩规矩的设置.claude/rules/。
AGENTS.md算作跨用具的绽放圭臬设备,是一种声明性形色智能体指示(读取哪些文献、使用哪些用具等)的机制。
其本性是不依赖于任何特定用具,不错被Claude Code除外的智能体用具援用。
project/
├── CLAUDE.md # 式样范围的战术(保抓能够)
├── AGENTS.md # 智能体指示(跨用具圭臬)
└── .claude/
└── rules/
├── architecture.md # 架构握住
├── testing.md # 测试战术
└── security.md # 安全要求
当今不错作念什么:规矩的暖和点分辩。咱们不错将智能体援用的高下文中的信息量限定在最低必要水平。AGENTS.md允许咱们岂论使用什么用具齐能圭臬化对智能体的指示。
穷乏什么:即使规矩被写下来,也莫得办法强制践诺它们。会话之间的缅思丢失问题仍然莫得科罚。技巧践诺模范留给智能体,导致质地不一致。
第三阶段:Harness Engineering(2025年底于今)
意志到只是界说规矩是不够的,咱们集成了践诺、考据和缅思机制。这便是harness。
Harness不取代高下文工程;它包含高下文工程。
CLAUDE.md和AGENTS.md齐是harness的一部分。harness树立在这些层之上:技巧、钩子、缅思和考据轮回。

若是不将这三个宗旨视为对立的思法,而是算作翔实力焦点的报复,就更容易领略它们。
Harness之前和之后
这泄露了践诺换取任务"添加用户身份考据API"时有无harness的区别。
之前:仅CLAUDE.md
指示:"兑现用户身份考据API"
收场:
• 在src/app/api/auth/route.ts中兑现了JWT身份考据 ← 宽泛
• 以明文纪录密码 ← 安全违纪
• 装假响应面孔与现存API不一致 ← 商定违纪
• 未包含测试 ← 未达到圭臬
• 忽略了先前决定使用NextAuth.js进行身份考据的战术 ← 高下文聚合性丢失
在五个托付效果中,唯有一个莫得问题。
即便如斯,问题也只是在东谈主工审查时才被发现。
指示:"兑现用户身份考据API"
践诺的限定:
[缅思] 从progress.md读取先前的决策 → 阐述选拔了NextAuth.js
[技巧] 效能/add-feature使命流,按以下规矩兑现:类型界说 → 逻辑 → API → 测试
[钩子] 文献保存时自动使用Biome面孔化代码
[钩子] 立即检测console.log语句和安全违界限式
[反馈] 任务完成前运行类型查验 + 测试 → 0个类型装假,所有这个词测试通过
[缅思] 更新progress.md用于下次会话
收场:
使用NextAuth.js兑现(响应先前的决策) ← 宽泛
妥当安全要求 ← 宽泛
斡旋装假响应面孔 ← 宽泛
达到测试笼罩率圭臬 ← 宽泛
更新经过文献 ← 宽泛
区别很光显。莫得harness,操作是"但愿得到好的输出"。有了harness,结构被筹算为"看管差的输出"。
论断
Harness Engineering是为灵验使用AI智能体而筹算环境。
固然指示词工程是"如何提倡肯求"的艺术,但harness工程是"如何使其使命"的艺术。
在执行附近中,后者的关键性正在稳步加多。
• 规矩由机器强制践诺,而不是通过肯求。
• 缅思应该外部化而不是存储在AI中。
• 筹算时应假定不错复原,而不是假定不会失败。
• 目标是创建团队不错重用的结构,而不是依赖个东谈主的明智忠良。
在AI智能体时期,所需的可能
不是编写更长的指示词,而是
创建更好的harness。
暖和 AI拉呱
若是这篇内容对你有启发,接待暖和「AI拉呱」,获取更多 AI 前沿知悉、实战教程与趋势解读。
下期在看
下期将不时带来该主题的进阶拆解与实操案例,建议先保藏本文尊龙凯时官方平台下载,幸免错过更新。