尊龙凯时官方平台下载 如何构建高出99%东谈主的Harness Engineer

来源:尊龙凯时2026世界杯中国官网 作者: 发布: 浏览:52

自2026岁首以来,对于AI编码的扣问迟缓发生变化。

畴前的重心是使用哪个模子、编写什么指示词以及高下文不错多长。天然,这些事情仍然很关键。

然则,从主要参与者的实践中不错了了地看出,仅靠这些无法科罚经久、高质地和抓续运行的问题。

约莫六个月前,我仅使用Claude.md运行一个式样。

若是你写下编码商定、目次结构和技巧栈,AI频频会按预期使命。至少在一运行是这么。

问题在式样变大后运行出现。

质地各异:即使使用换取的指示"添加API端点",文献摈弃和装假处理细节也可能因会话而异。

会话断开:当你要求他们不时昨天的使命时,你得到的兑现忽略了以前的筹算决策。

技巧添加失败:在添加了20多个技巧(如/write-test)后,治理践诺规矩和先决要求变得难以治理。

换句话说,Claude的markdown只不外是一个"肯求"。

莫得机制来检测违纪。

莫得机制来翔实规矩何时变得落伍。

若是你寄予给他们一个经久任务,一个装假意味着他们将不得不重新运行。

这里的问题不单是是指示词的编写方法。

实质上,这源于AI智能体运行的环境莫得被正确筹算这一事实。

因此,自2026岁首以来引起暖和的一个宗旨是Harness Engineering。

Harness Engineering是什么?

什么是harness?

Harness是一匹迅速衣裳的"马具",由缰绳、马鞍和笼头构成——一套圆善的用具,用于勾通一匹浩大但不能揣摸的动物朝着正确的方上前进。

Harness Engineering是什么?

Harness Engineering是对于筹算允许AI智能体重大、自主运行的"环境自己"。

就像你用马具限定马一样,思法是限定AI并勾通它朝着正确的方上前进!

• AI模子就像马。它们很浩大,但不知谈我方要去那儿。

• Harness是一套缰绳、马鞍和笼头。它代表勾通AI朝着正确方上前进的环境、握住和用具的总额。

字据Michael Hashimoto的说法,目标是"创建一个看管AI智能体失败再次发生的环境"。

我不知谈目下是否有普通的行业公认术语,但我照旧运行称之为"Harness Engineering"。它的理念是,每当你发现智能体犯错时,你花时分筹算一个科罚决策,使智能体长久不会再犯一样的装假。

进化的真确体验:

AI智能体限定照旧履历了三个阶段。

咱们将追思每个阶段变得可能的事情和穷乏的东西。

第一阶段:CLAUDE.md时期(指示词工程,2023岁首)

在式样根目次摈弃一个CLAUDE.md文献,并在其中写入你的技巧栈和编码商定。仅此一项就权臣改善了AI的输出。

CLAUDE.md

技巧栈

• Next.js 15(App Router)

• TypeScript 5.x

• Prisma + PostgreSQL

博亚体育2026世界杯中国官方入口

商定

• 组件必须放在src/components/中

• API路由必须放在src/app/api/中

• 类型界说必须聚合在src/types/中

当今不错作念什么:AI了解技巧栈并生成妥当商定的代码。

穷乏什么:规矩只是"肯求"。会话收尾时先前的高下文丢失了。当多东谈主设备时,Claude.md的证明注解因智能体而异。

第二阶段:AGENTS.md时期(高下文工程)

CLAUDE.md变得太大,尊龙凯时2026世界杯中国官网无法在单个文献中治理。这导致引入了分辩规矩的设置.claude/rules/。

AGENTS.md算作跨用具的绽放圭臬设备,是一种声明性形色智能体指示(读取哪些文献、使用哪些用具等)的机制。

其本性是不依赖于任何特定用具,不错被Claude Code除外的智能体用具援用。

project/

├── CLAUDE.md # 式样范围的战术(保抓能够)

├── AGENTS.md # 智能体指示(跨用具圭臬)

└── .claude/

└── rules/

├── architecture.md # 架构握住

├── testing.md # 测试战术

└── security.md # 安全要求

当今不错作念什么:规矩的暖和点分辩。咱们不错将智能体援用的高下文中的信息量限定在最低必要水平。AGENTS.md允许咱们岂论使用什么用具齐能圭臬化对智能体的指示。

穷乏什么:即使规矩被写下来,也莫得办法强制践诺它们。会话之间的缅思丢失问题仍然莫得科罚。技巧践诺模范留给智能体,导致质地不一致。

第三阶段:Harness Engineering(2025年底于今)

意志到只是界说规矩是不够的,咱们集成了践诺、考据和缅思机制。这便是harness。

Harness不取代高下文工程;它包含高下文工程。

CLAUDE.md和AGENTS.md齐是harness的一部分。harness树立在这些层之上:技巧、钩子、缅思和考据轮回。

若是不将这三个宗旨视为对立的思法,而是算作翔实力焦点的报复,就更容易领略它们。

Harness之前和之后

这泄露了践诺换取任务"添加用户身份考据API"时有无harness的区别。

之前:仅CLAUDE.md

指示:"兑现用户身份考据API"

收场:

• 在src/app/api/auth/route.ts中兑现了JWT身份考据 ← 宽泛

• 以明文纪录密码 ← 安全违纪

• 装假响应面孔与现存API不一致 ← 商定违纪

• 未包含测试 ← 未达到圭臬

• 忽略了先前决定使用NextAuth.js进行身份考据的战术 ← 高下文聚合性丢失

在五个托付效果中,唯有一个莫得问题。

即便如斯,问题也只是在东谈主工审查时才被发现。

指示:"兑现用户身份考据API"

践诺的限定:

[缅思] 从progress.md读取先前的决策 → 阐述选拔了NextAuth.js

[技巧] 效能/add-feature使命流,按以下规矩兑现:类型界说 → 逻辑 → API → 测试

[钩子] 文献保存时自动使用Biome面孔化代码

[钩子] 立即检测console.log语句和安全违界限式

[反馈] 任务完成前运行类型查验 + 测试 → 0个类型装假,所有这个词测试通过

[缅思] 更新progress.md用于下次会话

收场:

使用NextAuth.js兑现(响应先前的决策) ← 宽泛

妥当安全要求 ← 宽泛

斡旋装假响应面孔 ← 宽泛

达到测试笼罩率圭臬 ← 宽泛

更新经过文献 ← 宽泛

区别很光显。莫得harness,操作是"但愿得到好的输出"。有了harness,结构被筹算为"看管差的输出"。

论断

Harness Engineering是为灵验使用AI智能体而筹算环境。

固然指示词工程是"如何提倡肯求"的艺术,但harness工程是"如何使其使命"的艺术。

在执行附近中,后者的关键性正在稳步加多。

• 规矩由机器强制践诺,而不是通过肯求。

• 缅思应该外部化而不是存储在AI中。

• 筹算时应假定不错复原,而不是假定不会失败。

• 目标是创建团队不错重用的结构,而不是依赖个东谈主的明智忠良。

在AI智能体时期,所需的可能

不是编写更长的指示词,而是

创建更好的harness。

暖和 AI拉呱

若是这篇内容对你有启发,接待暖和「AI拉呱」,获取更多 AI 前沿知悉、实战教程与趋势解读。

下期在看

下期将不时带来该主题的进阶拆解与实操案例,建议先保藏本文尊龙凯时官方平台下载,幸免错过更新。