catalog/repos/10xchengtu--harness-engineering.md

2.6 KiB
Raw Blame History

AI代理工程基础设施

AI代理 工程基础 上下文工程 代码规范 多代理架构

harness-engineering

一个用于搭建和改进 harness 工程agent skill —— 让 AI 代理在你的代码库中高效运作的基础设施。

Harness = AI 代理的操作系统。 模型是 CPU上下文窗口是内存harness 是操作系统。

安装

npx skills add 10xChengTu/harness-engineering

功能介绍

这个 skill 教会你的 AI 代理如何为任意项目构建和维护 harness 层 —— 包括 AGENTS.mddocs/ 目录、Lint 规则、约束条件和评估系统,它们共同决定代理的输出质量。

核心原则: 从简单开始,仅在必要时增加复杂度。每个 harness 组件都编码了一个关于"模型独立完成时的不足"的假设。

触发场景

你说… Skill 执行…
"为 AI 代理配置这个项目" 完整的项目 harness 初始化
"创建一个 AGENTS.md" 搭建入口文件及文档目录结构
"代理总是忽略代码规范" 诊断 harness 缺口,而非模型问题
"为什么它总把 X 搞错?" 定位 harness 层的根本原因
"让代理在这个代码库上表现更好" 评估并逐步改进 harness

涵盖内容

该 skill 包含 7 个参考模块,代理按需查阅:

模块 涵盖内容
项目配置 AGENTS.md 结构、docs/ 目录、设计说明、初始化脚本
上下文工程 代理可见内容、渐进式信息披露、工作状态管理
约束与护栏 Linter、类型系统、架构强制执行、安全自主边界
多代理架构 代理职责分离、协调协议、委派模式
评估与反馈 测试代理输出、评分、可观测性、反馈闭环
长期任务 进度追踪、上下文重置、交接产物
问题诊断 代理表现不佳时的症状 → 根因映射

为什么要用它

代理输出质量差,几乎总是 harness 问题,而非模型问题。当你的代理无视规范、做出错误假设或产出不一致的结果时,解决方案是更好的上下文、约束和反馈闭环,而不是换一个更大的模型。

这个 skill 将真实代理部署中积累的模式与反模式编码固化,让你无需重复踩坑。

兼容性

适用于所有支持 Agent Skills 规范 的代理,包括 Claude Code、OpenCode、Cursor、Codex、Cline、GitHub Copilot 以及 40 余种其他工具