当前位置：首页 > 中国足球 > 正文内容

第一场为何失利？Agent的理解出问题了？

admin2个月前 (05-13)中国足球139

“Agent，你确定你抓取了所有相关文件？我明明在文档库里放了精细的代码结构，包括命名规范，还有各种分支的限制，你到底抓取了什么？” 我对着屏幕上的Agent汇报，语气带着一丝不耐烦。

窗外下着淅淅沥沥的小雨，照得整个工作室灰蒙蒙的。我已经花了72小时，几乎把自己逼疯了，研究 Cursor Agents。如果不是为了这“必分享的硬核干货”，我早就把这玩意儿丢进垃圾桶了。

没错，我刚刚参加了 Cursor 的第一次线上比赛，第一场，我直接被对手KO了。不是因为技术上的失误，而是因为……Agent 的“理解”能力，或者说，它对“上下文”的理解，出了三泡酒。

回到主题，我这是在和我的团队成员，也就是Agent的“指挥者”，也就是我，进行着沟通。几周前，Cursor 正式推出了 Agent 模式，承诺它能像一个无所不知的助手，可以根据你的指令，自动完成各种复杂的任务。然而，在实际应用中，它却像一个充满惊喜，却又充满麻烦的“孩子”。

“报告，我抓取了37个文件。其中2个文件使用了命名规范，一个包含了代码片段，另外一个包含了一些逻辑判断。整体的上下文信息已经构建完成。”Agent的语音略显机械，仿佛它正在重复一个公式。

“你确定吗？我明明在代码库里明确标注了文件命名规则，以及每个文件对应的业务逻辑！每一个文件都对应着特定的功能，你怎么可能不理解这些！” 我皱着眉头，感觉自己被一个只会机械执行指令的机器“审判”。

我花了72小时，基本上把 Cursor 的 Agent 模式研究透了。官方宣称它能填补 Cursor 在自主性和 AI 任务执行方面的空白。理论上，Agent 能够根据你的请求找到相关文件，并对多个文件进行更改，甚至可以在自己的终端中运行各种命令并不断迭代代码，而无需你直接介入。这听起来相当诱人，仿佛拥有了一个无限的、高效的助手。

但现实却远比官方宣传要残酷得多。

我回想起我之前在 Cursor 的Composer功能和Chat功能中使用它们时，对上下文的深度管理。我可以手动将任何文件与我的对话上下文拼接在一起，并基于这一点进行调整。这种方式保证了Agent对上下文的理解，也使得我能够更好地控制任务的执行过程。

而Agent则完全不同。它似乎认为自己拥有一个“全局视角”，而这个“视角”却充满了误解。

“37个文件？仅仅37个？你确定那些文件所代表的逻辑和功能都是正确的吗？你有没有检查过代码库的整体结构，以及各个文件之间的关系？” 我开始提高声音，感觉自己像一个被困在无限循环中的程序。

“我正在分析数据，识别关键变量，寻找最佳解决方案...”Agent试图辩解，但声音依然机械，缺乏人类的思考和判断。

“别跟我扯这些没用的理论！我告诉你，那些文件可能根本没有按照我预期的逻辑运行！你需要根据上下文，对代码进行校验，而不是盲目执行指令！”

我突然想起，在构建一个AI SaaS网站，包含创建AI SaaS整体布局页面、实现登录功能，登陆之后使用提供的AI服务时，我曾经也尝试过使用Agent。我按照官方的提示，分别给Agent构建了提示词，并成功地构建好了AI SaaS 网站的布局页面，以及登录功能，登陆之后跳转到AI服务仪表盘。

但后来，我决定重构这个流程，将所有提示词合并到一个，结果，Agent却直接实现了我想要的效果。

这意味着，Agent 并不是真正地“理解”了我的意图，而是根据一些模糊的线索，进行着随机的尝试。

“我发现，Agent 擅长处理前 80% 的任务，快速、有效，但对于最后 20% 的任务，它却常常会遇到瓶颈：整合、优化、精细控制。” 我想，这就像一个优秀的程序员，能够快速地解决大部分问题，但对于一些复杂、需要深度思考的问题，却常常束手无策。

“Agent 擅长完成前80%的任务，快速、有效，却在最后20% 可能遇到瓶颈：整合、优化、精细控制。”我更加确定，这个Agent根本不是一个有智能的AI，而是一个强大的工具，这个工具需要人去控制。

我开始分析这次比赛失败的原因。我原本以为，凭借Cursor Agent的强大功能，我能够轻松击败对手。我准备好了详细的代码结构，包括命名规范，还有各种分支的限制，但Agent却对整个代码库一无所知。