AI Agent
我也是在学习了很久之后,才理解 AI Agent 是个什么东西。对我而言它是一种能够自主执行任务的人工智能系统。通常以现在的大模型(如 GPT、Claude 等)为基础,结合一些工具(如搜索引擎、数据库、API 等)来自动化复杂任务的执行。
Cursor、VSCode、Windsurf 这些编辑器都集成了 Agent 模式,可以让用户通过自然语言与代码进行交互。用户可以用自然语言描述想要实现的功能,AI Agent 会自动生成相应的代码并执行。我正好最近订阅了 VSCode Copilot 专业版,就找时间体验了一下。首先说下结论:非常好使,我用了两天时间通过 Agent 模式把我的博客网站重构完成了。
我用 Agent 的场景主要有几个:
- 功能实现:自然语言提问,AI Agent 会自动生成相应的代码。例如我说“帮我设计一个导航栏组件,使用 TailwindCSS 和 Astro 实现”,基本上能得到相当可用的代码,而且 AI 会帮你考虑响应式、主题适配等问题。
- 代码重构:当我完成一个大页面的开发工作之后,我会让它“结合组件拆分最佳实践,按照功能将本页面拆分为组件”,它会自动帮你找拆分并找到依赖关系进行重构,我只需要点几次“继续”按钮。
- 代码替换:这也是我用到的比较多的功能,你可以这样说“使用 dayjs 处理项目中的时间格式化”,而且也可以指定格式,比如“使用 dayjs 处理项目中的时间格式化,格式为 YYYY-MM-DD”,它会自动帮你替换掉项目中所有的时间格式化代码。
- 修改错别字:我在写博客文章的时候,偶尔会出现错别字,这个时候我就会让它“帮我检查一下文章中的错别字”,它会自动帮你检查出错别字并给出修改建议。
这是我这两天用的比较多的功能,当然还有很多其他的功能,比如代码审查、bug 修复等。总的来说,VSCode 的 Agent 的已经让我在开发中省去了很多繁琐的工作,让我可以更专注于内容。
当然,痛点也是有的:
- 速度:速度上还是有点慢,尤其是当你需要多次交互的时候,等待时间会比较长。
- 代码质量:AI 生成的代码还是存在小瑕疵,比如 JS 的逻辑可能会改来改去。
- Token/Rate Limit 限制:即使是专业版,也会有 Token 和 Rate Limit 的限制,尤其是当你涉及到的代码量比较大的时候,所以最好做一下代码拆分。
技术速递
- 🎥 How I use LLMs - 这是大神 Andrej Karpathy(OpenAI 创始团队成员)制作的一期视频,主要展示了 LLMs 的应用场景,例如 Cursor、生成图片和视频、Claude 预览模式等等。
- 🛠️ Manus - 据官网介绍是一款通用 AI 助手,目前采用邀请码制,谁能送我一个邀请码。没体验过,不好评价。
本周阅读
《拼凑真相:认清纷繁世界的十大数据法则》——蒂姆·哈福德——⭐⭐⭐
这本书我打 3 星吧,内容有水分,翻译有点让我困惑,不知道为什么经济理财领域的一本书,会出现“不乱于心,不困于情”、“欲穷千里目,更上一层楼”这种翻译,很难让人一眼看出来表达的是什么意思。不过书里的一些法则放到当下还是很有启发的,摘录一下:
- 不要被情绪带偏:遇到事情停下来思考一下,反省自己是否一心想得到想要的结果
- 保持好奇心:多问为什么会让我们知道什么可以相信,什么值得质疑,保持开放的心态,别一上来就质疑一切
- 多视角看问题:鸟瞰视角和蠕虫视角,从不同的角度看问题。鸟瞰视角代表着宏观数据和大背景;蠕虫视角意味着我们从自身的经历出发,关注细节
- 学会看数据
- 数据需要对比,有参照才有意义(股价、GDP、人口)
- 避免因为认知偏差而漏掉一些数据(幸存者偏差、黑天鹅事件)
- 给没有信任度和透明性的数据打一个问号(大数据、推荐算法、AI)
结语
AI Agent 很强大,并非完美,理性对待 AI。多多尝试新东西,找到最适合自己的工具和方式才能提高效率。