前言
由于#爆米花独角兽 回归传统 VC 就是想投资#VerticalAgent,也希望自己可以成为这个领域亚洲最好的投资人,所以开始系统转载一些所看所闻,不得不说,不同文章 60% 以上的内容是重复的,30% 是信息茧房,只有 10% 才是真正 insight。需要各位看官自己甄别,各取所需。
其他文章
作者
Muhammed Razeen
Muhammed Razeen 是一位热衷于开发 AI 驱动商业解决方案的软件工程师,擅长数据科学、无监督模型、检索增强生成(RAG)和多代理系统,利用前沿机器学习模型和 AI 工具解决复杂问题。他曾构建具有影响力的产品,如基于日志的基础设施异常检测和根因分析代理,以及本地语言客户服务代理。Razeen 对精益产品开发兴趣浓厚,同时也是多个产品社区的活跃成员。
序
专为特定行业中专业用例或垂直领域的工作流程自动化而构建的 AI 系统,被称为垂直领域 AI 代理(Vertical AI Agents)。
大型语言模型(LLMs)的最新进展为工作流程自动化打开了一扇令人兴奋的大门 ——从自然语言中理解上下文。此外,得益于向量数据库和模型上下文协议(MCP),我们现在可以扩展代理的知识和能力,使其在所属垂直领域中实现近乎自主或完全自主的运作。突然间,我们发现迄今为止许多由人类完成的冗余、重复性任务,现在都可以通过垂直 AI 代理实现完全自动化。
在深入探讨之前,我们先来看一个有趣的例子。
2023 年,我们在一家你最喜爱的快餐连锁餐厅的得来速车道点餐。我们通过入口处的麦克风下单,餐厅员工记录订单并将其输入收银软件。这是一个由人类完成的冗余、重复性任务的典型例子。Lilac Labs(Y Combinator 2024 年夏季班成员)通过语音 AI 将这一流程自动化,每年至少节省 10 万美元的劳动力成本。
01.
AI 代理的类型
根据功能划分,AI 代理可分为以下几类:
反应式代理:基于预定义规则或模式运行。例如,基于关键词响应的聊天机器人,如替代传统 IVR 系统的语音应答聊天机器人。欢迎联系我们,了解我们使用 Abilytics Agentic AI Studio 为金融科技客户构建的 IVR 自动化解决方案。
主动式代理:预测用户需求并主动采取行动,如推荐引擎。智能助理软件和推荐系统属于此类。
自主代理:无需人工干预即可运作,基于学习数据做出决策,如自主交易机器人。
协作式代理:与人类协同工作,提供建议但需人工批准最终行动。例如,代码生成代理和 AI 协同编程工具。
多代理系统:多个 AI 代理协同工作以解决复杂问题,如物流中的群体智能。
02.
确定适合代理化 AI 自动化的场景
许多 AI 技术专家和投资者,如 Andrew Ng(Deeplearning.ai 创始人)和 Jared Freidman(Y Combinator 合伙人格鲁普、Scribd 联合创始人兼前 CTO)预测,我们周围的大量任务将在不久的未来通过 AI 代理实现自动化,其市场规模甚至可能达到 SaaS 市场的 10 倍。但如何判断一项任务或工作流程是否值得自动化?
重复性高、工作量大的任务:消耗大量人力且无需创造力的任务是首选。
数据驱动的流程:AI 依赖数据,结构化或半结构化数据的工作流程最为理想。
基于预测或模式的决策:若任务涉及趋势识别或预测,AI 可高效完成。
自动化投资回报率高:自动化成本应显著低于其创造的价值。对于替代人工的 AI 代理,最简单的 ROI 评估方法是比较被替代的人工成本 —— 只要运行代理的成本更低,就值得投入。
可扩展性潜力:解决方案需具备适应性和可扩展性,以便应用于多个行业和领域。
03.
基于 RAG 的 AI 代理及其架构
检索增强生成(Retrieval-Augmented Generation, RAG)** 是 AI 自动化中最强大的技术之一。基于 RAG 的 AI 代理将大型语言模型(LLMs)的能力与外部知识检索相结合,使其能够提供准确且上下文相关的响应,同时保持信息的时效性。简单来说,就是给 LLM 一本 “教科书”,使其在回答用户查询前可参考相关知识。LLM 的知识受限于其训练数据集,若需扩展其知识,可将知识上下文整理为某种数据格式并存储在数据库中。当用户发送查询时,系统从数据库中提取相关数据,并与查询一起发送给 LLM。还记得引言中提到的向量数据库吗?这正是其用武之地 —— 向量数据库提供高效的语义搜索和大规模信息检索能力,非常适合 RAG 架构。
04.
基于 RAG 的 AI 代理技术架构
用户查询输入:AI 代理接收用户请求。
检索组件:系统搜索外部知识库(如 Pinecone 等向量数据库)以获取相关文档。
增强层:对检索到的信息进行处理和格式化,以优化响应质量。
LLM 处理:将增强后的输入传递给 LLM,后者结合原始查询和检索到的知识生成响应。
响应生成与反馈循环:系统输出最终结果,并通过用户反馈持续优化。
RAG 代理尤其适用于知识密集型或知识上下文频繁变化的行业,如销售、金融、法律和研究领域。
05.
通过工具调用扩展代理能力
以构建代码生成代理为例:根据现有知识,我们可以开发一个编码助手,接收用户需求作为查询并建议代码或代码修改,由用户手动应用到文件中。但如果我们希望代理能够自行应用修改、创建相关文件、删除无用代码片段并在终端中运行所需命令呢?
这就需要工具调用(Tool Calling):当 AI 遇到无法直接回答或执行的查询时,可以 “调用” 专用工具(如计算器、用于网页浏览的搜索引擎工具、允许代理访问文件和文件夹的文件系统工具)来处理用户请求。这极大扩展了代理的功能 —— 过去代理只能提供供用户执行的建议,现在则能直接完成超出 LLM 能力范围的任务。在上述例子中,我们可以将 “文件系统管理工具” 集成到代码生成代理中,使其能够创建、编辑和删除相关文件。
模型上下文协议(Model Context Protocol, MCP)** 是实现 LLM 与工具集成的标准化方法,它作为 AI 代理与外部工具之间的桥梁,赋予代理超越 LLM 独立能力的新功能。
06.
结论
随着我们进入垂直 AI 代理时代,能够识别适合自动化的流程并实施特定领域解决方案的企业将获得显著的竞争优势。通过利用 RAG 和 MCP 等技术,这些专业 AI 系统将变革各行业的工作流程:人类得以专注于创造性和战略性工作,而代理则以前所未有的效率和准确性处理专业、重复性任务。
写在最后
敬请期待。
除此之外,如果在阅读本篇时,略有困难,那是因为您尚未阅读他的前述文章,
●第一篇《AI 算法分析 94 家海外 AI 独角兽》,我们分析了 2015 年后成立的 6500 家 AI 公司, 并且整理出了 94 家海外 AI 独角兽。
●第二篇团队分析《原创研究 | AI 创业:团队决定命运?》。
●第三篇机构分析 《AI 投资新格局:科技巨头主导,VC 退居二线》。
●第四篇,OpenAI 分析《原创研究 | OpenAI 黑帮使命:从邪恶的 OpenAI 手中拯救人类》。
●第五篇中美技术对比《原创研究 | 大国竞争之中美 AI(一)技术篇》。
●第六篇中国独角兽分析《大国竞争 | 中美 AI 对比(二)独角兽篇》。
●第七篇中国 AI 独角兽点评《人工智能:爆米花独角兽与数字庞氏的交响》。
●第八篇国内创业方向分析《大国竞争 | 中美 AI 对比(三) 创业方向和人才来源》。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。