GenAI 去年创造了约 30 亿美元收入,而 SaaS 用了 10 年才达到这个数字。
编译:Lavida
2022 年 9 月,红杉美国发布的 Generative AI:A Creative New World 研究引发了第一波关于 Generative AI 的讨论,而紧接着 ChatGPT、GPT-4 的问世加速了 GenAI 领域的发展。在红杉美国的 AI Ascent 大会上,几位合伙人就对过去这一年半中 GenAI 的发展进行了相当系统的回顾,GenAI 领域的进步远比人们预想当中要更迅猛。
和过去几轮 AI 不一样的是,GenAI 在过去一年中已经创造出了惊人的成绩:GenAI 在出现后一年间创造的总收入约为 30 亿美元,这还不包括科技巨头和云厂商间接通过 AI 产生的收入,而 SaaS 行业花了近 10 年才达到这个水平。具体落地上,在客服、法律、写作等行业或场景中,GenAI 已经在实打实地创造出收益。
虽然应用层的爆发并没有一年前市场预测的那样乐观,但红杉美国的几位合伙人也指出,随着更加智能的 foundation model 出现,例如 Sora、Claude-3 等近期陆续推出的新模型,接下来 AI 产品的 PMF 周期一定会加速。并且,新技术从出现到成熟需要一个过程,革命性应用的出现同样需要时间,移动互联网时代, Instagram 和 Doordash 这样具有时代代表性的应用都是在 iPhone 和 App Store 推出几年后才出现的。
以下为本文目录,建议结合要点进行针对性阅读。
01 Why Now:从云计算到 AI
02 当下:AI is Everywhere
03 未来:Everything is Generated
过去一年中市场已经经历了一个完整的 AI Hype Cycle:有泡沫期的过度炒作,也有低谷期的失望和质疑,而现在市场正在重新爬升到生产力平稳期(Plateau of Productivity)。人们逐渐意识到, LLM 和 AI 真正产生作用是通过创造、推理和交互三个环节实现的,这些能力也被融合到了各个领域的应用中为我们所用。
AI 具备的三项能力:创造、推理和交互
AI 已经拥有了创造和推理能力,例如 GenAI 可以生成文本、图像和音视频,chatbot 可以回答我们的问题,或者像 Agent 一样帮我们进行多步骤任务规划,这是以前的任何软件都无法做到的,也意味着软件已经可以同时处理右脑的创造性任务和左脑的逻辑性任务——这是软件有史以来第一次能够以类人的方式与人类进行交互,对商业模式的意义非常重大。
红杉合伙人 Pat Grady 通过回顾过去 20 年来云行业的发展回答了「为什么 AI 技术为什么在近期爆发」。
Pat 认为,云计算是技术领域的一次重大转变,它颠覆了过去的技术格局,并因此带来了新的商业模式、应用程序以及人机交互方式。在云行业还处于早期的 2010 年,全球软件的总市值约为 3500 亿美元,其中云软件只占了大概 60 亿。但到了去年,软件市场的总规模已经从 3500 亿美元增长到 6500 亿美元,而云软件的收入达到了 4000 亿美元。这意味着在 15 年间,云软件的 CAGR 保持在了 40%,实现了惊人的增长。
而云之于 AI 是一个很好的类比。云能取代传统软件就是因为具备了与人类更相似的交互能力;同样,现在的 AI 技术在创造力、逻辑推理和人机交互等方面又达到了新的高度。未来,AI 的一大机遇将是软件替代服务。如果能够实现这一变革,AI 的市场潜力将不是数千亿美元,而是数十万亿美元级别。可以说,我们正站在有史以来最伟大、最有无限价值创造潜力的时间点上。
1960s 后的历次技术变迁以及代表公司
至于为什么认为当下是参与 AI 的重要时点,Pat Grady 提到,红杉从创立以来见证了历史上的数次技术变迁、也受益于此,在这个过程中,团队也对于不同技术浪潮之间如何互相影响、推动世界向前发展有着清晰的认知:
每一次技术浪潮都是在前一次的基础上叠加和演进的。AI 的概念虽然早在 20 世纪 40 年代就已出现,但直到最近几年 AI 才从想法和梦想变为现实,开始商业化,并在人们日常生活中解决实际问题,实现这个突破的前提包括:
Pat Grady 认为,AI 将会成为未来 10-20 年的主题,红杉对此有强烈的信念,尽管这个假设还有待证实。
从 Cloud 和 Mobile 到 AI 时代的代表性公司
关于 AI 未来的行业格局,Pat Grady 先总结了 Cloud 和 Mobile 时代出现的收入超过 10 亿美元的公司(如上图左侧),虽然 AI 代表的最右侧现在几乎还是空白,但也象征在当前市场中巨大的的潜在价值和机会。Pat Grady 预测,在未来的 10-15 年,右边的空白就会被 40-50 个新的公司 logo 填满,正是让他们感到兴奋的机会所在。
红杉合伙人 Sonya Huang 首先从客户服务、法律、编程和视频生成等领域回顾了过去一年 AI 的发展。
AI 应用的各个领域
2023 年是 AI 历史上相当重要的一年。ChatGPT 问世的一年半后,整个行业一直发生着剧烈的变化。去年大家讨论的还是 AI 将如何彻底改变不同领域并提供惊人的生产力提升,而现在 AI 已经成为人们关注的焦点。
Klarna CEO Sebastian Siemiatkowski X 推文
在客服领域,Klarna 的 CEO Sebastain 曾经公开表示,现在 Klarna 已经在用 OpenAI 来处理 2/3 的客服查询,AI 替代了相当于 700 名全职客服的工作。目前全球有数千万的 call center agent,结合这一背景下,Sonya 认为 AI 已经在客服市场找到了 PMF。
法律服务在一年前被认为是最不愿拥抱科技、最不愿意承担风险的行业,现在已经出现了像 Harvey 这样的公司,可以把律师从日常 paperword 到高级分析的很多工作自动化。
再比如在编程领域,经过一年时间,我们已经从一年前用 AI 写代码发展快速发展到拥有独立的 AI 软件工程师。还有像 HeyGen 这样的 AI 视频生成公司,能帮人生成 Avatar 参与 Zoom 会议。
Sequoia 的 Pat Grady 用 HeyGen 生成的 Avatar 在 Zoom 会议中的影像呈现
AI 和 SaaS 收入增速对比
根据估算,GenAI 在出现后一年间创造的总收入约为 30 亿美元,这还不包括科技巨头和云服务厂商通过 AI 产生的收入。作为对比,SaaS 花了近 10 年才达到这个水平。也正是因为这样的速度和规模让大家更确信 GenAI 会持续存在。
主要 GenAI 产品的实际用户规模
从上图也可以看出,客户对 AI 需求不仅限于一两个应用,而是方方面面的。很多人都知道 ChatGPT 有多少用户,但当在观察许多 AI 应用的收入和使用数据时,会发现现在不管是 to B 还是 to C,初创公司还是已有的科技公司,很多 AI 产品都在各个行业找到了合适的 PMF,应用场景已经非常多样化。
foundation model 和应用层的融资占比
从投资分布上来看,资金分配不均衡是一个显著问题。如果把 GenAI 比作一个蛋糕,蛋糕底层是 foundation model ,中间是开发者工具和 infra,顶层是应用。一年前,人们的预期是:因为 foundation model 层的进步,所以应用层会涌现出大量新公司。但实际情况却相反。越来越多的 foundation model 公司出现并融到了大量资金,而应用层似乎才刚刚起步。
红杉美国合伙人 David 在去年发表了一篇 AI's $200 Billion Question 的讨论。如果我们看目前投入到 GPU 上的投资,去年只是在 Nvidia 的芯片上就花了大概 500 亿美元,但目前可以确认的 AI 行业收入只有 30 亿美元。这些数据表明, AI 产业目前还处于很早期的阶段,投入产出比很低,还有很多现实问题需要解决。
AI 产品和移动应用的 MAU、DAU 和次月留存率
尽管 AI 产品的用户数量和收入看起来很可观,但它在 DAU、MAU 和次月留存率方面还远低于移动应用。很多用户都在用户调研中提到 AI 应用的预期与体验之间存在差距。还有一些产品 demo 看起来很炫酷,实际用起来却不怎么样,这也导致用户没有能更长期使用下去。
基础模型能力提升
这些虽然是客观存在的问题,但更是机遇。去年企业对 GPU 的大量投资带来了更加智能的 foundation model,最近出现的 Sora、Claude-3 和 Grok 等都显示出 AI 的基准智能水平正在提高,因此未来 AI 产品的 PMF 将加速提升。
iPhone 和 App Store 的发展演变
新技术从出现到成熟需要一个过程,开创性应用的出现同样需要时间。以 iPhone 为例,App Store 初期的许多应用都很原始,只是展示新技术,并没有真正解决问题或创造价值。像手电筒或者类似 beer drinking 这种小游戏,后来都变成了系统内置应用或者可有可无的小工具。而 Instagram 和 Doordash 这样真正具有影响力的应用都是在 iPhone 和 App Store 推出几年后才出现的。
AI 技术正在经历类似的发展过程。现在市场上的许多 AI 应用都还处于 demo 或早期探索阶段,就像 App Store 的早期应用一样,但也许下一代的传奇公司已经出现。
AI 的应用场景已经非常广泛,其中 AI 客户支持、AI Friendship(AI 虚拟陪伴) 和企业知识是非常典型的三个领域。客服是第一批在企业中真正实现产品 PMF 的 AI 应用场景之一。Klarna 不是一个例外,而是一个普遍趋势。AI friendship 是 AI 最令人惊喜的应用场景之一,它的用户数量和使用指标表明,用户对此有着强烈的喜爱。此外,跨部门、跨职能的企业内部知识共享(Horizontal enterprise knowledge)应用也有很大的潜力。
基于以上的分析,红杉的几位合伙人也对 2024 年的 AI 发展做出了预测。
预测一:Copilot 将逐渐向 AI Agent 转变。
2024 年,AI 将从辅助人类的 Copilot 转变为真正能替代一些人类工作的 Agent。AI 将更像是一个同事,而不仅仅是一个工具,这点在软件工程、客服等行业已经初步显现。
预测二:模型将具备更强的规划和推理能力。
很多人批评 LLM 只是重复以往数据中的统计模式,而非真正地进行深入的思考和逻辑推理,这种状况将会通过新的研究方向得到改善。一些研究正在尝试让模型更好地进行推理环节计算和游戏式价值迭代(gameplay-style value iteration),这些方法可以让模型在做出决策前有一定的「思考时间」,这些尝试预计将在明年让 AI 更有能力执行更高级别的认知任务,例如规划和推理。
游戏式价值迭代(gameplay-style value iteration)是从强化学习领域借鉴来的一个概念,指模型能够评估不同行动的长期价值,并根据这些价值来计划未来的行动,类似于下棋或玩游戏时的策略思考。
预测三:LLM 准确度将更高,从主要用于从 To-C 娱乐应用逐渐扩展到企业级应用。
在 To-C 应用场景中,用户对于 AI 出现错误这件事并不会特别在意,因为人们主要用 AI 来进行娱乐,但当 AI 用于企业应用,尤其是在医疗、国防等高风险领域时,准确性和可靠性就变得至关重要。研究者正在开发 RLHF、Prompt Training 和向量数据库等各种工具和技术,来帮助 LLM 实现「五个九」(99.999% 的正常运行时间)的高准确度和可靠性。
预测四:大量 AI Prototype 和实验项目将投入使用。
2024 年预计将有许多 AI 原型和实验项目进入市场。和实验阶段不同,产品真正开始被用户使用时,就需要考虑延迟时间、成本、模型所有权以及数据所有权的管理等一系列因素,这也意味着计算的重心预计将从预训练转向推理过程。因此 2024 年是极为关键的一年,人们对这些产品有很高期待,必须确保这个转变过程正确无误。
判断 1:AI 是一次规模宏大的成本驱动型生产力革命。
技术革命有很多种类型,包括电话带来的通信革命、火车带来的交通革命以及农业机械化带来的生产力革命。AI 带来的显然是一场生产力革命。
历史上的生产力革命都有相似的模式:起初是人使用工具,然后发展到人配合机器,最终转变为人类与协同化、网络化的工具协作。这表明 AI 的发展将经历从单点逐渐进化到高度集成网络的过程,这将极大改变我们的工作和生产方式。
历史上从镰刀到联合收割机的变化
在农耕领域,人类使用镰刀这一工具至今已经超过 1 万年,再到 1831 年发明的机械收割机,如今我们已经拥有由数以万计的机器系统组成的复杂网络联合收割机,系统中的单个机器就是 Agent。
在知识工作和写作领域也有类似的模式。知识工作最初的工具只有纸笔,发展到后来的编程,再到现在计算机和 IDE 已经可以大规模辅助软件开发。软件开发将不再是孤立的过程,而是一系列的机器网络协同构建复杂的工程系统,由多个 Agent 共同完成代码生成。
写作曾经也是纯人工的,后来人与机器助手协作,现在已经可以利用很多个工具协同。比如大家现在使用的 AI 助手不仅仅是 GPT-4,还有 Mistral-Large 和 Claude-3 等工具,并且借助他们互相验证,获得更好的答案。
AI 带来各行业成本普遍下降
生产力革命对社会的影响是普遍和深远的。从经济学角度来说,这意味着成本能显著降低。上图显示 S&P 500 公司每 100 万收入所需的员工数量正在迅速下降,这种变化意味着我们将能以更快的速度和更少的人力来完成工作。但这并不意味着我们要做的事情变少了,而是在同样的时间能做更多的事。
历史上各领域的技术进步都会带来通缩。以计算机软件为例,由于持续的技术创新,软件的价格在不断下降。但在对社会最重要的领域,比如教育、医疗保健、住房等,价格上涨速度却远远超过通胀,而 AI 恰好有助于降低这些领域的成本。
因此,关于 AI 长期影响的第一个关键判断是:AI 将是一次巨大的成本驱动型生产力革命,帮助我们在社会的关键领域以更少的资源做更多的事。
判断 2:万物皆可生成
第二个判断主要是讨论 AI 到底能做什么。
一年前 Jensen Huang 提出了一个预言,未来图像将不再是渲染出来的,而是生成出来的。这意味着我们正在从将信息存储为像素矩阵,转变为将其表示为多维概念。以字母「a」为例,过去「a」都是以 ASCII 码 97 这个原始数据被存储,但现在计算机不再只关注像素表示,而是理解字母作为英文字母在特定语境下的概念内涵。
更强大的是,计算机不仅能够理解这种多维表示并渲染为图像,还能够把它情境化,理解「a」作为英文字母在特定语境下的含义,而不仅仅是孤立的符号。比如看到「multidimensional」这个词,计算机不会去关注「a」这个字母本身,而是去理解整个语境和词的含义。
这个过程正是人类思维的核心特征。就像我们学习字母「a」时并不是记忆像素矩阵,而是掌握了一个抽象概念。这种思维方式可以追溯到 2500 年前柏拉图的理念论,柏拉图认为,万物背后都有一个永恒不变的理念世界,现实世界中的事物都是理念世界完美形式的映射,这与当前 AI 的学习过程有相通之处。
而这件事对于企业的影响是很大的。目前企业已经开始将 AI 集成到特定的流程和 KPI 制定中,例如前面提到的 Klarna 借助 AI 提高了客户支持相关的绩效,通过建立 AI 检索信息体系打造优质的客户体验。这种变革也伴随着新用户界面的出现,这些用户界面可能与以往我们所用的支持沟通方式截然不同。
这个趋势相当重要,因为这意味着企业最终可能会像神经网络那样运作,各个部分之间相互连接和协同工作,以自我优化的方式互相学习和适应并不断提高效率。
以客户支持流程为例,上图是一个简易客服流程示意图。客服部门有一系列 KPI,这些指标受到文生语音、语言生成、客户个性化等因素的影响,这些因素形成了优化项树状图中的子模式或子树,最终形成一个层次明晰、互相连通的体系图,其中语言生成的反馈将直接影响服务客户的最终 KPI。借助这种抽象方式,整个客服流程将由神经网络管理、优化和改进。
再考虑企业获客的情况。通过语言生成、增长引擎以及广告定制和优化等 AI 技术,可以帮助企业更好地满足每位客户的需求。这些技术之间的相互作用,可以推动企业像神经网络一样自我学习和适应。个体将能够完成更多工作,这也会催生更多一人公司出现。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。