AIGC 给清冷的 Crypto 带来涟漪,此前闻所未闻的 AIGC 是什么?为何突然兴起?会对 Web3 产生什么影响?
原文标题:《AIGC 在 Web3 有何用武之地?》
撰文:J.A.E
AIGC 全称为 Artificial Inteligence Generated Content(人工智能生产的内容),是指 AI 通过海量现存数据(如文本、音频或图像)创建新内容的技术。实际上,AIGC 概念暂无统一规范的定义,国际上与之相类似的概念是合成式媒体(Synthetic Media),其定义为通过人工智能算法生产、操控与修改数据或媒体的技术,包括文本、代码、图像、语音、视频和 3D 内容等。
AIGC 着重于内容的生产,而内容生态的发展则可分为四个阶段:专家生成内容(Professionally-Generated Content,PGC)、用户生成内容(User-Generated Content,UGC)、AI 辅助生产内容(AI-assisted Generated Content)及 AI 生成内容(AI-Generated Content,AIGC),目前我们仍处于一、二阶段为主,第三阶段为辅的境况。
PGC 一般是指由专业化团队操刀、制作门槛较高、生产周期较长的内容,最终用于商业变现,如电视、电影和游戏等。为了保障生成内容的质量,PGC 需要投入大量的技术成本与人力成本。在 PGC 模式下,内容生产和变现的权利掌握在少数人手中,集中程度更高,垄断效应更强,但受限于供给侧的人力资源,PGC 难以满足大规模的内容生产需求。
反观 UGC 则模糊了消费者与生产者间的界限,平台将提供创作工具,生产者可为用户本身,降低了生产门槛,提高了内容生态的繁荣度,如短视频。UGC 模式在一定程度上降低了生产成本与中心化程度,满足了用户个性化或多样性的需求,同时也提高了产能天花板。虽然内容的生产规模得到了大幅提升,但由于其对生产者、创作工具和内容主题均未设限,其质量不可避免地遭到反噬。
PGC、UGC 分别被产能与质量所束,难以满足快速增长的内容需求,而 AIGC 则或将是内容生态在发展过程中的新一轮范式转移。在用户需求日渐升高的背景下,人工创作的低下效率已经成为了制约内容生产规模的瓶颈。从需求端来看,随着青年成为内容消费的主体,其对内容生产的产能、质量均爆发了更高的需求。另外,虽然互联网的普及加快了内容传播地速度,但也放大了用户需求的缺口。在用户的高需求下,内容生产的传统模式暴露出了在产能、质量方面的严重短板。尽管 UGC 改善了 PGC 生产规模受限的问题,但其内容质量参差不齐,导致用户对优质内容的检索成本提升。归根结底,UGC 依然无法满足用户对高质量内容的需求。
内容生态的成长不存在天花板,引入 AIGC 具有极高的必要性。内容创作的过程是生产者对于信息的筛选、处理、加工与整合过程。一系列的流程均是基于创作者经过长年累月地后天学习建立而成,需要耗费大量的时间和脑力。长期来看,人工创作的能力毕竟有限,当 PGC、UGC 的生产潜力消耗殆尽时,AIGC 也许能够弥补内容生态的缺口。
内容生态已经步入了 AI 辅助生产的阶段,未来有望实现 AIGC。目前,内容生产仍局限于以 PGC 和 UGC 为主的创作框架内,平台通过开放 AI 工具协助用户创作,任何人都可以成为创作者,发出指令使 AI 自动生成内容,指示 AI 完成复杂的代码、绘图与建模等任务,进一步降低了生产门槛,且提高了生产效率。但受技术发展所累,以上工作中 AI 仅是扮演辅助角色,人类依然需要在关键环节创作内容或输入指令,AI 暂不具备成为创作者进行自主创作的能力。然而,随着数据、算法等核心要素不断地升级迭代,AIGC 可能是未来发展的大方向,其或将突破人工限制,提升到自主创作的水平,创作出更丰富多样的内容。理论上,AIGC 将实现内容生态的无限供应,且内容质量超越 PGC,兼顾生产效率及专业性。
Web 2 世界中,AIGC 已经开启在各个领域的广泛探索。目前来看,Web 3 是去中心化版本的 Web 2 映射,推而广之,AIGC 自然在 Web 3 世界也将有诸多大有可为之处。
文本生成相关的 AI 工具获得较大突破。AIGC 在文本创作方面的应用包括代码编写、识别翻译和文章 / 新闻 / 报告的撰写等。文本创作本质上是对语言的运用,因编程语言相对更结构化,更易学习,而人类语言需要结合语境、语义等,故文本生成领域最成熟的应用场景是在代码方面。代表作如微软出品的 Github Copilot,用户文字输入代码逻辑,其能快速理解,根据海量的开源代码生成子模块供开发者使用。如今,GitHub Copilot 生成的程序中,将近 40% 的代码是由 AI 编写。虽然 Web 3 行业中的 SDK 等模块化插件已经提高了开发者编程速度,但随着 AIGC 技术在未来的普及,加密协议的开发效率或将进一步得到提升。理想状态下,AIGC 可自动探查市场的需求或空缺,继而自主编程、拼接生成新协议。而在人类语言的内容创作方面,AIGC 也取得了可观的进展。目前,识别翻译领域的发展已经实现了较大的领先,Roblox 通过机器学习将基于英语开发的游戏自动翻译为其它八种语言,包括中文、德语和法语;腾讯研发的 Dreamwriter 新闻写作系统可以在规定的 22 种场景中写作,平均发稿速度快至 0.46 秒;在红杉资本的《Generative AI: A Creative New World》一文中,部分内容是由 GPT-3 自然语言模型撰写,阅读体验却并不晦涩生硬,还兼顾了言辞流畅、条理清晰、逻辑通顺等写作要求。
AIGC 在 Web 3 的文本创作领域亦将有许多可取之处。Web 3 行业的新闻媒体和研究机构,同样面临着内容生态的双边困境。例如,虽然 CoinDesk、Messari 等产出质量较高,但生产规模难以扩大,且受制于写作语言与翻译的效率、精度,进一步降低了传播性;而 Twitter 上虽然内容规模庞大,但难以保证观点质量,且呈现形式杂乱,未根据类别、重要性和热点程度等分组、排序或去重,无法针对性地满足用户需求,与此同时,用户也将面临信息超载的问题,导致花费了大量时间却未汲取到有效内容。因此,Web 3 机构无论是平均生产规模,还是平均内容质量,均大幅落后于 Web 2 同行。然而,Web 2 机构的规模、质量往往是基于人海战术堆砌而成,前期需要投入巨量的成本。为了保证内容质量,一名合格的分析师通常需要经过长期的沉淀和大量的训练,公司须投入时间成本、培养成本;而同时为了维持输出规模,公司又不得不付出极高的人力成本进行大批量招募。此类模式存在两个明显的缺点,一是成本端负荷过重;二是后期可能面临人才流失的风险,致使成本沉没。随着后续技术的进步,分析师至少可节省下总结标题、摘要的时间,AI 通过理解全文直接生成 TL;DR。长远来看,AI 经过深度地机器学习后,「合格的分析师」能被迅速造就。Web 3 机构将在大幅降低成本的同时,提高内容生成的规模和质量,进而推动整个细分市场与全行业的发展,甚至 Web 3 世界可能会出现资讯类协议、新闻类协议或研究类协议等。
AIGC 在 Web 3 游戏领域也可能获得广泛应用。AI 渲染技术将加速实现 Web 3 游戏中大量建筑、环境的构建需求。目前,小型场景的搭建已经具备技术基础,但 Web 3 游戏需要更快更好地建造更丰富宏大的场景。RCT Studio 打造的 Morpheus 引擎,通过大量深度地机器学习,输入目标文字即可拓展出一个虚拟开放空间,AI 将从文字内容中理解情节、内在逻辑与人物关系,进而渲染成 3D 动画。例如,程序可将「一个人坐在沙发上」的文字指令变成一个虚拟人在 3D 空间中向沙发坐下的动画。相对于传统 PGC 模式下繁琐的制作流程,Morpheus 能大幅缩减制作周期,显著降低工作量与创作时长。另外,游戏中的 NPC 也能够通过 AI 实现自动化生产,减轻原画师的负担。传统方法制作 NPC 的成本极高,每一分钟的动画都需要耗费数天,而 AI 技术可将原本数周的工作量减少到几小时。随着 AIGC 技术的迭代,Web 3 游戏在场景、人物构建方面的高需求也将逐渐得到满足,后期的 AIGC 或许能自主设计游戏生态内的地图、关卡。
AIGC 或将在 Web 3 音乐创作领域引发新一轮范式创新。AIGC 在制作歌曲、词曲生成等方面开启应用,且互动性、实时性进一步增强。例如,自适应音乐平台 LifeScore 能够实时动态编曲,用户向其输入一系列音乐素材后,AI 就将更改、变奏并重新混音,带来即时音乐表演。2020 年 5 月,LifeScore 为 Twitch 互动电视连续剧《Artificial》进行自适应配乐,其可根据观众对剧情发展的情绪状态影响配乐。短期来看,AIGC 可帮助创作者对乐曲进行改编、二创,或直接辅助创作,大幅减少其工作量,提高工作效率;长期来看,Web 3 行业内已经出现了部分音乐平台,未来随着 AIGC 技术的引进,协议也许可以根据听众的个人偏好,通过标注用户喜爱音乐的时期、乐器和流派等因素,生成定制化歌曲。不仅平台能够大幅降低版权的采购成本,用户也可以减少购买歌曲的支出。除此之外,用户或许还能够将 AIGC 创作的独家歌曲发布到平台上,为其赚取收入,进而提升 Web 3 音乐市场的创作者经济。
AIGC 在其它 Web 3 赛道也拥有着巨大的潜力,前述三个细分市场仅为其应用较为前沿的领域。比如,1)NFT 的创作主体是图像或艺术品,当前不少 AI 模型已经收集整个艺术史和流行文化的作品数据,任何用户均可随意生成其喜爱的 NFT,不同 NFT 需要有不同的面孔、服饰及情绪特征,传统方法生成 NFT 的成本高、效率低,创作者需要逐一进行原型设计、多次建模与渲染等,而 AIGC 则能在前期协助创作者更高效、直接地尝试灵感方案草图,并在后期节省补全画面细节的人力,未来或可实现低成本、大规模地量产 NFT,此外,UGC 作品具有易复制、易传播的特点,频频出现侵权问题,NFT 则具有唯一性、不可分割性、可交易性,能够克服资产防伪、确权、溯源的难题,加大版权保护的力度;2)AIGC 也正在完善跨膜态生成,如文字生成图像 / 动画,反之亦然;3)AIGC 的进步也将推动 Web 3 社交赛道的发展,AI 技术能够打造用户喜爱的虚拟角色,真人必然会存在些许缺点,而 AIGC 生成的虚拟角色将完全按照用户需求定制,可使用模板或自定义角色的家庭、职业、年龄等,并在此基础上保持符合设定的对话风格,而在特定场景下的虚拟角色,AI 技术可助其在外表与动作上更接近真人,并赋予语言表达及与互动的功能,以体现一定的共情能力,并支持多语言互通,此外,虚拟角色不用休息且拥有比人类更充盈的知识储备、更快速的更新频率等,预计虚拟角色在特定领域提供的娱乐和服务将媲美甚至超越真人,例如,虚拟角色可以在与用户的沟通交流中持续学习,实现情感上的陪伴,进而为用户排忧解难,参考 Web 2 世界中的二次元群体及社交软件,Web 3 行业的社交市场在 AIGC 的加持下无疑将更为庞大;4)AIGC 用于 Web 3 教育或将产生意想不到的效果,由于 AI 的学习模式较为结构化、组织化,因此其输出的教辅材料、教学视频也许能够降低理解难度,有助于受众吸收知识。总而言之,即便是在 Web 3 世界,AIGC 的未来征途也依然广阔。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。