解析区块链技术在人工智能发展中的应用以及必要性

2023-05-0408:03

LegalDAO

2023-05-04 08:03

LegalDAO

2023-05-04 08:03

收藏文章

订阅专栏

区块链 + AI 的最佳组合是什么？

原文标题：《深度解析：区块链技术在人工智能发展中的应用以及必要性》

撰文：Max、Richard

ChatGPT 是有史以来增长最快的消费者应用程序，而且仍在迅速增长。

但 AI 背后的真相是，仍然需要人类进行创建，标记和结构化训练数据 - 而训练数据非常昂贵。不利的情况是，随着 AI 的不断进步，对数据的反馈处理需求正成指数级增长；因此，如何在 AI 的发展中管理其中的参与者成为一个很重要的问题。

一些专家认为，当智能机器人在世界范围内普及的时候，他们最好由去中心化的网络控制，并且人类是通过得到激励的方式来贡献数据集的。区块链和代币（通证）可以在这过程中提供帮助...但是区块链能够拯救人类免受 AI 的伤害吗？

ChatGPT 不是 AGI（通用人工智能）

根据著名的 AI 研究人员 Ben Goertzel 的说法，ChatGPT 是一件大事，因为「ChatGPT 让谷歌创始人多年来第一次出现在办公室里！」。Goertzel 是基于区块链的 AI 交易平台 SingularityNET 的创始人，也是人工智能 AGI（AGI：通用人工智能，也被称作「强人工智能」）的坚定支持者 - 让计算机自己思考。这意味着他比大多数人更清楚地看到 ChatGPT 的不足之处。（ChatGPT 属于弱人工智能）

「ChatGPT 和其他神经模型的有趣之处在于，它们实现了一定程度的通用性，却没有太多的概括能力。他们通过拥有如此多的训练数据，实现了相对于人类个体而言一定的能力范围……换句话说，ChatGPT 实际上是通过拥有这么多数据的蛮力实现的一种功能。」

Ben Goertzel 和他的机器人 Desdemona（如何利用区块链防止人工智能「消灭人类」）

「如果 GPT-7 能够完成 80％的人类工作，我也不会感到震惊；这很重要，但这并不意味着它们可以成为人类水平的思维机器。但它们可以完成大多数人类水平的工作。」 Goertzel 说道。

对 AI 来说，基于经验的逻辑比抓取互联网信息更难。谓词逻辑意味着人类知道如何打开瓶盖，但 AI 需要数万亿的数据才能学会这个简单的任务。Goertzel 解释说，好的大型语言模型（LLMs）仍然可以将语言转换为推定逻辑，包括悖论逻辑或自相矛盾的逻辑。

「如果你把整个网络作为 AI 的食物，那么几乎任何你问它们的问题都可以在网络上找到答案。」

Goertzel 在人工智能思维研究领域很重要，因为他专门研究 AGI。Goertzel 表示自己和 90％的 AGI 同事认为像 ChatGPT 等 LLM 在一定程度上分散了人们希望「让 AI 可以自我思考」这一目标的注意力。但他补充说 LLM 也可以促进和加速所有可能在 AGI 中发挥作用的创新工作。例如，LLM 将加快编码的进步。LLM 甚至可以帮助没有编码能力的普通人构建手机或网络应用程序。这意味着非技术创始人可以使用 LLM 构建技术创业公司。「人工智能应该使软件技术的开发民主化，然后再稍微往前走一点，民主化硬件技术开发的民主化。」

Goertzel 创立了 SingularityNET，试图利用区块链和开源技术，将控制 AGI 的技术权力「分发」给每个人，而不是让它留在垄断者手中。Goertzel 指出，ChatGPT 和其他文本应用程序部署了公开可见的开源算法。因此，他们的数据集的安全基础设施以及用户如何参与这场技术革命，正处于一个关键时刻。

AI 开发同样受到了许多质疑。三月，OpenAI 联合创始人埃隆·马斯克（Elon Musk）和其他 1000 多名技术领导人呼吁暂停开发 AI 或部署比 GPT-4 更强大的系统。他们的公开信警告说，这将会给社会和人类带来「深远的风险」。信中提出，暂停可以为 AI 系统实施「共享安全协议」提供时间。「如果这样的暂停无法快速实施，政府应采取行动，实施暂停令。」

Goertzel 却对技术改善我们生活的潜力比较乐观，他从 1970 年代就开始研究这一领域了。

在图片中，Goertzel 反驳了马斯克等人关于暂停 GPT-4 研究的观点：LLMs 不会变成 AGI

一个信誉系统是必要的

Humayun Sheikh 是著名的 AI 研究实验室 DeepMind 的创始投资者，他支持早期 AI 和深度神经网络技术的商业化。目前，他作为 Fetch.ai 的首席执行官兼创始人，带领着这家初创公司开发一个深度技术用以「自治未来」。

他认为，区块链和 AI 的交叉是经济驱动的，因为除非是非常大型的公司或组织，否则训练 AI 模型所需的资金是非常昂贵的。「加密货币的整个前提是技术和金融的民主化。我们设想，与只有一个垄断实体拥有重要 AI 模型的所有权不同，区块链可以将所有权分散给为其开发做出贡献的人们。」

「为让用户（人们）可以持续地参与 AI 训练和发展的循环，我们可以采取的一种方法是从一开始就让人们参与其中，这也是为什么我们坚持将 AI 技术去中心化。无论是从一开始让人们训练 AI，还是让他们测试和验证 AI 系统，确保普通人能够拥有 AI 模型的部分所有权是一种很好的方式来让用户（人们）留在「循环」中。我们希望做到这一点，同时让这种民主以适当的激励机制为基础。」

为了达到这一目标，可以采用新兴的信誉系统和去中心化的社交网络。例如，SingularityNet 的分支产品 Rejuve 正在对个人提交的生物数据进行代币化和众包，希望使用人工智能对其进行分析并将其与动物和昆虫数据进行交叉匹配，从而发现基因组的哪些部分可以让我们活得更久。这是一个基于 AI 和 Web3 的「长寿经济」。在这个案例中，参与者参与了科学的开放并为结果做出了贡献，因此数据提交者也应该因其贡献而获得奖励。

「AI 的发展依赖于人类的训练。信誉系统可以为数据提供质量保证，去中心化的社交网络可以确保在开发过程中包含各种不同的想法和观点。」

Sheikh 指出，基于区块链的人工智能治理也能有所帮助，他说，通过每个人都能看到的收集的数据和做出决定的无可争议的记录，能确保决策的透明度和去中心化。但区块链技术只是拼图的一部分。他说："规则和标准，正如我们在 DAO 中看到的那样，总是需要可信的治理。

Goertzel 指出：「你无法买卖别人的信誉」，而代币具有网络效应。基于区块链的人工智能信誉系统可以确保消费者区分 AI 假冒品（原文：AI fakes）和真人，同时也可以确保透明度，以便人工智能模型的构建者可以为他们的人工智能构建负责。在这种观点下，需要在区块链社区，然后在主流技术生态系统中采用一些标准，对信誉进行代币化衡量。

而反过来，信誉系统可以加速人工智能的创新。"这不是快速赚钱的道路，但它是区块链主导全球经济道路的一部分。在信誉领域，区块链有一点「公地悲剧」（公地悲剧是经济学中的一个问题，发生在个人为了追求个人利益而忽视社会福利的时候）的感觉；但每个人都将从一个共享的信誉系统中受益。

将区块链用于数据集管理

AI 与数据结合可以做很多事情 -- 但全球各国政府都非常关注如何管理数据。

关键问题是谁拥有数据集。开源和闭源之间的区别变得模糊，它们之间的相互作用变得非常微妙。AI 算法通常是开源的，但数据集的参数和数据集本身通常是专有的和封闭的，包括 ChatGPT。

公众不知道用来训练 ChatGPT-4 的数据是什么，因此即使算法是公开的，AI 也无法复制。各种人都推测它是使用谷歌和推特的数据集进行训练的；谷歌却否认它曾使用数据和与 ChatGPT 对话的方式训练自己的名为 Bard 的 AI，这进一步模糊了谁拥有什么（What）以及「如何做到」（How）的问题。

知名的 AI 风险投资人李开复经常说，开源 AI 是历史上最伟大的人类合作，AI 研究论文通常包含它们的数据集以便重现，或供他人复制。但是尽管 Lee 发表了这番言论，当数据与学术研究相关时，往往会被贴上错误的标签，Goertzel 说道。即使是开放数据集，比如学术论文，也可能不成熟，标记错误，无用且通常很难复制。

因此，AI 与区块链的结合将在数据预处理领域发挥很大作用。加密公司和 DAO 有机会为用于清理训练数据集的去中心化基础设施创建工具。开源代码是一回事，但保护数据至关重要。

Goertzel 指出，「您需要有办法获得实时的 AI 模型，但最终，有人必须为运行该过程的计算机付费」，这可能意味着让用户通过订阅模型付费访问 AI；但是，代币经济是一种更「自然」的选择。那么，为什么不激励好的数据集用于进行进一步的研究呢？诸如基因组学数据之类的「数据分析管道」可以由加密公司 /DAO 构建。LLMs 已经可以做这些事情了，但「大多数这些预处理步骤可以由去中心化的方式（分布式的计算机）更好地完成，」Goertzel 说，「但要构建它需要很多工作。」

人与 AI 的协作：海量的数据需要负责任的管理者

加拿大 Ocean Protocol 创始人 Trent McConaghy 说，考虑人与 AI 协作的一种实用方法是「计算机辅助设计」（CAD，computer-aided design，指利用计算机及其图形设备帮助设计人员进行设计工作）的概念。自 1980 年代以来，工程师已经从 AI 支持的 CAD 中受益。「这是一个重要的框架：人类与计算机共同努力完成目标，同时利用双方的优势，」他说。

McConaughy 从 1990 年代开始为加拿大政府工作，并且花了 15 年时间为电路设计开发 AI 支持的 CAD 工具。他在 2016 年写了有关 AI 的第一篇重要文章。

CAD 为我们提供了一种实际的人与 AI 协作的框架。但是，这些 AI 支持的 CAD 工具仍然需要数据。

图片内容：「想象一下手画一个拥有 100 亿个部件的芯片... 但是，人们还是做到了，你知道是如何做到的吗？答案是使用人工智能...

McConaughy 于 2017 年创立了 Ocean Protocol，以解决这一问题。Ocean Protocol 是一个公共服务网络，可以安全共享 AI 数据，同时保护隐私。「这是一款利用区块链的 AI 技术，旨在为地球民众改善数据状况。」令人印象深刻的是，它是 GitHub 上第六活跃的加密项目。

区块链对于将数据交到普通人手中有很多可谈的优势。就像 Goertzel 一样，McConaghy 相信分布式计算机可以为保护 AI 不被恶意使用做出重要贡献。IPFS、Filecoin、Ocean Protocol 和其他分布式数据控制者已经在过去几年里开展了这项任务。

Ocean 上的数据农场（原文：Data farming）已经激励人们挑选他们认为可以用于 AI 开发的高活跃度数据资产。例如，企业数据市场 Acentrik、企业 AI 助理 Algovera 以及分布式数据科学竞赛协议 Desights。McConaghy 说：「AI 人员面临的问题是获取更多数据和更多数据的来源。」

区块链可以帮助 AI 安全地共享数据（原始训练数据、模型和原始训练预测），具有不可更改性、来源性、抗审查性和隐私性等特点。

McConaghy 将其视为两者结合的重大优势。「AI 将数据转化为价值，但人类必须决定哪些是好的数据资产。」

Ocean Protocol 已经进一步发展出了一个 AI 数据经济的基础。它将数据资产以代币化，使人们可以将有价值的数据作为 NFT 和代币发布，在钱包中持有它们，将它们放在数据 DEX 上出售，甚至在数据 DAO 中管理它们。通过利用 DeFi 工具，将数据代币化解锁了数据经济；但这些努力会在人工智能之前成为主流吗？

Trent McConaghy, Ocean Protocal 创始人，目标创建一个数据交易市场

去中心化计算机可以为自主机器人服务

AGI 是指计算机开始自主思考，并构建更好的自身源代码版本。Goertzel 解释说：「人类水平的 AGI 可以阅读自身的源代码、现有的数学和计算机科学，并可以复制自身以进行实验，然后构建下一级 - ASI 人工超级智能。」

在 Goertzel 的看法中，这项技术由每个人来指导要比由某个科技公司或国家单独控制要好得多。

「如果你把 AGI 系统部署到全球数百万台计算机上，没有人可以拿着枪对你说「给我系统」- 区块链解决了这个问题，对吗？区块链比解决货币问题更能解决这个问题，」Goertzel 认为。

Goertzel 具体定义 AGI 为「具有超越其编程和培训的强大能力的软件或硬件；它能够创造出超越其获取的信息的重大创造性飞跃。」

「按照我的估计，我们现在距离人类水平的 AGI 只有三到八年的路程，然后再过几年就可以到达超人类 AGI。我们正生活在一个有趣的时代。」

在中期，也就是未来三到五到八年，我们将看到强烈依赖数据的 AI 取得突破，达到人类水平，然后在此之后发生什么？」

许多人都认为，AI 发展的下一步可能是区块链治理的重要用例之一。「AGI 将促使世界领导人聚集在一起。AGI 需要开源运行在散布于地球各地的数百万台机器上，」Goertzel 说。「因此，没有国家可以控制它，也没有公司可以控制它。」

去中心化技术不是完美的解决方案

凯（Kai）教授是香港科技大学计算机科学与工程的教授，也是伯克利国际计算机科学研究所的杰出研究学者，他同意，使 AI 民主化的关键瓶颈是运行 AI 的巨大计算资源。但他不确定去中心化技术能否成为完美的解决方案。他说：「如果我们不解决眼下的问题，我们永远都到不了终结者的阶段。现在存在人工智能在潜移默化中撕裂社会的问题；我们需要解决人类的偏见，以及 AI 的偏见问题。」

他说，去中心化技术仍然是高度实验性的，而这些 Web2 问题必须首先解决，因为它们正在给我们带来当前的问题。

「AI 在一些事情上做出的决定往往是人们在生活中无法察觉到的；搜索引擎、YouTube、TikTok——他们决定的事情你往往无法察觉，但却创造出更多两极分化的观点，并导致难以为继的国内和地缘政治分裂。」

凯表示，数据集的透明度至关重要，但如果数据集是整个互联网，那么该数据集实际上是开源的。他认为，谷歌是 100% 在互联网上训练的，而 LLMs 很快就会迅速取代搜索引擎的算法；LLMs 可以近乎 100% 地从互联网上训练出来。

因此，凯对区块链能解决混乱的 AI 问题的观点提出质疑。

「这种说法[人工智能的分散计算]的反面是，AI 更加自主并可能导致电影「终结者」中的天网（Skynet）的情景出现。这种分布式的计算能力并不是解决方案，因为你可能无意中导致人工智能军团的出现。」

那么最好的解决方案是什么？「去中心化有一定的用处，但不是万能药；Web2 已经制造了很多意想不到的后果，我们需要从中吸取教训，并且认识到区块链是一种可以提供许多优势的基础技术，但仍然不是万能的解决方案。」

但当然，并非所有在网上的数据都能免费使用：科学研究、医疗数据、应用程序收集的个人数据以及其他大量的私人拥有的数据可以用来训练 AI。

他表示，其中一个最有用的工具是创建大规模的模拟，看看这一切可能如何发挥作用。他说，问题是「我们该去中心化什么，以及不去中心化什么」。