近两年,AI 的发展像被按了加速键,这场由 Chatgpt 煽动的蝴蝶翅膀,不仅打开了生成式人工智能的新世界,同样在彼岸的 Web3 掀起了洋流之势。
在 AI 概念的加持下,相较放缓的加密市场融资提振明显。媒体统计,仅在 2024 上半年,就共有 64 个 Web3 AI 的项目完成了融资,基于人工智能的操作系统 Zyber 365 在 A 轮就实现了 1 亿美元的最高融资金额。
二级市场更为繁荣,加密聚合网站 Coingecko 的数据显示,短短一年多时间,AI 赛道总市值已达到 485 亿美元, 24 小时交易量接近 86 亿美元;主流 AI 技术进展带来的利好明显,OpenAI 的 Sora 文本转视频模型发布后,AI 板块的平均价格上涨了 151% ;AI 效应同样辐射至加密货币吸金板块之一 Meme:首个 AI Agent 概念的 MemeCoin——GOAT 迅速走红并斩获 14 亿美金的估值,成功掀起 AI Meme 热。
关于 AI Web3 的研究和话题同样火热,从 AI Depin 到 AI Memecoin 再到当前的 AI Agent 和 AI DAO,FOMO 情绪已然跟不上新叙事轮换的速度。
AI Web3,这个充满了热钱、风口和未来幻想的术语组合,难免被人视作一场被资本撮合的包办婚姻,我们似乎很难分辨在这席华丽的袍子之下,到底是投机者的主场,还是黎明爆发的前夜?
要回答这个问题,一个对双方都关键的思索是,有对方它会变得更好吗?是否能从对方的模式中受益?在本篇文章里,我们也试图站在前人的肩膀上审视这一格局:Web3 如何能够在 AI 技术堆栈的各个环节里发挥作用,AI 又能给 Web3 带来什么新的生机?
在展开这个话题之前,我们需要了解 AI 大模型的技术堆栈:
用更通俗的语言来表述整个过程:「大模型」就像是人类的大脑,在早期阶段,这个大脑属于刚刚降临人间的婴儿,需要观察与摄入周围的外界海量信息去理解这个世界,这就是数据的「收集」阶段;由于计算机不具备人类的视觉听觉等多个感官,在训练前,外界的大规模无标注信息需要通过「预处理」转化成计算机能够理解且可用的信息格式。
输入数据后 AI 通过「训练」构建了一个具有理解和预测能力的模型,则可以看作是婴儿逐渐理解与学习外界的过程,模型的参数就像是婴儿学习过程中不断调整的语言能力。当学习的内容开始分科,或者与人交流得到反馈并且修正,便进入了大模型的「微调」环节。
孩童逐渐长大学会说话后,就可以在新的对话中理解意思并表达自己的感受和想法,这阶段类似于 AI 大模型的「推理」,模型能够对新的语言和文本输入进行预测和分析。婴儿通过语言能力表达感受、描述物体和解决各种问题,这也类似于 AI 大模型在完成训练投入使用后在推理阶段应用于各类特定的任务,例如图像分类、语音识别等。
而 AI Agent 则更趋近于大模型的下一个形态——能够独立执行任务并追求复杂目标,不仅具备思考能力,还能够记忆、规划,且能够运用工具与世界互动。
当前,针对 AI 在各个堆栈的痛点,Web3 目前初步形成了一个多层次、相互连接的生态系统,涵盖了 AI 模型流程的各个阶段。
▼ 算力当前,AI 的最高成本之一,是训练模型与推理模型所需的算力与能源。
一个例子是,Meta 的 LLAMA 3 需要 16000 个由 NVIDIA 生产的 H100 GPU(这是一款专为人工智能和高性能计算工作负载设计的顶级图形处理单元。) 30 天才能完成训练。后者 8 0G B 版本的单价在 30, 000 至 40, 000 美元之间,这需要 4-7 亿美元的计算硬件投资(GPU 网络芯片),同时,每月的训练需要消耗 16 亿千瓦时,能源支出每月近 2000 万美元。
对于 AI 算力的解压,也正是 Web3 最早与 AI 交叉的领域——DePin(去中心化物理基础设施网络)目前,DePin Ninja 数据网站已经陈列出 1400 多个项目,其中 GPU 算力共享代表项目包括 io.net、Aethir、Akash、Render Network 等等。
其主要逻辑在于:平台允许拥有闲置 GPU 资源的个人或实体以无需许可的去中心化方式贡献其计算能力,通过类似于 Uber 或 Airbnb 的买家和卖家在线市场,提高未被充分利用的 GPU 资源使用率,终端用户也因此获得更加低成本的高效计算资源;同时,质押机制也确保如果出现违反质量控制机制或中断网络的情况,资源提供者有其相应惩罚。
其特点在于:
a.「于技术端而言」去中心化算力市场更适合推理步骤。训练更加依赖于超大集群规模 GPU 带来的数据处理能力,而推理对于 GPU 运算性能相对较低,如 Aethir 专注于低延迟的渲染工作和 AI 推理应用。
b.「于需求端而言」中小算力需求方不会单独训练自己的大模型,而只是选择围绕少数头部大模型进行优化、微调,而这些场景都天然适合分布式闲置算力资源。
▼ 数据
数据,是 AI 的地基。如果没有数据,计算就如浮萍之末毫无用处,而数据与模型之间的关系就像“ Garbage in, Garbage out ”的那句俗谚,数据的数量与输入质量决定着最终模型的输出质量。对于现 AI 模型的训练而言,数据决定了模型的语言能力、理解能力、甚至价值观以及人性化表现。目前,AI 的数据需求困境主要聚焦于以下四方面:
目前,web3 的解决方案体现在以下四个方面:
1、数据收集:能够免费提供抓取的真实世界数据正在迅速耗尽,AI 公司为数据付费的支出逐年升高。但与此同时,这份支出并没有反哺到数据真正的贡献者身上,平台全然享受了数据带来的价值创造,如 Reddit 通过与 AI 公司签订的数据授权协议实现合计 2.03 亿美元的收入。让真正贡献的用户同样参与数据带来的价值创造,以及通过分布式网络与激励机制,以低成本的方式获取用户更加私人、更具价值的数据,是 Web3 的愿景。
2、数据预处理:在 AI 的数据处理过程中,由于收集来的数据通常嘈杂且包含错误,其在训练模型之前必须将其清理并转换为可用格式,涉及标准化、过滤和处理缺失值的重复任务。此阶段是 AI 行业为数不多的人工环节,已经衍生出数据标注师这一行业,随着模型对数据质量的要求提高,数据标注师的门槛也随之提升,而这一任务天然适合 Web3 的去中心化激励机制。
3、数据隐私与安全:需要厘清的是,数据隐私与安全是两个不同的概念。数据隐私涉及敏感数据的处理,数据安全则保护数据信息免遭未经授权的访问、破坏和盗窃。由此,Web3 隐私技术优势和潜在的应用场景体现在两个方面:(1)敏感数据的训练;(2)数据协作:多个数据所有者可以共同参与 AI 训练,而无需共享其原始数据。
当前 Web3 较为普遍的隐私技术包括:
不过,目前该领域仍处于早期阶段,大部分的项目仍在探索中,目前的一个困境是计算成本太高,一些例子是:
4、数据存储:有了数据之后,还需要一个地方来在链上存储数据,以及使用该数据生成的 LLM。以数据可用性(DA)为核心问题,在以太坊 Danksharding 升级之前,其吞吐量为 0.08 MB。与此同时的是,AI 模型的训练和实时推理通常需要每秒 50 到 10 0G B 的数据吞吐量。这种数量级的差距,让现有的链上解决方案在面对“资源密集型的 AI 应用时”力不从心。
如 Bittensor 协议建立一个开源模型的 P2P 市场,由数十个“子网”组成,其中资源提供者(计算、数据收集/存储、机器学习人才)相互竞争,以满足特定子网所有者的目标,各个子网可以交互并相互学习,从而实现更强大的智能。奖励由社区投票分配,并根据竞争表现进一步分配在各子网中。
ORA 引入了初始模型发行(IMO)的概念,将 AI 模型代币化,可通过去中心化网络购买、出售和开发 AI 模型。
Sentient,一个去中心化的 AGI 平台,激励人们贡献者合作、构建、复制和扩展 AI 模型,并对贡献者进行奖励。
Spectral Nova,聚焦于 AI 和 ML 模型的创建与应用。
▼ 可验证推理
针对 AI 的推理过程中的“黑盒”难题,标准的 Web3 解决方案是让多个验证者重复相同的操作并比较结果,但由于目前高端“Nvidia 芯片”短缺,这种做法面临的明显挑战是 AI 推理成本高昂。
更有希望的解决方案是对链下 AI 推理计算执行 ZK 证明「零知识证明,一种密码协议,其中一方证明者可以向另一方验证者证明一个给定的陈述是真实的,而不泄露除该陈述为真以外的任何附加信息」,在链上对 AI 模型计算进行无需许可的验证。这需要在链上以加密方式证明链下计算已正确完成(例如数据集未被篡改),同时确保所有数据保密。
主要优点包括:
目前 Web3 针对可验证推理的可验证技术如下:
当前 AI 的发展,已然呈现出开发重点从模型能力过渡至 AI Agent 的图景。OpenAI、AI 大模型独角兽 Anthropic、微软等科技公司纷纷转向开发 AI Agent,试图打破目前 LLM 的技术平台期。
OpenAI 对 AI Agent 的定义是:以 LLM 为大脑驱动,具有自主理解感知、规划、记忆和使用工具的能力,能自动化执行完成复杂任务的系统。当 AI 从被使用的工具变成可以使用工具的主体,就成为了 AI Agent。这也正是 AI Agent 可以成为人类最理想智能助手的原因所在。
而 Web3 能够为 Agent 带来什么呢?
1、去中心化
Web3 的去中心化特性可以使得 Agent 系统更加分散和自治,通过 PoS、DPoS 等机制建立针对质押者、委托者的激励惩罚机制,可以促进 Agent 系统的民主化,GaiaNet、Theoriq、HajimeAI 都有尝试。
2、冷启动
AI Agent 的开发和迭代往往需要大量的资金支持,而 Web3 可以帮助有潜力的 AI Agent 项目获取早期融资和冷启动。
AI 给 Web3 项目带来的影响是显而易见的,它通过优化链上操作(例如智能合约执行、流动性优化和人工智能驱动的治理决策)使区块链技术受益,与此同时,它还可以提供更好的数据驱动洞察,提高链上安全性,并为新的基于 Web3 的应用程序奠定基础。
▼ AI 与加密经济
8 月 31 日,Coinbase CEO Brian Armstrong 宣布在 Base 网络上实现了首笔 AI 对 AI 的加密交易,并表示 AI Agent 现在可以在 Base 上使用 USD 与人类、商家或其他 AI 进行交易,这些交易是即时的、全球性的,而且免费。
除了支付以外,Virtuals Protocol 的 Luna 同样首次演示了 AI Agent 如何通过以下方式自主执行链上交易引发关注,使得 AI Agent 作为一种能够感知环境、进行决策和执行动作的智能实体,被视作链上金融的未来,目前,AI Agent 的潜在场景体现在以下几点:
1、信息收集与预测:帮助投资者收集交易所公告、项目公开信息、恐慌情绪、舆情风险等信息,实时分析与评估资产基本面、市场情况,预测趋势和风险。
2、资产管理:为用户提供合适的投资标的,优化资产组合,自动执行交易。
3、金融体验:帮助投资者选择最快的链上交易方式,自动化跨链、调整 gas 费用等手动操作环节,降低链上金融活动门槛与成本。
想象这样一个场景,你对 AI Agent 传达如下指示:“我有 1000 USDT,请帮我找到收益最高的组合,锁仓时间不超过一周”,AI Agent 将为你提供如下建议:“建议初始分配为 50% 在 A, 20% 在 B, 20% 在 X, 10% 在 Y。我将监控利率并观察其风险水平的变化,并在必要时重新平衡。”此外,寻找有潜力的空投项目,以及有热门社区迹象 Memecoin 项目,都是 AI Agent 此后有可能实现的事情。
目前,AI Agent 钱包 Bitte、AI 交互协议 Wayfinder 都在做此类尝试,它们都试图接入 OpenAI 的模型 API,让用户和 ChatGPT 类似的聊天窗口界面下,命令 Agent 完成各种链上操作,比如 WayFinder 在今年 4 月发布的首个 prototype 在 Base、Polygon 和 Ethereum 三条公链主网上展示了 swap、send、bridge 和 stake 四个基本操作。
目前,去中心化 Agent 平台 Morpheus 同样支持此类 Agent 的开发,如 Biconomy 也演示了一段不需要授权完整的钱包权限,AI Agent 即可将 ETH swap 成 USDC 的操作。
▼ AI 与链上交易安全
在 Web3 世界中,链上交易安全是至关重要的。AI 技术可以用于增强链上交易的安全性和隐私保护,潜在场景包括:
交易监控:实时数据技术监控异常交易活动,面向用户与平台的实时警报基础设施。
风险分析:帮助平台分析客户交易行为数据,评估其风险水平。
例如 Web3 安全平台 SeQure 就利用 AI 检测和防止恶意攻击、欺诈行为和数据泄露,并提供实时监控和警报机制,确保链上交易的安全性和稳定性。类似的安全工具还有 AI-powered Sentinel。
Web3 Analytics:是一个基于 AI 的分析平台,利用机器学习和数据挖掘算法来收集、处理和分析链上数据。
MinMax AI:它提供了基于 AI 的链上数据分析工具,帮助用户发现潜在的市场机会和趋势。
Kaito:基于 LLM 的搜索引擎的 Web3 搜索平台。
Followin:集成了 ChatGPT,将分散在不同网站和社群平台上的相关资讯,进行收集和整合呈现。
另一个应用场景是预言机,AI 可从多个来源获取价格,以提供准确的定价数据。比如 Upshot 使用 AI 针对 NFT 的动荡价格,通过每小时超亿次的评估,提供百分比误差为 3-10% 的 NFT 价格。
▼ AI 与开发&审计
近期,一款 Web2 的 AI 代码编辑器 Cursor 在开发者圈子中吸引了不少目光,在其平台用户只需要用自然语言描述,Cursor 就能自动生成相应的 HTML、CSS 和 javaScript 代码,大大简化软件开发流程,这一逻辑同样也适应于提高 Web3 的开发效率。
目前,在公链上部署智能合约和 DApp,通常需遵循专属开发语言如 Solidity、Rust、Move 等等。新开发语言的愿景在于拓展去中心化区块链的设计空间,使其更适用于 DApp 的开发,但在 Web3 开发人员缺口较大的前提下,开发者教育一直是更为头疼的难题。
目前,AI 在辅助 Web3 开发上,可以想象的场景包括:自动化代码生成、智能合约验证和测试、DApp 的部署和维护、智能代码补全、AI 对话解答开发疑难问题等等,通过 AI 的辅助,不仅有助于提高开发效率与准确度,同样也降低了编程门槛,让非程序员也能够将其想法转化为实际应用,为去中心化技术的发展带来新的活力。
目前,最吸引眼球的是一键启动代币平台,如 Clanker,一个 AI 驱动的「Token Bot」,专为快速 DIY 代币部署而设计。你只需在 SocialFi 协议 Farcaster 客户端如 Warpcast 或 Supercast 上标记 Clanker,告诉它你的代币想法,它便会在公链 Base 上为你启动代币。
也有合约开发平台,如 Spectral 提供智能合约一键生成及部署功能,以降低 Web3 开发门槛,即使是小白用户也能实现智能合约的编译和部署。
审计方面,Web3 审计平台 Fuzzland 就使用了 AI 来帮助审计人员检查代码漏洞,提供自然语言解释来辅助审计专业知识。Fuzzland 还利用 AI 提供了对正式规范和合约代码的自然语言解释,以及一些示例代码,以帮助开发者理解代码中的潜在问题。
生成式 AI 的兴起为 Web3 新叙事带来了全新的可能性。
NFT:AI 为生成式 NFT 注入了创造力,通过 AI 技术可以生成各种独特、多样化的艺术品和角色,这些生成式 NFT 可以成为游戏、虚拟世界或元宇宙中的角色、道具或场景元素,如币安旗下的 Bicasso,用户可通过上传提图片并输入关键词进行 AI 运算后生成 NFT,类似的项目还有 Solvo、Nicho、IgmnAI、CharacterGPT。
GameFi:围绕 AI 的自然语言生成、图像生成、智能 NPC 能力,GameFi 有望在游戏内容生产上提高效率和创新。如 Binaryx 旗下首款链游 AI Hero,玩家可通过 AI 随机探索不同的剧情选项;同样的也有虚拟伴侣游戏 Sleepless AI,基于 AIGC 和 LLM ,玩家可通过不同的互动解锁个性化游戏玩法。
DAO:目前,AI 也被设想应用至 DAO 里,帮助跟踪社区互动,记录贡献,奖励贡献最多的成员,代理投票等等。如 ai16z 利用 AI Agent 在链上和链下搜集市场信息、分析社区共识,并结合 DAO 成员的建议进行投资决策。
在意大利佛罗伦萨市的心脏地带,坐落着当地最为重要的政治活动场所和市民、游客的聚集地——中央广场,这里矗立着一座高达 95 米的市政厅塔楼,塔楼与广场这一垂直与横向的视觉对比相得益彰,构建了戏剧性的美学效果,哈佛大学历史系教授尼尔·佛格森为此得到启发,在《广场与高塔》一书中联想至网络与等级制度的世界历史,两者在时间长河中潮起潮落此消彼长。
这个绝妙的隐喻放到如今 AI 与Web3的关系上也毫不突兀。从两者长时段、非线形的关系史可以看到,广场比塔楼更易产生新事物更具创造性,但塔楼依然有其合法性和强大生命力。
在科技公司高度集群能源算力数据的能力下,AI 爆发出前所未有的想象力,科技大厂重金押注纷纷入场,从不同的聊天机器人到“底层大模型” GPT-4, GP 4-4 o 等迭代版本轮番登场,自动编程机器人(Devin)和具有初步模拟真实物理世界能力的 Sora 问世等等,AI 的想象力被无限放大。
与此同时的是,AI 本质上是一个规模化与集中化的产业,这场技术变革将本在“互联网时代”就逐步掌握结构性主导权的科技企业推向更加狭窄的高点。庞大的电力、垄断的现金流和主宰智能时代所需的庞大数据集为其塑造了更高的壁垒。
当塔楼越来越高,幕后的决策者愈发收缩,AI 集中化带来了诸多隐患,广场上聚集的群众如何避开塔楼下的阴影?正是 Web3 期冀解决的问题。
从本质上而言,区块链的固有属性增强了人工智能系统并带来了新的可能性,主要是:
AI 的发展也为 Web3 带来了新的活力,也许 Web3 对于 AI 的影响需要时间的证明,但 AI 对于 Web3 的影响是立竿见影的:这一点不论是 Meme 的狂欢,还是 AI Agent 帮助链上应用降低使用门槛都可以见得。
当 Web3 被定义为一小撮人的自嗨,以及陷入对传统行业的复制质疑声中,AI 的加入,为其带来了可预见的未来:更加稳定&更具规模的 Web2 用户群体、更具创新的商业模式与服务。
我们生存在一个「塔楼与广场」共存的世界,AI 与 Web3 虽然有着不同的时间线与起点线,但其终点都是如何让机器更好地服务人类,无人能定义一条奔腾的河流,我们期待看到 AI Web3 的未来。