生成式人工智能正经历从“快思考”(快速预训练的反应)到“慢思考”(推理时进行推理)的演变。这种演变解锁了一批新的智能应用程序。随着基础大语言模型(LLM)市场的稳定,推理层的开发和扩展成为新的前沿领域,“系统2思维”占据主导地位。这种转变将推动人工智能从快速样本内反应的世界转向推理云环境,这些环境可以根据任务的复杂性动态扩展计算能力。同时,应用程序层也在发生变化,人工智能公司不再仅仅是UI,而是拥有复杂的认知架构,通常包括多个基础模型、向量和/或图形数据库、确保合规性的护栏以及模仿人类推理工作流程的应用程序逻辑。人工智能公司销售的是工作(美元/结果),而不是软件(美元/席位)。
还记得两年前,生成式AI以其惊人的文本生成和图像创作能力震惊了世界吗?仅仅依靠“鹦鹉学舌”般地模仿人类,AI 就能创作出以假乱真的文字和图像,这曾经让我们惊叹不已。然而,如今,生成式AI正在经历一场新的演变:从“快思考”转向“慢思考”,这意味着AI不再仅仅是根据预训练模型快速反应,而是能够像人类一样“停下来思考”,进行更深层的推理,真正做到“举一反三”。
“快思考”是指基于预训练模型的快速反应,例如根据输入的关键词快速生成一段文字或一张图片。这种能力非常强大,但也存在局限性,因为它缺乏真正的推理能力,就像鹦鹉学舌,虽然能够模仿人类说话,但并不能理解话语的含义。而“慢思考”则是指在推理时进行推理,例如在生成文本之前先理解上下文,或在创作图片之前先构思场景。这种能力更接近于人类的思维方式,也更能解决复杂的问题,就像人类思考问题一样,能够分析问题、寻找解决方案,最终做出决策。
推动这一趋势的主要因素是基础大语言模型(LLM)市场的稳定。随着像OpenAI、谷歌、微软等巨头在LLM领域占据主导地位,LLM本身的性能已经不再是主要的竞争点,就像电脑的 CPU 速度已经不再是用户选择电脑的主要因素一样。新的竞争焦点转向了推理层的开发和扩展,即如何让AI系统在推理时进行更深层的思考,如何让 AI 不仅仅是“学舌”,更要“思考”。
OpenAI 的 o1 模型正是这一趋势的最佳体现。o1 模型展现出强大的通用推理能力,它能够进行逻辑推理、解决问题,甚至可以像人类一样“停下来思考”,在遇到困难时能够回溯,能够像人类一样思考问题,甚至能够以人类想不到的方式解决问题。
2024年,OpenAI 发布了 o1 模型,这是生成式AI领域的一个重要里程碑。o1 模型展现出真正的通用推理能力,它不仅可以快速生成文本和图像,还可以进行逻辑推理、解决问题,甚至可以像人类一样“停下来思考”。
是什么让 o1 模型如此与众不同?答案在于它在推理时使用了计算和深度强化学习技术。传统的预训练模型只在训练时进行计算,而在推理时则只是简单地根据输入进行预测,就像训练好的鹦鹉,只能重复它学过的句子,不能根据新的情况说新的句子。o1 模型则不同,它在推理时会根据输入进行一系列的计算,模拟人类“停下来思考”的过程。 例如,在回答一个问题时,o1 模型会先分析问题的上下文,然后生成多个可能的答案,最后选择最合理的答案,就像人类思考问题一样,会先分析问题,然后思考多种解决方案,最后选择最合适的方案。
o1 模型的推理能力提升的关键在于深度强化学习。深度强化学习是一种机器学习方法,它通过让 AI 代理在与环境的交互中学习,从而找到最优的行动策略。简单来说,就是让 AI 在试错中学习。在 o1 模型中,深度强化学习被用于优化模型的推理策略,使其能够根据推理过程中的反馈不断调整自身的推理路径,从而提升推理的准确性和效率,就像人类在学习过程中,会不断地根据自己的经验和反馈来调整学习方法,从而提高学习效率。
o1 模型在逻辑性强的领域表现出色,例如数学、编程、科学等。例如,在一项编程竞赛中,o1 模型能够以一种人类程序员从未想过的方式解决问题,展现出惊人的创造力。在数学领域,o1 模型甚至能够“想象”球体上的点来解决几何问题,展现出强大的空间想象能力。
然而,在开放性和非结构化领域,例如文学创作、艺术设计等,o1 模型的表现还有待提升。这是因为在这些领域,评估答案的“好坏”更加主观,目前还没有找到一种有效的方法来量化这种主观性,就像评价一首诗歌或一幅画的好坏,每个人的标准都不一样,AI 也难以判断。
o1 模型的出现,标志着 AI 推理能力从“系统1思维”向“系统2思维”的跃迁,就像人类的思维从直觉到理性发展一样,AI 的推理能力也在不断进化。
-
系统1思维是指基于预训练模型的快速反应,例如根据输入的关键词快速生成一段文字或一张图片。这种思维方式快速、高效,但缺乏真正的推理能力,可以把它想象成人类的“直觉”,例如我们看到一个红色的交通灯,就会立刻停下来,不需要思考为什么。
-
系统2思维是指在推理时进行推理,例如在生成文本之前先理解上下文,或在创作图片之前先构思场景。这种思维方式更接近于人类的思维方式,也更能解决复杂的问题,可以把它想象成人类的“理性”,例如我们需要解决一个复杂的数学问题,就需要运用逻辑推理能力,一步步地找到答案。
对于许多任务来说,系统1思维已经足够了。例如,如果你想知道某个国家的首都是什么,你只需要快速回忆一下就可以了,不需要进行复杂的推理。但是,如果你要解决一个复杂的问题,例如设计一座桥梁,你就需要进行系统2思维,你需要考虑各种因素,例如桥梁的长度、宽度、高度、材料、承重等等。
o1 模型的出现证明了系统2思维的可行性,也为 AI 发展开辟了新的方向。未来,我们可以期待看到更多具备系统2思维能力的 AI 系统出现,它们将能够解决更复杂的问题,为人类创造更大的价值,例如帮助人类进行科学研究、设计新的产品等等。
随着推理能力的崛起,应用层 AI 公司也在发生着变革。过去,许多应用层 AI 公司只是简单地将预训练模型包装成一个 UI 界面,例如聊天机器人、文本生成器等等,就像给鹦鹉做了一个漂亮的笼子,让它能够更好地展示它的学舌能力。现在,应用层 AI 公司正在构建更复杂的“认知架构”,以实现更强大的功能,就像为 AI 设计一个更聪明的大脑,让它能够思考和解决问题。
认知架构是指 AI 系统如何思考,包括代码流、模型交互以及用户输入处理。例如,一个 AI 律师的认知架构可能包括法律知识库、案例分析模块、法律推理引擎等等,就像一个真正的律师一样,需要具备法律知识、分析案例的能力和推理能力。
应用层 AI 公司不再仅仅是 UI,它们正在成为真正的“智能应用”。这些智能应用能够模仿人类推理工作流程。例如,一个 AI 软件工程师可以像人类软件工程师一样,先分析需求,然后设计方案,最后编写代码,就像一个真正的程序员一样,能够独立完成软件开发工作。再比如,一家名为 Factory 的公司开发了一种名为“droid”的 AI 产品,每个“droid”都拥有定制的认知架构,可以模仿人类的思维方式来完成特定的任务,例如审查代码、编写和执行迁移计划等等,就像一个个专业的 AI 助手,帮助人类完成各种工作。
更重要的是,应用层 AI 公司正在改变他们的商业模式。过去,应用层 AI 公司通常按照软件的模式销售产品,例如按席位收费,就像购买 Office 软件一样,需要按使用人数付费。现在,应用层 AI 公司正在按照服务的模式销售产品,例如按工作成果收费,就像使用 AI 翻译服务一样,按翻译的字数付费。例如,一个 AI 客服可以按照解决问题的数量收费,而不是按使用时间收费,也就是说,只有 AI 解决了客户的问题,公司才会收费。Sierra 就是一个很好的例子,B2C 公司将 Sierra 放在他们的网站上与客户交谈,它的工作是解决客户问题,并按解决问题的数量收费。
AI 推理能力的崛起和应用层 AI 公司的变革,对 SaaS 行业产生了深远的影响,就像互联网的出现改变了传统软件行业一样,AI 也正在改变着 SaaS 行业。过去,SaaS 公司主要依靠软件产品来创造价值,例如提供在线 CRM 软件、在线办公软件等等。现在,SaaS 公司需要将 AI 融入到他们的产品和服务中,才能保持竞争力,例如将 AI 应用于客户关系管理、市场营销、数据分析等等。
一些 SaaS 公司已经开始进行 AI 转型。例如,Salesforce 推出了 Einstein AI 平台,帮助企业利用 AI 提升销售、服务和营销效率,例如利用 AI 预测销售额、识别潜在客户、个性化推荐产品等等。微软将 Copilot AI 助手整合到 Office 365 套件中,帮助用户更高效地完成工作,例如帮助用户撰写邮件、制作PPT、分析数据等等。
AI 转型对 SaaS 公司来说既是机遇也是挑战。一方面,AI 可以帮助 SaaS 公司提升产品和服务的价值,开拓新的市场,例如开发更智能化的 SaaS 产品,提供更个性化的服务等等。另一方面,AI 转型需要 SaaS 公司进行大量的投入,包括技术、人才和资金,例如需要聘请 AI 人才、购买 AI 算力、开发 AI 算法等等。
对于那些能够成功进行 AI 转型的 SaaS 公司来说,未来充满了机遇。AI 将帮助他们创造更大的价值,成为行业的领导者,例如 Salesforce 通过 AI 转型,巩固了其在 CRM 领域的领先地位。而对于那些无法适应 AI 转型的 SaaS 公司来说,未来将充满挑战。他们将逐渐失去竞争力,最终被市场淘汰,就像那些没能及时拥抱互联网的传统软件公司一样。
更值得关注的是,AI原生应用的出现可能预示着软件行业的重大变革。例如,Day.ai 是一款 AI 原生 CRM 系统,它可以根据用户的电子邮件、日历和一份简单的问卷调查,自动生成一个完全定制的 CRM 系统。它不需要任何人工配置,而且可以随着业务的变化而自动更新,就像一个能够自动学习和适应用户需求的 CRM 系统。这种“自动生成、无需人工干预”的软件模式可能会对传统的软件开发模式构成挑战,未来软件开发可能不再需要程序员一行一行地编写代码,而是由 AI 自动生成。
对于投资者来说,AI 推理能力的崛起和应用层 AI 公司的变革带来了新的投资机会,就像互联网时代和移动互联网时代一样,AI 时代也孕育着大量的投资机会。
在 AI 技术栈中,基础设施层和模型层已经基本被巨头垄断,例如英伟达垄断了 GPU 芯片市场,OpenAI 垄断了 GPT 模型市场。对于初创公司来说,进入这两个领域的机会非常有限,就像在 PC 时代挑战英特尔和微软一样困难。
开发者工具和基础设施软件层是一个相对有潜力的投资方向。在云计算时代,这个领域诞生了大约15家市值超过10亿美元的公司,例如 HashiCorp、Datadog 等等。在 AI 时代,这个领域也有可能诞生一些成功的公司,例如提供 AI 模型训练工具、AI 模型部署工具等等的公司。
然而,最具投资价值的领域是应用层,就像互联网时代的用户最多的网站是谷歌、亚马逊、Facebook 等应用层公司一样,AI 时代最有价值的公司也 likely 是应用层公司。在云计算时代和移动互联网时代,应用层都诞生了大约20家市值超过10亿美元的公司,例如 Salesforce、Zoom、Uber 等等。在AI 时代,应用层也有可能诞生大量的独角兽公司,例如开发 AI 医疗应用、AI 教育应用、AI 金融应用等等的公司。
应用层 AI 公司之所以具有投资价值,是因为它们能够直接为用户创造价值,就像智能手机上的应用一样,能够直接满足用户的各种需求。AI 推理能力的提升,使得应用层 AI 公司能够开发出更强大的产品和服务,解决更复杂的问题,例如开发出能够自动诊断疾病的 AI 医疗应用,能够自动批改作业的 AI 教育应用等等。
以下是一些值得关注的应用层 AI 公司:
-
Harvey:AI 律师,能够帮助律师进行法律研究、撰写法律文件等等。
-
Glean:AI 工作助手,能够帮助用户快速找到所需的信息,提高工作效率。
-
Factory:AI 软件工程师,能够自动生成代码、修复 bug 等等,减轻程序员的工作负担。
-
Abridge:AI 医疗记录员,能够自动将医生的语音转换为文字,提高医疗记录的效率和准确性。
-
XBOW:AI 渗透测试员,能够自动进行网络安全测试,提高网络安全水平。
-
Sierra:AI 客户支持代理,能够自动与客户进行对话,解决客户的问题,提高客户满意度。
这些公司正在利用 AI 技术解决各行各业的实际问题,为用户创造巨大的价值,它们代表着 AI 应用层的发展方向,也是 AI 创业的最佳赛道。
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。