陈思衡:人工智能技术发展之智能体崛起
在12月7日举行的第七届智能财务论坛上,上海交通大学副教授、美国卡内基梅隆大学博士陈思衡以“人工智能技术发展之智能体崛起”为主题发表了演讲。
人工智能技术已经悄然渗透到人们的日常生活中。通过文生视频技术,我们能够创造出大量娱乐元素;利用多模态大模型,人们的工作效率得到了显著提升;而自动驾驶技术,如特斯拉所展现的,则为人们带来了更加智能的出行方式。此外,具身智能在工业生产和居家服务中的应用,更是为人们的生活赋予了新的能量。特别值得一提的是,今年10月份,两项具有突破性的诺贝尔奖——物理奖和化学奖,都颁给了与人工智能技术密切相关的成果。从人工智能的发展历程来看,其起源可追溯至1956年的达特茅斯会议。尽管在此之前已有相关研究,但此次会议正式命名了这一领域。然而,人工智能的发展并非一帆风顺,经历了多次起伏。最初,技术局限导致连简单任务都难以解决;1960至1970年代陷入低谷;直至Geoffrey E. Hinton等技术先驱发明了有效技术,人工智能才在20世纪80年代重新焕发活力。进入90年代,数据缺失又成为制约发展的瓶颈。但自2010年起,随着互联网建设、数据获取和基础设施的完善,算力大幅提升,深度学习技术获得蓬勃发展。2022年,ChatGPT的出现标志着人工智能迈向了新的高度。人们开始相信,通过堆叠更多数据、提升算力和构建更大模型,可以实现通用人工智能(AGI)。回顾人工智能近十年重要的发展历程,2017年出现的Transformer架构是人工智能领域的一次重大突破。基于这一结构,工业界和学术界开始了广泛的迭代和创新。2021年,Open AI发布了成功的文生图模型,2022年11月,更是重磅推出了震惊世界的ChatGPT,自然语言处理技术的飞速发展令人瞩目。不到半年后的2023年4月,Open AI又发布了更强大的GPT4模型。随后,该公司今年年初发布的文生视频大模型Sora,再次引领了人工智能AIGC的浪潮。人工智能的目标是希望机器能够像人类一样思考、行动、学习和推理。首先是自然语言处理,这是人类智慧的一种重要体现。通过自然语言处理技术,机器能够理解和生成人类的语言,从而实现与人类的交互和沟通。另一个是视觉领域。视觉是人类认知外部世界最主要、最直接的形式,约80%的外界信息是通过视觉系统获得的,而人工智能也在这一领域取得了显著进展。如今,机器已经能够像人类一样“看”到并理解图像和视频中的内容。此外,人工智能还可以用于科研探索和发现。通过机器学习和数据分析等技术,人工智能能够辅助科学家进行科学实验和数据分析,从而推动科学的进步和发展。最后,通过具身智能技术,人工智能还可以帮助我们完成一些物理世界中的时间性工作。具身智能是指机器通过与物理环境的交互来获取智能的一种方式,这种技术能够让机器更好地理解和适应现实世界。人工智能发展的三个关键要素是数据、算力和模型。如今,大家对这三个要素已经耳熟能详,但在十年前或二十年前,人们并不知道它们是通往更强人工智能的钥匙。当时,人们更多地关注于模型和算法的优化,但实践证明,通过算力和数据的海量堆叠,竟然能够让人工智能达到非常好的效果。当然,模型也起到了重要的作用。在这个过程中,神经网络模型在1950年代和60年代就已经被提出了大致的框架。但由于当时缺乏有效的训练方法和足够的算力支持,这些模型的效果并不理想。然而,随着训练技术的出现以及互联网上海量数据的获取和基础设施的完善,人们开始能够训练出更大规模的模型——深度神经网络。这些模型具有强大的吞吐能力和学习能力,能够处理海量的数据和算力,从而实现了人工智能的快速发展。在自然语言处理方面,随着技术的不断进步和模型的迭代升级,人们开始尝试使用通用模型来解决各种自然语言处理任务。例如,使用ChatGPT这样的模型可以同时处理机器翻译、聊天机器人、语音识别、文本摘要和情感分析等多种任务。而在此之前,这些任务通常需要分别使用不同的模型和技术来处理。此外,随着Transformer架构的提出和应用,人们能够更好地处理长程依赖和全局注意力等问题,从而提高了自然语言处理的效果和效率。在计算机视觉领域,人们也取得了显著的进展。通过模拟人类的视觉系统和处理方式,计算机能够像人类一样理解和分析图像和视频中的内容。例如,在人脸识别方面,计算机已经能够分辨出双胞胎的细微差别;在图像分割和检测方面,计算机也能够实现精准的定位和识别。此外,随着Transformer技术在视觉领域的应用和发展,人们开始尝试将图像或视频切割成小块并研究它们之间的联系和全局关系,从而获得了更好的效果。同时,扩散模型等生成模型的应用也让计算机具备了更强的图像生成能力。除了图像和语言之外,人工智能还在其他领域展现出了强大的能力。例如,在AI for Science方面,人工智能能够辅助科学家进行科研发现和实验数据分析等工作。这种筛选和分析能力恰恰是人工智能所擅长的,并且可以与生命科学、地球科学、化学和核物理等多个领域相结合发挥巨大作用。在未来,可能会有更多的物理学奖、化学奖甚至生物学奖会基于人工智能技术。另外值得一提的是具身智能这一领域。通过让机器与物理环境进行交互和互动学习,机器能够获取更大的智能和适应能力。这种学习方式不仅依赖于视觉等感官信息,还包括触觉等多种方式与环境的互动。20世纪70年代的科学家实验表明,将猫绑在物体上使其无法移动只能被动观察时,它能学到的知识非常有限;而让其主动行走、观察和交互时,则能发现其智能发生了本质的区别。这一发现表明不仅要利用互联网上的被动学习数据来训练人工智能,还要将智能体放入现实物理环境中通过交互进行学习,从而获得更高层次的智能。关于通用人工智能(AGI)的概念,目前仍然比较泛化且充满争议。Open AI在其畅想中提出了AGI的五层分级:第一层是像ChatGPT这样的聊天机器人;第二层是具有推理能力并达到数学博士水平的智能体;第三层是能够自主执行任务的Agents;第四层是具有创造力并能够自我发现和创造东西的智能体;而第五层则是能够胜任整个公司级别项目的智能体。不同学者对AGI也有不同的畅想和预测。人工智能技术的发展趋势也在不断变化之中。开源模型与闭源模型的差距正在逐渐缩小,这体现了开源社区广大科研工作者的努力和成果。同时,大模型的推理能力也发生了本质的变化,使得人工智能在更多领域得到了广泛应用。然而,随着人工智能技术的不断发展,也面临着一些挑战和问题。例如,人类的数据可能不够用,未来机器本身需要产生更多的合成数据来弥补训练数据的缺口;同时,人们也需要通过智能体产生更多自主的决策,并通过RAG等方式降低模型的“幻觉”;此外,还需要通过端侧技术将云端大模型搬到人们的手机和电脑上,实现本地运行大型模型的目标。数字智能体作为AI技术的重要分支,正逐渐成为推动社会进步的重要力量。与一般的AI模型相比,智能体的最大区别在于其“行动能力”。传统的AI模型可能擅长于对话、生成文本或图像等,但智能体则更进一步,它们能够根据环境反馈调整策略,实现真正的“智能”行为。随着技术的不断进步,数字智能体将在更多领域发挥重要作用。例如,在医疗领域,数字智能体可以辅助医生进行诊断、制订治疗方案;在教育领域,数字智能体可以为学生提供个性化辅导、评估学习效果;在金融领域,数字智能体可以预测市场走势、优化投资策略等。未来,人们将见证更多智能体的崛起和应用,它们将为人类带来更加便捷、高效、智能的生活方式。人工智能技术作为当今时代的核心技术之一,其发展和应用对于推动社会进步和经济发展具有重要意义。人们应该充分认识到其潜力和价值,同时也要正视其带来的挑战和风险,积极采取措施加以应对,确保人工智能技术能够真正为人类造福。
报名|企业经营管理“头雁人才”培养计划2024年度产融结合助力新质生产力培育研修班学员选拔培养方案
2024年上海市会计专业技术人员继续教育正式开始(附:详细步骤指引)
港中大-上国会EMPAcc高级财会硕士2025年第26期招生通道开启!
会计(数据分析)硕士学位项目(MiM)第7期2025年招生通道开启!
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。