八大中文AI大模型超级评测：表现最佳不是文心一言？

日期：2024-12-24 作者：o93v3 评论：0 移动：http://w.yusign.com/mobile/news/2061.html

核心提示：国内第一批通过审核的AI大模型正式上线，首批上线的AI大模型来自八家不同的公司：百度（文心一言）、抖音（云雀大模型）、智谱 A

国内第一批通过审核的AI大模型正式上线，首批上线的AI大模型来自八家不同的公司：百度（文心一言）、抖音（云雀大模型）、智谱 AI（GLM 大模型）、中科院（紫东太初大模型）、百川智能（百川大模型）、商汤（日日新大模型）、MiniMax（ABAB 大模型）、上海人工智能实验室（书生通用大模型）。

八个AI大模型中有不少都是大家所熟悉的“老面孔”，也有一些对普通人而言颇为陌生的名字。在通义千问、讯飞星火和文心一言等AI御三家中，文心一言倒是速度最快的，不过据小雷了解，通义和星火也已经通过审核，估计近期就会上线。

在第一批上线的AI大模型中，有不少都是面向企业市场的产品，同时也不缺乏面向普通用户的产品，比如大家最熟悉的文心一言，除了全面开放网页端入口外，还同步上线了手机APP，可以在安卓和iOS上使用。

此外，抖音、百川、商汤、智谱等AI大模型都提供了网页和APP的双端使用方法，从内测到公测，国内的AI大模型前进速度超出了不少人的预料，对于普通用户而言，面对如此多的AI大模型，估计也是挑花了眼。

图源：智谱清言

目前的AI大模型，从功能上来说都颇为相似，只不过基于模型优化程度和训练参数大小，AI大模型之间的体验差距并不小。如文心一言等国内科技领域巨头的AI大模型，其表现已经接近国际主流水平，在对中文语言的理解和处理上甚至优于ChatGPT等海外的AI大模型。

时隔半年，文心一言正式上线，不禁让我好奇它与初期版本到底有多大区别？

在所有的AI中，小雷最熟悉的莫过于文心一言，作为小雷测试的首个AI大模型，即使是初期版本都给我留下了不错的印象，当然，印象最深刻的还是那个奇怪BUG。

图源：雷科技注：文心一言初期意外触发的BUG

不过，这个BUG很快就被百度修复，在两周后我再测试同一个问题时，文心一言就已经可以给出正确的回答，只是字数往往无法达到要求。现如今在经过数个月的迭代后，能力更是明显提升，再问它一样的问题，已经能够洋洋洒洒给出一大篇文字回复。

图源：雷科技

虽然没有细数，但是从篇幅来看，500字肯定是有的。

文心一言作为国内最早上线以文绘图的AI大模型之一，早期的表现虽然算不上差，但是在理解能力上还是有些许欠缺，比如我当时要求它以毕加索的风格画一幅优化，生成的画作风格却与毕加索风格大相径庭。

图源：雷科技

那么在6个月后的今天，文心一言的表现又会如何呢？

图源：雷科技

确实是“毕加索”风格，如果可以更抽象一些，那就更像了。

此外还有一个提问是我当时耿耿于怀的。

图源：雷科技

当时的文心一言给了我一幅与提问毫无关系的图画，那么现在的文心一言又能否正确理解我的要求呢？

图源：雷科技

这次，文心一言给出了让我满意的图画。

经过几个月的锻炼，文心一言的各项能力都有着非常明显的提升，在右上角的指令中心里，更是标出了文心一言目前能够提供的服务，从基础的问答写作，到编程辅助、数据分析，多样化的功能已经能够满足大多数人的日常工作、学习等需求。