ChatGPT视觉功能
OpenAI的“12天盛典”已过半,在第六天,我们迎来了在五月首次展示的——带视频的高级语音模式。
在直到12月20日的每一个工作日,这家人工智能实验室都将发布至少一项产品、服务或功能的公告。可以说到目前为止,这些发布内容各有千秋。
今天的OpenAI演示者包括首席产品官凯文·韦尔(Kevin Weil),以及语音和视觉专家杰基·香农(Jackie Shannon)、米歇尔·秦(Michelle Qin)和罗温·泽勒斯(Rowan Zellers)。
如果这还不够,我们还将在整个12月推出一个圣诞老人语音,似乎带着英国口音。我的四岁孩子喜欢与“AI”交流,肯定会对这个圣诞老人语音着迷。
视频和屏幕共享功能将从今天开始在ChatGPT移动应用中向团队、Plus和Pro用户推出,欧洲用户除外。
圣诞老人语音在使用高级语音模式的任何地方都可以使用。
立即注册,获取最佳黑色星期五优惠!
发现来自汤姆指南的专家推荐的热门优惠、最佳产品选择和最新科技新闻。
您的电子邮件地址
通过我们代表可信的合作伙伴或赞助商向我发送新闻和优惠
提交您的信息即表示您同意条款与条件和隐私政策,并且您年满16岁。
在演示过程中,他们展示了ChatGPT在视频、语音和文本方面的改进记忆能力。它能够记住摄像头前人物的名字,即使仅通过声音描述。
高级语音本质上是多模态的,因此对话的语调比其他模型更自然。除了视频外,这还将包括屏幕共享,您可以向它展示您的应用程序以解决问题。
这允许您通过选择“共享屏幕”来展示手机上的任何应用程序。您可以打开一条消息,并询问ChatGPT如何回复该消息。它甚至能够识别您打开的应用程序。
在另一个演示中,泽勒斯设置了一个手冲咖啡设备并打开了ChatGPT视觉。它能够识别他所戴的圣诞老人帽和滤杯。然后,它能够逐步指导他制作手冲咖啡的过程。
在整个演示过程中,ChatGPT高级语音保持了自然和友好的声音,调整语调,甚至像人类一样笑。
高级语音与视觉的功能类似于谷歌在其Gemini 2.0发布会上更新的Project Astra。
- 第六天:ChatGPT与高级语音:高级语音是ChatGPT最好的功能之一,此次更新使其能够看到你、世界,甚至是你的手机屏幕。
- 第六天:圣诞老人语音:在整个12月,ChatGPT高级语音将获得新的圣诞老人语音。首次使用时,它们甚至会将您的高级语音消息重置为零,这样您就可以更长时间地交谈。
- 第五天:包含Apple Intelligence的ChatGPT:今天,Apple Intelligence获得了重大更新,发布了iOS 18.2,包括ChatGPT。这带来了从Siri窗口直接增强的视觉和文本功能。
- 第四天:ChatGPT画布发布:OpenAI终于向所有用户发布了ChatGPT画布,其文本和代码编辑器。它还可与自定义GPT一起使用,并具备运行Python代码的能力。
- 第三天:OpenAI推出Sora:OpenAI的人工智能视频生成工具Sora正式发布,可以生成几乎任何风格的视频和图像,从真实到抽象。这是该公司在ChatGPT之外推出的全新产品。
- 第二天:微调AI模型:在圆桌会议上,OpenAI开发人员专注于OpenAI模型背后的力量以及针对复杂领域特定任务的AI模型的强化微调,使其在科学、金融和医学等特定领域工作。
- 第一天:ChatGPTPro层:萨姆·奥特曼(Sam Altman)和他的圆桌会议继续进行12天的活动,宣布了一个面向科学研究和复杂数学问题解决的ChatGPT Pro层,月费为200美元(还包括无限的o1使用和无限的高级语音)。
- 第一天:ChatGPT o1模型:OpenAI的12天AI活动以一场颇为尴尬的圆桌直播会议拉开序幕,奥特曼和他的团队宣布o1推理模型现已完全发布,不再处于公开预览状态。
关注公众号【真智AI】
TOP AI模型智能问答|绘图|识图|文件分析