腾讯AniPortrait开源：音频合成逼真人脸动画，对标阿里EMO

日期：2024-12-23 作者：ira0v 评论：0 移动：http://w.yusign.com/mobile/news/1806.html

核心提示：前言在数字时代，人工智能技术的创新正以前所未有的速度推进着视觉艺术的边界。最近，腾讯公司宣布开源其最新的AI

前言

在数字时代，人工智能技术的创新正以前所未有的速度推进着视觉艺术的边界。最近，腾讯公司宣布开源其最新的AI框架——AniPortrait，这一动作无疑为静态图像动态化技术注入了新的活力。AniPortrait旨在通过音频和参考图像生成高质量、逼真的动画肖像，这不仅展现了腾讯在人工智能领域的深厚实力，也为全球开发者和爱好者提供了一个强大的工具，以推动创新和探索。

Huggingface模型下载：https://huggingface.co/ZJYang/AniPortrait
AI快站模型免费加速下载：https://aifasthub.com/models/ZJYang

AniPortrait核心功能与技术原理

AniPortrait框架的设计思路来源于将音频信息与静态肖像相结合，创造出既逼真又连贯的动画效果。通过利用先进的Audio2Video大模型，AniPortrait能够分析音频中的节奏、语调和发音，然后将这些信息转化为对应的3D面部网格和头部姿势，最终生成动画肖像。

该框架主要包括两个阶段：音频处理与3D面部表示，以及2D标记点到动画的转换。在音频处理阶段，使用预训练的wav2vec模型提取关键语音特征；随后，这些特征被转化为3D面部网格和头部姿势。在动画生成阶段，通过扩散模型结合运动模块，将2D面部标记点序列转换为一系列动画帧。

此外，AniPortrait引入了PoseGuider模块，通过ControlNet的多尺度策略和交叉注意力机制，进一步提高了生成动画的准确度和自然度。

对标阿里EMO的意义

阿里巴巴此前推出的EMO技术因其创新性而备受关注，但尚未开源。AniPortrait的发布，不仅填补了开源领域的空白，也展现了腾讯在对标并超越业界技术方面的决心。从目前公布的演示效果来看，AniPortrait在面部表情、口型同步以及动画自然度方面均展现出令人印象深刻的表现，这证明了腾讯在动态肖像生成技术上的领先地位。

结论

腾讯通过开源AniPortrait框架，不仅展示了其在AI技术研发方面的实力，也为全球创新者提供了一种全新的创作工具。随着技术的不断进步和社区的共同努力，有理由相信，AniPortrait将开启动态肖像生成技术的新纪元，激发更多的创意和可能。

模型下载

Huggingface模型下载

https://huggingface.co/ZJYang/AniPortraitAI

快站模型免费加速下载

本文地址：http://w.yusign.com/news/1806.html 述古往 http://w.yusign.com/static/ , 查看更多

标签： 动画

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0打赏 0评论 0

更多>同类资讯

0 条相关评论

相关文章

最新文章

推荐文章

推荐图文

资讯

点击排行

• 赛马娘原型大盘点，原来动漫中的赛马有这些历史	• AI智能生成搞笑沙雕动画剧本与文案工具——一键
• 一张照片生成人物动画！三星最新AI研究成果出炉	• 24年Flutter都没消息了，是淘汰了吗？
• 编写高质量Python (第33条) 通过 yield from 把	• 智能AI打造的全方位动画剧本创作宝典：创意故事