来源:AICG工具箱 责编:网络 时间:2025-06-06 12:17:45
6月12日报道 |北京百度网讯科技有限公司获得了一项关于生成数字人的专利授权。该专利名为"生成数字人的方法、模型的训练方法、装置、设备和介质",涉及到自然语言处理、深度学习、计算机视觉、图像处理、增强现实和虚拟现实等人工智能技术领域。该专利的应用范围包括元宇宙等多个场景。
专利方案的实现过程如下:
首先,获取素材内容。利用预训练的场景划分模型从素材内容中确定多个场景。每个场景对应素材内容中的一个具有完整语义信息的内容片段。针对每个场景,基于相应的内容片段确定该场景对应的目标内容。根据目标内容确定该场景的场景标签信息。最后,根据场景标签信息配置特定于该场景的数字人。该专利的目的是改善数字人在视频中的应用体验。传统的数字人应用通常基于固定的模板进行,比如播报新闻的数字人。然而,在这种情况下,数字人可能与内容割裂,播报内容与数字人形象不匹配,给用户带来差劲的观看体验。
通过将素材内容按照场景切分并以场景为粒度配置数字人,该专利确保了数字人与场景和目标内容的一致性。这种方法改善了素材内容和数字人之间的融合,提升了用户观看数字人的体验。
该专利的授权对于数字人技术的发展和元宇宙等领域的应用具有重要意义,为提升数字人与场景的一致性和用户体验提供了新的解决方案。
本地SD部署速度一直被大家诟病,本次视频就给大家分享Tensorrt插件是如何秒变“5090”,让你的显卡生图速度提升4倍!
在这个时代里,不是模型越大越好,而是更加贴合实际应用场景的小型化、定制化模型正在成为主流。
DeepL 发布了新一代面向翻译和编辑应用的大型语言模型。据 DeepL 官方称,该模型在翻译质量和流畅度方面均优于当前市场上的其他竞争对手。
关于微软撤离中国AI团队这件事,或许早有预兆。目前,在AI研究方面,微软正在对中国区的员工进行一定的技术“隔离”。
TensorRT插件安装_TensorRT插件怎么提升SD生图速度_stable diffusion插件
阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图
MJ怎么批量出图_怎么用MJ批量生图
苹果与OpenAI合作,发布新版Siri与生成式AI功能丨马斯克宣布将禁用iPhone丨OpenAI百万年薪挖角谷歌芯片人才
华为HDC 2024大会将发布盘古大模型5.0丨谷歌Gemini手机版将迎来多项功能更新丨马斯克xAI计划融资60亿美元
苹果WWDC定档6月10日将发布AI战略丨中国时报:苹果与百度尚未达成AI合作丨抖音发布AI数字人治理公告
OpenAI CEO奥特曼最新讲话汇总,再次曝光GPT-5细节:性能飞跃超乎想象,低估它的人都会被吓傻
李开复:最好的AI大模型已经达到人类平均智商的三倍,“杀手级应用”已经出现
重磅!英伟达正式官宣「AI核弹级」芯片B100,性能比H100强两倍的H200将于2024年第二季度出货
面对Sora训练数据来源一问三不知!OpenAI遭遇成立以来最为惨烈的公关灾难