来源:AICG工具箱 责编:网络 时间:2025-04-27 10:46:49
2月AI技术亮点频出,视频中介绍了五个值得关注的项目:SORA的竞争者、Stability AI的视频扩散模型、阿里推出的文生视频大模型、Box Matter的交互式动画,以及emo(阿里集团的视频合成模型)。同时,图像领域的大模型,如CBLIAI的Stable Cascade和Adapter研究,以及语言模型GEMINI1.5和Google的La2.也显示了技术的快速发展。
一、视频领域的新技术
- 00:07 - Stable Video Diffusion 已在网站上进行公测,支持文字转视频和视频生成。
- 00:33 - 阿里图像视频大模型支持纹身图生成,稳定性较好。
- 00:50 - Box matter 通过框框控制画面中的物体运动,生成可控视频。
- 01:16 - 阿里Mind 大模型可基于一张图片和一段声音生成合成视频,效果自然。
二、图像领域的新进展
- 02:47 - Stable Cascade 效果超越 SDXL。
- 03:03 - Stable Diffusion3 即将推出,基于与 SORA 相同的底层。
- 04:16 - Adapter 使 S1.5 上训练的模型可以在 SDXL 模型上使用。
三、语言大模型和其它技术
- 04:33 - Google GEMINI1.5 是动漫代模型,上下文理解和记忆能力增强。
- 05:03 - Google Glama 在生成代码、解决数学和理论问题方面表现优异。
- 05:31 - 英伟达 Chat with RTX 可在使用其显卡的电脑上对话和控制信息。
硅谷AI大厂Meta官网上新,官宣Llama 3正式发布。提供80亿和700亿参数两个版本。有意思的是,80亿版本在某些测评项目的成绩上还超过了70亿版本。
Stable Diffusion 是一种基于扩散过程的图像生成模型,可以生成高质量、高分辨率的图像。它通过模拟扩散过程,将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性,可以生成具有多样化效果和良好视觉效果的图像
【AI奇点网2024年6月7日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
英伟达CEO黄仁勋日前参加了“CadenceLIVE硅谷2024”大会,与大会主办方进行了一场对话。黄仁勋谈到人工智能和加速计算在塑造行业大趋势中的关键作用。
有什么方式可以运行stable diffusion_怎么用Docker容器运行 SD
全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
科大讯飞星火大模型V1.5升级版首发测评:文本反馈疾速,一项指标“遥遥领先”
金山WPS AI新功能新玩法首发测评:不含水分,中文版「GPT+Office」真的来了!
Hey Photo最新教程_Hey Photo图像实时调整
SD渲染脚本_核显怎么跑stable diffusion_SD
小白0基础教程:利用AI视频生成工具,批量制作视频,太爽哦
Midjourney 模型如何选择_怎么选择MJ模型
MJ怎么批量出图_怎么用MJ批量生图
ChatGPT计划在年底将订阅费涨到22美元/月丨Llama 3.2发布:手机端侧可运行丨百度世界大会将于11月12日举行