来源:AICG工具箱 责编:网络 时间:2025-04-16 12:04:10
2024年4月18日报道丨AI资讯早报
4月17日,国内领先的人工智能大模型开发机构昆仑万维重磅推出4000亿参数的开源大模型「天工3.0」,其采用MoE(混合专家模型)架构,相比2个月前的天工2.0,逻辑推理、语义理解、复杂需求应对、内容创作等4大核心能力大幅提升。
天工3.0新增了图表对比生成、研究模式、增强模式、扩图修图等功能,并针对性地训练了模型的Agent能力,使得模型能够“独立思考”,规划、拆解用户需求,完成复杂任务。
天工3.0参数规模达到4000亿级,是全球最大规模的开源MoE大模型。相较于上一代,天工3.0的模型技术知识能力提升超过20%,数学、推理、代码、文创能力提升超过30%。
天工3.0基座大模型在逻辑推理能力、语义理解能力、应对复杂需求能力和内容创作能力4个方面大幅提升。作为多模态大模型,天工3.0集成了AI搜索、AI写作、AI长文本阅读、AI图片生成、AI音乐生成等功能,在MMBench等多项权威多模态测评结果中超越GPT-4V。
近期,海外的音乐生成产品Suno、Udio爆火,AI音乐生成领域受到了前所未有的关注。昆仑万维基于「天工3.0」打造的「天工SkyMusic」也是中国首个音乐AIGC SOTA(领域最佳水准),其采用音乐音频领域类Sora模型架构,是国内唯一公开可用的音乐生成大模型。
基于天工3.0打造的天工SkyMusic,不仅是目前国内唯一公开可用的AI音乐生成大模型,而且在人声&BGM音质、人声自然度、发音可懂度等性能方面,以6.65分的综合得分超越Suno V3.成为全球AI音乐SOTA模型。
天工SkyMusic可以生成80秒44100Hz采样率双声道立体声歌曲,支持生成说唱、民谣、放克、古风、电子等多种音乐风格,还能学习颤音、歌剧、吟唱、男女对唱、自动和声等歌唱技巧。
天工SkyMusic大幅降低了音乐创作门槛,虽然仍处于起步阶段,但其已经在音乐生成领域取得了不错的效果。4月初开启邀测后,天工SkyMusic后台提交测试申请的人次超百万。
当地时间 4 月 17日,就在刚刚宣布退役其首款液压人形机器人 Atlas 的第二天,知名的机器人研发公司“波士顿动力”对外发布了一款全新的纯电动驱动的人形机器人。新一代 Atlas 机器人拥有比前辈更广的运动范围,能够胜任更多任务。
波士顿动力表示,他们希望通过新版 Atlas 机器人证明,人形外形并不会限制机器人的双足移动能力。新版机器人的关节经过了重新设计,可以灵活旋转,据称能够“胜任乏味、脏污和危险的任务”。
新版 Atlas 的外形也更接近人类。和特斯拉的 Optimus 机器人一样,新版 Atlas 拥有更长的四肢、更直的背部,以及可以根据需要旋转的头部。机器人身上看不到任何电线,它的“脸部”还内置了环形灯。相比于前辈,这无疑是一次巨大进步,新版机器人搭载了众多波士顿动力公司新的人工智能和机器学习工具。
波士顿动力表示,未来几年,他们将与一小部分客户(首家为其母公司现代汽车)共同测试新版 Atlas 机器人。
当地时间4月16日,据外媒消息,谷歌的桌面浏览器 Chrome 地址栏即将添加一种 Gemini 大模型的快捷方式调用方式。用户可以在 Chrome 浏览器内登录自己的账号后,就可以快捷地跳转到 Gemini 网页上进行聊天机器人的使用。
具体来说,用户只需在地址栏输入 @gemini 即可调起谷歌的AI机器人,与聊天机器人 Gemini 开始聊天。
该功能目前正在 Chrome 浏览器 Canary 测试版中进行测试,地址栏下拉菜单底部会出现提醒「输入 @gemini 与 Gemini 聊天」。目前该功能仅适用于 Chrome 浏览器内测的 Canary 125 版本。
当地时间4月16日,据外媒The Information报道,欧洲AI创业公司Mistral近期正计划以50亿美元的估值筹集数亿美元资金。Mistral主要向使用API调用访问其大模型来向客户收费。
创立于2023年的Mistral,由前DeepMind和Meta离职的科学家们联合创办,该公司研发的大模型以OpenAI为对标,并于今年2月推出了与GPT-4竞争的Mistral Large模型,并先后脚获得了微软的投资。目前尚不清楚哪些投资者会参与Mistral的新一轮融资。
Mistral致力于构建一个透明和公开的形象,其命名灵感来源于北方冬季的风。与OpenAI采取的策略不同,Mistral公司正在将其模型开源,并表示他们的产品正在根据欧洲对这类软件更严格的安全开发规定来开发。
相信广大设计师朋友在工作中总会遇到一些B端类的视觉需求,通常是UI的装饰氛围模块以及UI视觉卡片。今天我们就来个小教程,帮助大家快速了解这类需求的设计方法和制作过程。
阿里云 AI 智领者峰会-北京站活动中,阿里云对外发布了新版的通义千问大模型,V2 5版本大模型正式发布,该版大模型的多项能力赶超了GPT-4。
【AI奇点网2024年8月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
商汤科技最新升级的AI文生图领域的预训练模型——秒画Artist v0 3 5版本,三个月后迭代。审美水平和专业度上达到顶尖水平,福利值(免费)直接拉满
Sora 平替:AI视频工具 Haiper免费来袭|零基础应用教程
B端设计教学_怎么进行UI视觉设计_B端设计教学
ChatGPT如何工作_ChatGPT如何进行多轮对话
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
基准测评国内第一:百川智能发布新一代大模型Baichuan 4,发布旗下首款AI智能搜索助理「百小应」
全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
controlnet怎么操作_stable diffusion模型拆解_controlnet控图的差异跟使用技巧有哪些
通义听悟如何将阿里云盘文件转文字