来源:AICG工具箱 责编:网络 时间:2025-04-25 15:22:04
3月7日报道丨3月6日晚间,李开复旗下的人工智能大模型创业公司“零一万物 01AI”发布消息称,对外开源 Yi-9B 模型,这款大模型的特点是综合数学能力突出,官方称其为 Yi 系列模型中的“理科状元”。
Yi-9B 是目前 Yi 系列模型中代码和数学能力最强的模型,实际参数为 8.8B,默认上下文长度为 4K tokens。
该模型是在 Yi-6B (使用了 3.1T tokens 训练)的基础上,使用了 0.8T tokens 进行继续训练,数据截至 2023 年 6 月。
据介绍,在综合能力方面(Mean-All),Yi-9B 的性能“在尺寸相近的开源模型中最好”,超越了 DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B 和 Gemma-7B。
代码能力方面(Mean-Code),Yi-9B 的性能仅次于 DeepSeek-Coder-7B,超越了 Yi-34B、SOLAR-10.7B、Mistral-7B 和 Gemma-7B。
在数学能力方面(Mean-Math),Yi-9B 的性能仅次于 DeepSeek-Math-7B,超越了 SOLAR-10.7B、Mistral-7B 和 Gemma-7B。
在常识和推理能力方面(Mean-Text),Yi-9B 的性能与 Mistral-7B、SOLAR-10.7B 和 Gemma-7B 不相上下。
官方更声称,Yi-9B(BF 16) 和其量化版 Yi-9B(Int8) 都能在消费级显卡上轻松部署,使用成本较低,开发者友好。
“零一万物”由李开复亲自带队创办,此前已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。
硅谷AI大厂Meta官网上新,官宣Llama 3正式发布。提供80亿和700亿参数两个版本。有意思的是,80亿版本在某些测评项目的成绩上还超过了70亿版本。
【AI奇点网2024年6月7日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
英伟达CEO黄仁勋日前参加了“CadenceLIVE硅谷2024”大会,与大会主办方进行了一场对话。黄仁勋谈到人工智能和加速计算在塑造行业大趋势中的关键作用。
「人形机器人天花板」波士顿动力,上新了!波士顿动力发布的新款电驱版Atlas机器人采用了全电驱动方案。高难度360°转体起身……惊艳全场!
全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
科大讯飞星火大模型V1.5升级版首发测评:文本反馈疾速,一项指标“遥遥领先”
Hey Photo最新教程_Hey Photo图像实时调整
SD渲染脚本_核显怎么跑stable diffusion_SD
有什么方式可以运行stable diffusion_怎么用Docker容器运行 SD
Midjourney 模型如何选择_怎么选择MJ模型
MJ怎么批量出图_怎么用MJ批量生图
ChatGPT计划在年底将订阅费涨到22美元/月丨Llama 3.2发布:手机端侧可运行丨百度世界大会将于11月12日举行
ChatGPT将新增8种语音音色丨小米小爱音箱推送小爱大模型丨阿里通义Qwen2-VL视觉语言模型开源
「苹果AI」功能将来会收费,iPhone 16的AI算力将超过AI PC电脑