来源:AICG工具箱 责编:网络 时间:2025-04-20 10:27:39
国内人工智能大模型创业公司“月之暗面”终于有了一次面向媒体的公开活动。虽然CEO杨植麟本人并未露面,但是发布了更长上下文窗口的版本:200万字上下文版本,即日起可在Kimi Chat上开启内测。
并且在与Kimi对话过程中,加入了(不打断模型思路的)「继续」功能按钮。
月之暗面工程副总裁许欣然将几摞打印出来的《中医中医内科学》《中医诊断学》、英伟达2023年年度财报、《甄嬛传》剧本版放在桌面上,一摞比一摞厚。
这是为了用来检验大模型的Tokens上下文窗口吞吐能力。
2023年10月,“月之暗面”团队的产品第一次公开亮相,发布了支持20万字上下文窗口的Kimi大模型。
五个月过去后,Kimi主要在3个方面有所提升:
遵循更复杂的指令更强的信息检索能力推出Chat机器人的网页版、Android客户端、iOS客户端、小程序此次月之暗面最主要的动作,就是将自家模型的上下文窗口提升了一个数量级。即从发布之初的20万字,拓展到200万字。
同时据许欣然透露,5个月过去,相同成本、相同设备情况下,模型响应速度提升了3倍左右。
为了达到更好的长窗口无损压缩性能,月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走“滑动窗口”、“降采样”等技术捷径,攻克了很多底层技术难点。
200万字上下文窗口,意味着Kimi模型能够吃下更长的文档内容,完成更长和更复杂的任务。
包括但不限于,让大模型快速整理N多的文件,例如从500份招聘简历中提取信息:
现场月之暗面还提出了“Kimi 10分钟速成定律”。
即无关领域大众小众,也无关资料或多或少,只要把资料一股脑丢给模型,10分钟内,Kimi都能快速入门一个新领域。
比如德州扑克、中医内科、驾驶飞机、大模型推理……
现场还演示了Kimi模型挖掘长篇故事情节中深层次信息的能力。
案例自然是被人类开发程度不足10%的《甄嬛传》。
值得注意的是,月之暗面在媒体沟通会现场提出了一个新说法,即大模型们最近的新竞速赛道,“大海捞针”功能,恐怕全绿也没什么太大意义了。
最初,大海捞针其实是一个非常好的评测标准,因为当时大家都没有针对这个case去优化过。
但现在它已经不是一个很好的评测指标了,当大家都去关注它的时候,就一定会想尽办法去优化它,慢慢就失去了原本的参考意义。
如果大海捞针不行了,有什么新的评测标准能够检测模型长文本能力吗?
“暂时还没有。”许欣然笑道。
他表示,模型窗口越来越长,评测的纬度变得非常非常多,不过团队已经在和学术界团队共同探讨这个开放性的问题。
从20万字上下文窗口,迭代为今天开始内测的200万字上下文窗口,具体的模型应用场景又有什么新的亮眼之处?会不会只是从“处理50封简历”到“处理500封简历”的简单线性外扩?
一味拓展大模型上下文窗口的边界,会不会打造出一把普通人想象中的“皇帝的金锄头”?
“实际上,可能会不断地出现更多的现实场景,只有足够长的context才能完成。”
月之暗面表示,在200万字版本推出后,接下来Kimi模型会在以下几个方向发展:
第一、领域专家。
利用长文本能力吃掉一个领域里几乎所有的相关资料,使调研一个行业成为简单的事情。
第二、可完成复杂多步任务的Agent,月之暗面内部称之为“个人麦肯锡”。
希望模型未来不只是像能处理“帮我翻译一下这个PDF”这类非常具体的任务,也能自动完成抽象、复杂的任务。
第三、多模态能力。
Context长了之后,Kimi模型可以容纳更多高清的、时间更长的这种视频,从而让我们模型很方便地去拓展到更多的模态。
据月之暗面联合创始人周昕宇现场的答复,Sora出来以前,月之暗面就在根据自己的节奏推进多模态能力的研发,Sora的出现也并没有打乱原有的安排。
“预计今年会推出我们自己的多模态模型产品。”
最后,他们家的大模型还悄么声地改名了:
Kimi Chat➡️Kimi智能助手;Moonshot大模型➡️Kimi大模型
【AI奇点网2024年8月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
阿里云 AI 智领者峰会-北京站活动中,阿里云对外发布了新版的通义千问大模型,V2 5版本大模型正式发布,该版大模型的多项能力赶超了GPT-4。
近日,一段网友上传的视频,让华为Pura 70的抓拍功能意外爆火。?Pura 70中搭载了名为「XD Motion」的运动算法引擎,对照片细节进行高清复原。
硅谷AI大厂Meta官网上新,官宣Llama 3正式发布。提供80亿和700亿参数两个版本。有意思的是,80亿版本在某些测评项目的成绩上还超过了70亿版本。
AI绘画教程_怎么用AI创作多角度人像_多角度人像_人物多角度
ChatGPT如何工作_ChatGPT如何进行多轮对话
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
基准测评国内第一:百川智能发布新一代大模型Baichuan 4,发布旗下首款AI智能搜索助理「百小应」
国产AI创业公司Kimi Chat凭200万字上下文窗口「长文本」大火,但前景可能跟淄博相似
号外!华军AI产品榜重磅首发:8月国产AI文生视频工具大爆发
讯飞星火大模型V3.5春季上新,长文本长图长语音,生产力实测:你的超级知识助手来了!
国产大模型最新横评:百度文心一言5大维度21项小类测评第一,依然是国产老大
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
AI3D大模型测评_3D大模型有哪些_3D大模型怎么样