来源:AICG工具箱 责编:网络 时间:2025-05-04 10:07:14
12月25日报道丨今年10月,苹果和哥伦比亚大学的研究人员低调地发布了一个名为「Ferret」(中文名:雪貂)的开源多模态大语言模型。这款大模型其实是苹果公司与哥伦比亚大学研究人员的合作成果。当时发布的内容包括了代码生成和权重,仅限研究用途,不可用于商业。因为没有太多的宣发,当时并未引起广泛的注意。
一直奉行闭环生态的苹果公司在今年 10 月正式加入了开源 AI 的圈子。Ferret 的推出展现了苹果对影响深远的 AI 研究的承诺。这款模型既能精准地识别图像并描述其内容,还能辨别和定位图像中的各种元素。
Ferret 有 7B 和 13B 两个参数量版本,是一个对标微软、谷歌的10B量级的小参数模型。此外,为了增强模型的能力,苹果专门收集了一个名为 GRIT 数据集。该数据集包含了 110 万个样本,涵盖丰富的层次空间知识。
苹果公司 AI/ML 研究科学家 Zhe Gan 在 10 月份发布的一条推文中解释了 Ferret 的用途 —— 一个可以在图像中 "以任何粒度对任何地方的任何东西进行参照和定位" 的系统。它还可以通过使用图像中任何形状的区域来做到这一点。
简单地说,该模型可以分析图像上绘制的区域,确定其中对用户查询有用的元素,并将其识别出来,在检测到的元素周围绘制一个边界框。然后,它就可以将识别出的元素用作查询的一部分,并以典型的方式作出响应。
例如,高亮显示图像中的动物图片并询问大模型“这是什么动物”,大语言模型可以确定该动物的种类,并确定用户所指的是动物群中的某只动物。然后,它还可以利用图像中检测到的其他项目的上下文,提供进一步的回复。
尽管苹果以往以其产品和技术的封闭性著称,但现在它通过GitHub发布开源大语言模型,正逐渐改变这一形象,展现出其在 AI 领域的活跃参与和创新精神。这不仅对苹果自身,也对整个 AI 领域来说,都是一个值得关注的重要发展方向。
GitHub开源代码:
https://github.com/apple/ml-ferret
商汤科技最新升级的AI文生图领域的预训练模型——秒画Artist v0 3 5版本,三个月后迭代。审美水平和专业度上达到顶尖水平,福利值(免费)直接拉满
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
Stable Diffusion 是一种基于扩散过程的图像生成模型,可以生成高质量、高分辨率的图像。它通过模拟扩散过程,将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性,可以生成具有多样化效果和良好视觉效果的图像
免费版的 ChatGPT 足以完成大多数任务,但如果想要更快的响应、更多的细节和访问最新的功能,应该考虑获取 ChatGPT Plus。现在Plus版本已经可以连接互联网,获取最新的消息,以及各种各样的小插件,非常好用!
ChatGPT Plus会员怎么付费_如何升级ChatGPT Plus会员
商汤全新AI绘图大模型“秒画Artist”v0.3.5版本上手测评:作画水平比肩Midjourney!划重点——免费
stable diffusion controlnet_stable diffusion模型哪个好
ChatGPT计划在年底将订阅费涨到22美元/月丨Llama 3.2发布:手机端侧可运行丨百度世界大会将于11月12日举行
国产最强文生视频模型「可灵」首发:直出2分钟超长视频,生成质量完胜OpenAI Sora丨免费体验
快手发布文生视频大模型「可灵」丨广东高考首次启用AI智能巡考丨支付宝推出AI毛发自测工具
字节跳动试水AI硬件研发:重整人马聚焦教育赛道与智能可穿戴终端,两条产品线同时推进
10年缘分说散就散:Ilya Sutskever官宣从OpenAI离职,麾下的“超级对齐团队”负责人也一并离职
4000亿开源大模型「天工3.0」正式上线丨国内首个音乐模型「天工SkyMusic」上线丨波士顿动力发布电动人形机器人
首款AI硬件AI Pin上市即遭翻车口碑丨刘强东AI数字人“采销东哥”今日亮相京东直播丨OpenAI成立东京办事处