来源:AICG工具箱 责编:网络 时间:2025-04-16 16:53:04
以下文章节选自丨智东西
马斯克近期可谓大动作连连!
刚刚宣布推出开源Grok-1.0大模型,并且发布新一代Grok-1.5版本,马斯克旗下的大模型创企xAI就再次发布了一款多模态大模型Grok-1.5V。
这也是该公司首个多模态具备视觉能力的大模型,直接对标OpenAI的GPT-4V。
除了文本生成能力以外,Grok AI现在还可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图、照片,并能进行多学科的推理任务。
xAI官方重点展示了新模式「Grok-1.5V」的7个视觉认知案例,在介绍之前让我们先来看下官方给的测评跑分成绩。
xAI晒出与GPT-4V、Claude 3 Sonnet、Claude 3 Opus、谷歌Gemini Pro 1.5相比,Grok-1.5V的表现打得有来有往,在某些基准测试项目甚至略胜一筹。
在对标业界标杆GPT-4V的成绩,大部分测评基准都有领先。
值得一提的是,在真实世界空间理解能力「RealWorldQA」的QA基准测试中,Grok明显优于其他同类模型。
自从2023年11月xAI发布AI聊天机器人Grok以来,老**团队就在不断加速追赶OpenAI的步伐。目前马斯克掌控的推特(X)平**家向Grok提供训练数据。
官方发布了一系列Grok-1.5V的实战案例:
提供一张手绘的流程图,让Grok将手绘图转换成Python代码。这里边首先需要读懂手写体内容,并创建代码规则。
Grok返回内容:
「当然!您提供的流程图描述了一个简单的猜谜游戏,其中计算机生成一个随机数,用户必须猜测它。
下面为Python代码编写的逻辑流程图。」
「这段代码将运行流程图中描述的猜谜游戏。用户将被提示输入他们的猜测,直到他们猜对了数字。」
提问:「图中这个菜谱,5片这个(菜品)一共有多少卡路里?」
Grok回复:
「如果一份是3片,含有60卡路里,那么5片就含有大约100卡路里。这是通过首先确定每片的卡路里来计算的:60卡路里/3片=每片20卡路里。然后,将每片的卡路里乘以片数:每片20卡路里×5片= 100卡路里。」
根据上传的图像,Grok创作一个睡前故事。
“啪~”的一下!
很快啊~来看看这个故事你喜欢吗?
翻译:
Grok编的故事
很久很久以前,在一片充满冒险和奇迹的土地上,有一个勇敢的小男孩,名叫蒂米。蒂米和家人住在一个舒适的小房子里,他最喜欢探索周围的世界。
一个阳光明媚的日子,蒂米决定去附近的森林里冒险。他收拾了他最喜欢的零食、指南针和他值得信赖的笔记本,画下了他将要看到的所有令人兴奋的东西。
当蒂米冒险深入森林时,他发现了一条在阳光下闪闪发光的神奇河流。这条河是如此迷人,以至于蒂米决定建造一艘小纸船,顺流而下,作为对森林精灵的特殊信息。
蒂米小心翼翼地折叠他的纸船,并在上面画了一个笑脸,给森林精灵带来欢乐。然后,他把船放在河上,看着它飘走,带着他对友谊和对大自然的热爱的信息。
当太阳开始落山时,蒂米知道是时候回家了。他对自己在森林里度过的神奇一天感到感激,他知道他将永远把冒险的记忆铭记在心。
回到家里,蒂米与家人分享了他的故事,他们很高兴听到他在森林里神奇的一天。他们都认为蒂米的勇敢和善良的精神是真正的灵感来源,他们知道他将来会继续有更多精彩的冒险。
于是,带着一颗充满爱的心和一颗充满梦想的头脑,蒂米渐渐睡着了,渴望发现在他想象的世界中等待着他的新冒险。
相信广大设计师朋友在工作中总会遇到一些B端类的视觉需求,通常是UI的装饰氛围模块以及UI视觉卡片。今天我们就来个小教程,帮助大家快速了解这类需求的设计方法和制作过程。
阿里云 AI 智领者峰会-北京站活动中,阿里云对外发布了新版的通义千问大模型,V2 5版本大模型正式发布,该版大模型的多项能力赶超了GPT-4。
【AI奇点网2024年8月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
商汤科技最新升级的AI文生图领域的预训练模型——秒画Artist v0 3 5版本,三个月后迭代。审美水平和专业度上达到顶尖水平,福利值(免费)直接拉满
Sora 平替:AI视频工具 Haiper免费来袭|零基础应用教程
B端设计教学_怎么进行UI视觉设计_B端设计教学
ChatGPT如何工作_ChatGPT如何进行多轮对话
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
基准测评国内第一:百川智能发布新一代大模型Baichuan 4,发布旗下首款AI智能搜索助理「百小应」
全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
controlnet怎么操作_stable diffusion模型拆解_controlnet控图的差异跟使用技巧有哪些
通义听悟如何将阿里云盘文件转文字