来源:AICG工具箱 责编:网络 时间:2025-04-16 17:16:33
2024年4月15日报道丨AI资讯早报
马斯克近期可谓大动作连连!刚刚宣布推出开源Grok-1.0大模型,并且发布新一代Grok-1.5版本,马斯克旗下的大模型创企xAI就再次发布了一款多模态大模型Grok-1.5V,也是该公司首个多模态具备视觉能力的大模型,直接对标OpenAI的GPT-4V。
作为对标OpenAI的大语言模型的竞争对手,如今除了文本功能外,Grok AI现在还可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图、照片,并能进行多学科推理。
xAI重点展示了Grok-1.5V的7个示例,包括:将手绘图表转换成Python代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成csv格式、为生活日常问题答疑解惑、解决代码问题。
至此,xAI正式加入前沿多模态大模型的竞赛。与GPT-4V、Claude 3 Sonnet、Claude 3 Opus、Gemini Pro 1.5相比,Grok-1.5V的表现不相上下,在一些基准测试中略胜一筹。
据外媒报道,英特尔计划面向中国市场推出“特供版”AI加速芯片Gaudi 3,包括HL-328和HL-388两种形态。
英特尔公开了第三代 AI 加速器——Gaudi 3的性能参数,基于英特尔自研的5nm制程工艺,专门用于深度学习和大型生成式 AI 模型。Gaudi 3具有先进的制造工艺,带宽是上一代的 1.5倍,BF16 性能提升 4 倍,而网络运算能力则提升了 2 倍。该产品预计将配备高达 128GB 的 HBM3e 内存,在 AI 学习和训练方面表现卓越。
因为受到美国商务部的出口管制规则限制,针对中国大陆市场的特供版AI算力芯片的性能需大幅降低至150 TFLOPS以下,预计性能将降低约92%。同时,TDP也将相应减少,与英伟达此前针对中国市场推出的AI加速卡GPU H20性能相近,但在HBM容量及带宽上可能处于劣势。
InstantID 原团队推出了风格迁移的新方法 InstantStyle,与人脸 ID 不同,它是一个通用的图像风格注入框架,采用两种简单但非常有效的技术,来实现风格和内容与参考图像的有效分离。
InstantStyle的创新之处在于:
【特征相减】利用CLIP模型的特性,通过特征相减的方式去除图像特征中的内容信息,从而减少参考图片内容对生成图片的影响。这种方法的优势在于,内容信息相对容易通过文本描述提取,因此可以通过CLIP的文本编码器提取内容特征,用于解耦风格和内容。
【仅风格层注入】InstantStyle方法仅在特定的风格层完成特征注入,这样做可以隐式地实现风格和内容的解耦。研究发现,在UNet的mid block附近,存在两个特定的层,分别控制风格和空间布局,这为风格化图像生成提供了新的视角。
360公司创始人周鸿祎在哈佛中国论坛上发表演讲,幽默解释了公司名称360的含义,称其代表“250+110”,暗指公司在免费杀毒行业的“二”精神。他还分享了自己对于AI信仰的看法,认为大模型的突破是真正的人工智能,预测未来几年内AGI将到来,并强调所有行业都值得用AI再造一遍。
周鸿祎鼓励创业者关注专业级大模型的机会,并认为中国在AI领域有巨大潜力。
2023年受惠于生成式AI技术的飞跃式发展,英伟达的AI运算GPU受到了全球范围内客户的广泛抢购。这也令英伟达的股价一跃成为了世界前三的科技股。为了解决泼天富贵带来的利益红利,英伟达CEO黄仁勋制定了复杂的薪酬结构,希望借助高额的股权奖励牢牢绑定核心的员工。
英伟达高管团队在2023财年未获得现金奖励,但通过复杂的股权奖励计划仍获得显著收益。黄仁勋获得近5亿美元股权奖励,其他高管最少也有1480万美元收益。公司采用SY PSUs和MY PSUs两种股权奖励,强化了对高管和关键员工的绑定,减少了人才流失的风险。
相信广大设计师朋友在工作中总会遇到一些B端类的视觉需求,通常是UI的装饰氛围模块以及UI视觉卡片。今天我们就来个小教程,帮助大家快速了解这类需求的设计方法和制作过程。
阿里云 AI 智领者峰会-北京站活动中,阿里云对外发布了新版的通义千问大模型,V2 5版本大模型正式发布,该版大模型的多项能力赶超了GPT-4。
【AI奇点网2024年8月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
商汤科技最新升级的AI文生图领域的预训练模型——秒画Artist v0 3 5版本,三个月后迭代。审美水平和专业度上达到顶尖水平,福利值(免费)直接拉满
Sora 平替:AI视频工具 Haiper免费来袭|零基础应用教程
B端设计教学_怎么进行UI视觉设计_B端设计教学
ChatGPT如何工作_ChatGPT如何进行多轮对话
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
基准测评国内第一:百川智能发布新一代大模型Baichuan 4,发布旗下首款AI智能搜索助理「百小应」
全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
controlnet怎么操作_stable diffusion模型拆解_controlnet控图的差异跟使用技巧有哪些
通义听悟如何将阿里云盘文件转文字