来源:AICG工具箱 责编:网络 时间:2025-04-21 09:24:37
2024年3月18日报道丨AI资讯早报
当地时间3月17日,马斯克信守诺言,赶在本周的最后时刻开源旗下大模型。马斯克的AI创企xAI正式发布备受期待大模型Grok-1。据专家分析,其参数量达到了3140亿,远超OpenAI前年发布的GPT-3.5的1750亿规模。
这是世界上迄今参数量最大的开源大语言模型,遵照Apache 2.0协议开放模型权重和架构。
Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,这种MOE架构重点在于提高大模型的训练和推理效率,形象地理解,MOE就像把各个领域的“专家”集合到了一起,遇到任务派发给不同领域的专家,最后汇总结论,提升效率。决定每个专家做什么的是被称为“门控网络”的机制。
目前,xAI已经将Grok-1的权重和架构在GitHub上开源。
刚刚宣布放弃造车项目的苹果公司,在当今的人工智能(AI)竞赛中落伍了。为了摆脱窘境,苹果近期放弃了造车项目,正在全面转向生成式AI领域,并且很快有了新动作,推出了一款被命名为「MM1」的多模态大模型。
MM1的独特之处在于其庞大的规模和架构创新,包括密集的模型和混合专家模型。研发团队称,MM1不仅在预训练指标中是“最先进的”,并且在一系列已建立的多模态基准测试中,经过微调后也保持了“有竞争力的”性能。
据了解,MM1最高参数量为300亿,支持增强的上下文学习和多图像推理,在多模态基准测试中表现较好。尽管MM1的整体性能还没有完全超过谷歌的Gemini和OpenAI的GPT-4,但它被认为是苹果在AI方面的一次重大飞跃。
根据彭博社报道,苹果公司在今年年初收购了一家加拿大AI创企DarwinAI,这家创企的首席科学家连同数十名员工已经加入了苹果的AI部门。这也是苹果已知收购的第33家AI公司。截止2023年底,苹果总共收购了32家AI公司,是当今知名科技公司中收购人工智能研究机构数量最多的大厂。
DarwinAI开发的AI技术主要用于工业制造过程中的印刷电路板(PCB)视觉检测领域,他们的核心技术优势主要是把AI系统做的更小型化,同时兼顾较高的处理速度。
这其实刚好正中苹果下怀,彭博社报道认为,苹果一直致力于做的就是在终端设备商本地运行AI大模型,而不是放在云端,因此DarwinAI的技术优势对苹果来说,经过评估之后很可能会有所帮助。
据外媒报道,来自南加州大学的最新研究显示,他们使用一种反向的攻击方法,花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的大概模样给呈现出来。南加大团队三位作者破解出了未公布的 gpt-3.5-turbo 嵌入向量维度(embedding size)为 4096 或 4608,通过这个数据可以推算出 GPT-3.5 的大概参数规模。
根据目前已知的开源大模型,比如 Llama 和 Mistral,嵌入式向量维度在 4096 的时候,参数规模大约为 7B 参数规模。其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。
因此南加大团队指出,可以反向倒推 gpt-3.5-turbo 的参数规模也在 7B 左右,除非是专家模型 MoE 架构可能不同。
3月15日,美图公司披露2023年业绩报告,总收入27亿元,同比增长29.3%。经调整后归属于母公司权益持有人净利润3.7亿元,同比增长233.2%。美图CEO欣鸿在业绩会上表示,AI 原生工作流会是未来非常巨大的机会,美图会致力于 AI 原生应用的进一步打造。同时他还强调,美图不会做通用大模型,但美图会针对不同垂直场景的需求做模型的训练和微调。
吴欣鸿透露,Sora 给了行业较大的心理冲击,原本以为这样的能力会在 2-3 年后才能实现。Sora 也让美图反省了视觉大模型的底层架构,紧急升级了模型的底层框架,重新投入到图像和视频模型的训练。他认为,垂直场景支撑创新的 AI 原生应用还有约 2 年的窗口期。
【AI奇点网2024年8月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
硅谷AI大厂Meta官网上新,官宣Llama 3正式发布。提供80亿和700亿参数两个版本。有意思的是,80亿版本在某些测评项目的成绩上还超过了70亿版本。
英伟达CEO黄仁勋日前参加了“CadenceLIVE硅谷2024”大会,与大会主办方进行了一场对话。黄仁勋谈到人工智能和加速计算在塑造行业大趋势中的关键作用。
「人形机器人天花板」波士顿动力,上新了!波士顿动力发布的新款电驱版Atlas机器人采用了全电驱动方案。高难度360°转体起身……惊艳全场!
全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
可灵ai发布网页版_WAIC最新发布会_可灵官方网站
Anthropic发布新一代Claude 3.5 Sonnet丨微信输入法V1.2版提供AI问答丨北京首例「AI换脸软件」侵权案宣判
号外!华军AI产品榜重磅首发:8月国产AI文生视频工具大爆发
讯飞星火大模型V3.5春季上新,长文本长图长语音,生产力实测:你的超级知识助手来了!
国产大模型最新横评:百度文心一言5大维度21项小类测评第一,依然是国产老大
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
AI3D大模型测评_3D大模型有哪些_3D大模型怎么样
AI视频生成器Pika 1.0正式版怎么用_使用教程_Pika 1.0评测怎么样
爱奇艺上线国内首个AI视频搜索_直接搜剧情,直达高能名场面