来源:AICG工具箱 责编:网络 时间:2025-08-06 09:15:21
GPT-5这回是真的要来了。
现在,全网都在“偶遇”GPT-5。
不仅是ChatGPT上有踪迹:
而且在MacOS应用的模型列表中也发现了GPT-5。
还有Cursor、微软Copilot以及OpenAIAPI平台上,也都被网友捉到已经悄悄接入/测试GPT-5。
这一**泄露,大家对GPT-5的热情和好奇再次被重新拉回高点,还是奥特曼会玩啊。
连向来怼天怼地的马库斯都说:不开玩笑,这一次GPT-5真的要来了。
从已经泄露的信息来看,GPT-5肯定更强大。
它将整合GPT系列和o系列,实现多模态和推理能力大一统、编程能力很强、百万tokens上下文、支持MCP等。
最快下周就会发布!
据说微软Copilot上的GPT-5将向所有人开放,不受订阅限制。今年3月,奥特曼在采访中还说了GPT-5将免费向用户开放。
感觉GPT-5这一波,是要全面铺开啊。
所以到底有多强?
根据OpenAI内部人士透露,GPT-5实现推理能力(o系列)和多模态交互能力(4o以及GPT系列)的大一统,以后不用再手动切换模型。
模型包含多个版本:
GPT‑5主模型(代号“nectarine”或“o3‑alpha”)
GPT‑5mini(代号“lobster”)
GPT‑5nano(代号“starfish”)
模型的技术亮点可能包括:
输入上下文窗口高达100万tokens,输出可达10万tokens。
支持MCP(模型上下文协议)与并行工具调用。
动态处理短时与长时推理,集成CodeInterpreter与其他工具。
性能更快、更可靠、更少幻觉、提升长期对话记忆与逻辑处理能力。
其中GPT-5(o3-alpha)被曝在高级编程方面表现出色,能达到接近人类程序员水平,“实现更快、更精准的软件开发”。
它可以自动编写高质量的游戏原型,支持很多应用程序定制以及可以根据特定要求进一步细化。
以及在物理方面也表现出色,一些zero-shot的demo效果也很不错。
Lobster(mini版本代号)有消息称它是一个专用的编程模型。在精度和功能方面均优于Claude4等模型,尤其是在一些复杂的编码任务上。
Lobster可以通过极少的输入快速生成结构完整、功能准确的代码,非常适合处理凌乱的遗留代码,可以自动优化代码结构、清除冗余,同时管理大型软件项目中的依赖关系。
例如一名用户让Lobster和另一个模型同时创建交互式神经网络动画,Lobster一次性就生成了一个带有彩色节点的解决方案,而另一个模型在代码运行中出现错误。
另外Lobster据悉也集成了o3系列模型的高级推理能力,能在简单任务中使用快速响应模式,在复杂任务中触发深层推理模块,更擅长逻辑推理以及解决数学问题。
支持文本、图像、工具调用等多模态,具备类似Agent的多步骤组合执行能力,可以让其同时完成解释图像、编写代码和使用工具等任务,而无需像GPT-4一次只能处理一类输出。
Lobster将是编码、推理、多模态理解的融合,将OpenAI之前彼此独立的模型集合在一起,让用户直接拥有一个功能更强大的工作助手,轻松执行复杂的多步骤任务。
starfish(nano版本)则在前几天悄悄出现在了大模型竞技场上。
测试结果显示,这个模型只能做静态的小游戏界面,无法启动游戏。
除了模型本身外,现在微软和cursor也被曝将火速接入GPT-5。
微软正试行新版Copilot的“Smart模式”(或称“magicmode”),能够智能判断何时调用GPT‑5的深度推理与多模态能力,以简化用户无需手动选择模型的流程。这项功能显示微软极可能在GPT‑5发布后第一时间集成该模型至Copilot及Microsoft365生态中,Azure也在为集成GPT-5做准备。
同时也有人发现,cursor团队正在内部测试GPT-5Alpha版本(图中被模糊掉的部分原来标了GPT-5-Alpha)。
从各方泄露信息来看,GPT-5确实如奥特曼所说,强得可怕。
不过,现在大家更冷静、更理智、也更不容易被忽悠了。
有人就说,那又如何?GPT-5可能在刚刚发布时表现很好,1周过去它就会开始变笨,像此前所有模型一样。
也有人表示这可能是因为模型发布后,出于安全考量会ban一部分能力,所以让大家感觉这是炒作出来的幻象。
“泼冷水王”马库斯也发文表示,即便GPT-5真的更强大,但是他还是要给出7个悲观预测:
尽管GPT-5在能力上会远超GPT-4,但GPT-5仍然是难以控制的,会继续犯一些难以预料的低级错误,甚至不会完全听从指令操作。
GPT-5仍然难以处理一些复杂的物理、心理和数学推理任务。
幻觉依旧普遍,且误导性更高,更容易生成看起来正确但实际内容错误的输出。
自然语言输出仍然无法可靠地链接到下游系统(如数据库、虚拟助手等),自然语言指令难以准确映射到用户意图上。
GPT-5不会是像AGI一样的通用人工智能,仍旧需要其它工具协助完成复杂场景任务。
系统仍将无法稳定地遵循有用无害的人类价值观,在输出回答时可能隐含部分偏见。
GPT-5只是基础的规模扩展,未来AGI将朝向更结构化、具备显性知识与规划能力发展,与更广泛的其它技术集成,而这些都是GPT系列所缺乏的。
社区里也弥漫着相似的观点,毕竟已经被奥特曼溜了太多次,再不发布,网友们都累了……
天天各种真假混杂的爆料,一些泄露的GPT-5基准测试都是fakenews,网友表示,现在除了官方,谁都不可信。
当然也有不少网友认为,这些“不经意间的”泄漏,都是OpenAI在炒作。
总之,不管模型是不是真如宣传所说的这么好,都赶紧发布吧!
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
近日,GoogleDeepMind正式发布首个可完全在机器人本地部署的视觉-语言-动作模型(Visual-Language-Action,VLA)——GeminiRoboticsOn-Device。这也意味着,具身智能(EmbodiedAI)正在从依赖云端算力,迈入
AI时代,赚钱到底有多快?看看这个以色列老哥你就懂了。昨天,一笔看似“不起眼”的收购在硅谷刷屏:Wix用8000万美元,收下了本土AI编程公司Base44。在动辄上亿的一级市场,这个收购价格不算高。但背后的故事
零融资的“隐形数据标注之王”,年收10亿超ScaleAI。智东西6月20日报道,多年来,数据标注在AI产业都处于较边缘地带。近期随着Meta斥资143亿美元收购ScaleAI49%股份,该领域成为人们关注的焦点。但此类公司中
抖音开启AI搜索功能灰度测试丨OpenAI CEO奥特曼:2024年无法实现AGI丨夸克APP上线“健康大模型”
打工人必备ai软件_ai软件推荐_有什么好用的ai软件
体验完ChatGPT最新联网插件Web browsing,我们发现了以下好处与坏处
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
如何定制ChatGPT小工具_有哪些实用的ChatGPT工具推荐
苹果发布新一代iPad mini 7搭载「苹果AI」丨Adobe发布多款在线AI修图工具丨微软AI部门副总裁离职加盟OpenAI
AMD发布新一代AI芯片MI325X和锐龙AI PRO 300丨OpenAI需到2029年才能实现盈利丨字节发布Ola Friend AI智能体耳机
美图AI短片创作工具Moki全面开放丨OpenAI CEO奥特曼发文回应CTO离职丨B站上线自研大模型用于AI字幕生成
OpenAI奥特曼预测:「智能时代」即将到来丨字节即梦AI推出Loopy“对口型”功能丨钉钉推出365会员,强化AI付费服务
OpenAI o1霸榜“大模型竞技场”丨公众号客服系统集成腾讯元器AI智能体丨「苹果AI」加持的Siri升级有望在明年1月推出