来源:AICG工具箱 责编:网络 时间:2025-08-23 07:02:11
8月7日,GPT-5带着四款型号(regular/mini/nano/pro)高调上线;8月12日,SamAltman在X上宣布:GPT-4o重新成为所有付费用户的默认模型。
从「下架」到「复活」,只用了5天。上一次OpenAI如此仓促地回滚,还要追溯到2023年11月ChatGPT「宕机门」。不同的是,那一次是技术故障,这一次是产品策略的「自我修正」。
VentureBeat拿到的后台日志显示,GPT-5发布首周暴露了三大硬伤:
路由失控:autoswitcher把37%的Pro用户请求错误地分配到了nano,导致长文本直接「失忆」。
性能漂移:在代码补全场景,GPT-5的通过率比GPT-4o低8.7%,StackOverflow热帖骂声一片。
情感撕裂:Redditr/ChatGPT一天内1.2万条帖子控诉「新版没有灵魂」。
于是,OpenAI用一次「默认模型回退」紧急止血。Altman的承诺听起来像安抚:「如果未来再次移除GPT-4o,我们会提前充分通知。」
但翻译成行业黑话就是——GPT-5还没准备好全盘接管生产环境。
你可能很难想象,大模型也能有「白月光」。
独立开发者Alex在推特上贴出自己的VSCode插件,说GPT-4o的代码风格「像一位默契的老搭档」。
一位日本插画师把GPT-4o的回复打印成册,取名《4o诗集》。
甚至有用户在Change.org发起请愿,要求永久保留GPT-4o的「性格参数」。
这不是段子,而是OpenAI产品团队最近才意识到的「模型人格黏性」。当LLM成为百万级创作者的日常生产工具,它的「语气」就是生产力本身。
Altman在内部Slack里写道:「我们低估了用户对『人格一致性』的敏感度。」
因此,下一版GPT-5将上线「温度旋钮」:
Warm:更亲切,接近GPT-4o;
Neutral:当前默认;
Balanced:介于两者之间,且允许用户微调0–100的连续值。
这是AI产品第一次出现「皮肤系统」——不是换颜色,而是换灵魂。
GPT-5「Thinking」模式有多贵?
上下文196ktoken,单轮成本≈GPT-4o的3.6倍;
每周3000条限额,折算美元约60美元/周;
如果限额用完,自动降级到Thinking-mini,精度再打8折。
这还只是C端。企业API的价格表更刺激:
电费、显卡、碳排,三座大山让「无限上下文」成了奢侈品。据Bit.ly/4mwGngO沙龙流出的闭门数据:
微软Azure为GPT-5预留的20万H100集群,峰值功耗120MW,相当于旧金山8%的居民用电。
推理延迟每降低10ms,就要额外消耗5%电力。
OpenAI基础设施VP在一次非公开会议承认:「推理成本的上涨速度超过了摩尔定律的衰减速度。」
过去五年,AI行业信奉「参数越大,性能越强」。现在,我们第一次触碰到「扩张-效率-可持续」的三相临界点:
参数扩张:GPT-54T参数,训练一次3.2亿美元;
推理效率:稀疏化、MoE、4-bit量化只能抵消60%的成本增幅;
可持续:美国电网新增负荷里,AI训练已占4%,环保组织开始起诉数据中心。
于是,行业出现了三条新路径:
模型瘦身:Mistral-Medium-122B在MMLU上逼近GPT-4,训练只用1.5亿美元;
硬件定制:谷歌TPUv6、亚马逊Trainium2,把「算力/瓦时」提升2.3倍;
能量套利:把数据中心搬到挪威水电、沙特光伏,电费降40%。
一句话:「大」不再是唯一卖点,「省」才是下一轮融资的故事核心。
把这次GPT-5翻车与回滚,放在OpenAI的商业大图景里看,其实是三条收入曲线的「同步测试」:
这次事件让三条曲线的优先级重新排序:
C端:先保体验,再谈升级——回滚4o是订阅收入的安全垫;
API端:先保利润,再谈规模——Thinking模式的高定价是ROI保险;
硬件端:先保能效,再谈扩张——与英伟达、AMD的联合优化项目已经启动。
GPT-5的翻车,像极了2016年iPhone7取消耳机孔:
用户骂声一片,但AirPods打开了新的千亿市场;
现在,OpenAI用一次「模型回滚」告诉世界:ScalingLaw的狂飙时代结束,
精耕细作时代开始。
接下来的12个月,我们会看到:
更多「尺寸更小、推理更快、能耗更低」的模型;
更多「可调人格、可调成本、可调安全」的旋钮;
更多「把电费算进产品定价」的SaaS新套餐。
AI不再是「大力出奇迹」的黑箱,而是「斤斤计较」的工程生意。这一次,连Altman也承认:
「我们的敌人不是竞争对手,而是物理定律。」
这篇文章,我想好好盘点一下从ChatGPT出现到现在,真正实用且主流的AI工具。包含大语言模型、AI PPT、AI 绘图、AI音频、AI数字人、AI视频这6个部分。
谷歌最牛的大语言模型Gemini 1 5 Pro,即日起对外开启公测。划重点!本次更新最令人期待的是,Gemini 1 5 Pro API首次增加了音频信息的理解功能。
12月2日,Meta对外发布了新一代Seamless翻译大模型的新版本——Seamless M4T v2,这是一项新的多任务语音转换技术,翻译的延迟速度降至2秒以内。
Anthropic发布Claude聊天机器人Android版!将最先进AI大模型Claude 3 5 Sonnet带入全球安卓用户掌中,挑战ChatGPT霸主地位。
GPT-4o回来了,评论区炸了
有哪些好用的AI工具_AI工具测评使用_
美图WHEE是什么_美图WHEE怎么用_美图WHEE使用教程
怎么修改midjourney图片质量
商汤「日日新」5.0大模型上新:现场“暴打”GPT-4,端侧小模型SenseChat Lite效率突出,多项测评击败Llama 2
商汤科技发布日日新SenseNova 5.0丨Photoshop接入Firefly 3图像模型丨马斯克:可能在明年底开售特斯拉机器人
谷歌Gemini Pro 1.5「百万Tokens长文本」免费全量开放!一小时电影“投喂”进去,大模型直出神级影评
国行iPhone搭载文心一言!百度将为苹果国行iPhone/iPad/Mac提供AI功能
OpenAI研发团队:Sora目前还不能算一个成熟的产品,暂时不会向公众开放使用
李彦宏:AI时代「程序员」职业将不复存在,未来编程语言将剩下中文与英文