来源:AICG工具箱 责编:网络 时间:2025-01-06 12:50:09
最近一年,人工智能技术迎来了大变革,伴随着ChatGPT的异军突起,科技企业们纷纷加大投入,AIGC大模型的发展日新月异、推陈出新。
为直观感受国内科技大厂所推出的大模型产品的现状、优势及特点。8月12日,新华社研究院对外发布《人工智能大模型体验报告2.0》,通过抓取7月31日~8月4日最新的网络数据组成复合型问答测试卷,以人机互动问答等形式,对国内主流大模型进行使用体验的横向测评。
本次测评在今年6月发布的《人工智能大模型体验报告1.0》基础上,在题目设定、对标Benchmark参照(人类)、人工打分权重、专家测评团队四大方面进行了全面升级:
在题目设置方面,测评题目由6月的300道扩展至8月的500道,并完善了题目分类;在对标Benchmark方面,本次测评将以接受过高等教育的人类作为对照组;在人工打分项目上,本次测评根据对产业、生活的实际价值,引入了人工打分的权重指数;在测评团队方面,邀请了北大文化与传播研究所的专家学者参与。
报告首先提出,大模型概念红利正在逐渐消失,大模型产品的估值将被重新衡量,回归实际应用。事实上,最近两个月AI概念一直在降温,ChatGPT官网的月活访问也在不断下行。报告认为,主流大模型架构的开发进程已过半,在竞争的下半场,如何将AI真正走进千家万户成为关注焦点。
为了更好地还原国内大模型的真实表现,本次测评的对象将围绕以下这些国内企业的大模型产品开展:360智脑、百度文心一言、澜舟科技Mchat、讯飞星火、昆仑万维天工、阿里通义千问、商汤商量、智谱科技ChatGLM(排名不分先后)。
淘宝问问相较于其他功能相似、差异性不强的AI聊天机器人,淘宝AI助手与自身产品能力的结合度特别高,十分成熟。
4月18日,金山办公展示了其具备大语言模型能力的生成式AI应用——WPS AI!据官方介绍,WPS AI是国内协同办公赛道上的首个类ChatGPT式应用。
谷歌一出手,又把AI视频生成卷上了新高度。一句话生成视频,现在在名为Lumiere的AI操刀下,AI视频竟然可以这么厉害!
ChatGPT的插件功能已经面对PLUS用户公开测试一段时间了。在拿到插件测试资格后,小编自然也是欣喜不已,但是看着这80多个插件,真的头大,到底哪个好用?哪个是垃圾?
金山WPS AI新功能新玩法首发测评:不含水分,中文版「GPT+Office」真的来了!
一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度丨Lumiere AI使用体验分享
淘宝AI应用_淘宝问问AI导购助手_官方内测教程方法
首批85个ChatGPT Plus插件全面测评:能打“五星”的插件只有6个
GPTs教程_怎么自己做GPTs_GPTs部署安装
国内首次2024全科高考AI测评开分:阿里通义、GPT-4o等七款大模型参与,文科进一本理科进二本
实测阿里通义千问视觉大模型Qwen-VL Max「超大杯」:会读图、写代码,秒懂网络梗图,中文顶流性能视觉大模型
Midjourney V6生图超进化!国外大神深度测评:对比V5.2版本,画质逼真骇人,人像细节不再有「AI感」
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
飞书AI协同办公产品“飞书智能伙伴”实测:AI员工搬砖效率震惊全公司