来源:AICG工具箱 责编:网络 时间:2025-04-02 16:19:55
2024年5月15日报道丨AI资讯早报
当地时间5月14日,谷歌举办一年一度的I/O开发者大会。经过昨夜OpenAI的“科幻级”演示,所有人都在等着今晚来自谷歌的反击。本次开发者全程两个小时,谷歌CEO在活动上据统计共提及「AI」121次。
此次开发者大会,谷歌将搜索业务做了最彻底的AI改造,还更新升级了Gemini 1.5 Pro版本,同时推出Gemini 1.5 Flash轻量化小模型。此外,推出自称效果超过Sora的生成视频模型Veo。
与OpenAI的仅半个小时的发布活动不同,谷歌摆出了拼死一战的意思。在持续两个小时的超级发布会上,一口气拿出来十来款新品及升级,量大管饱,全面对标OpenAI在AI各领域上的发展。
因为产品太多,我们把他们做了个简单表格整合,连带发布和新升级的AI相关产品足足有14项:
尽管如此,但是外界的普遍评价反响不突出。和GPT-4o半个小时左右的GPT-4o发布会相比,谷歌的表现“缺乏惊喜”,产品组合繁多且记忆点不深刻。
当地时间5月14日,谷歌举办了一年一度的I/O开发者大会。作为主业,谷歌自然会大力将AI融进其主导全球的搜索引擎之中。从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。
谷歌表示,将开始测试AI搜索服务,推出一个新版本的搜索引擎,其中包括人工智能撰写的搜索结果。谷歌表示,本周将向美国用户推出这个具有AI Overviews功能的新搜索引擎,并在未来几个月向更多国家的用户推出,在今年年底前将覆盖超过10亿用户。
根据产品部门在现场的演示,AI搜索引擎具备多步骤推理的能力,例如:寻找一个瑜伽教室,同时展示新手优惠报价,和距离特定位置的步行时间。这个AI搜索引擎助手,还能介绍食谱、安排行程,以及接受视频形式的提问。
当地时间5月14日,谷歌举行I/O开发者大会,在会上宣布扩充旗下最强大模型 Gemini 的家族成员,推出了全新的 Gemini 1.5 Flash 模型,正如其名字「Flash」,重点优化了该模型的速度和效率。
谷歌 DeepMind 首席执行官 Demis Hassabis 在官网的博文中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。
谷歌之所以创建 Gemini 1.5 Flash,是因为开发部门认为,谷歌需要一个比今年 2 月春节期间发布的 Gemini 1.5 Pro 更轻便、执行任务性价比更高的大模型,可以用于更广泛的互联网应用领域。
Gemini 1.5 Flash 的参数量介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间。谷歌表示,这是通过大模型“蒸馏”过程实现的,将 Gemini 1.5 Pro 中最基本的知识和技能转移到体量更小的模型上,以实现更高效的人物执行能力。
这意味着,Gemini 1.5 Flash 与 Gemini 1.5 一样,上限支持 100万 的Tokens 上下文窗口吞吐,将能够一次性分析 1500 页的文档或超过 30000 行的代码库。
当地时间 5月 14日消息,OpenAI 在今年春节发布了文生视频模型 Sora,引发了业内的广泛讨论与热议。谷歌意识到不能就此落后,连着三个月加码推出了类似的产品。在今天举行的 I/O 开发者大会上,谷歌发布了对标产品「Veo」,可以生成长度超过 1 分钟,分辨率最高 1080P 的“高质量”视频,并具有多种视觉和电影风格。
根据谷歌官方新闻稿,Veo 具备对自然语言有先进的理解能力,能够理解“延时摄影”、“航拍风景”等电影术语。
用户可以使用文本、图像或视频提示来指导他们所需的输出,谷歌表示,这样产生的视频“更加连贯一致”,在整个镜头中人物、动物和物体的动作也更加逼真。
在发布会上,谷歌展示了不少的 Veo 视频生成案例,其中最具代表性的就是这一条赛车在城市夜晚中狂飙的视频,长度为1分23秒,视频主体的赛车整体一致性表现较好。
当地时间 5月14日,谷歌举行今年的 I/O 2024 开发者大会,在会上宣布了新一代的文生图大模型,AI在线绘图工具 Imagen 3。新版的大模型进一步增强了文本生成图片的技术能力。
谷歌人工智能研究部门 DeepMind 负责人 Demis Hassabis 说,与去年12月推出的前代产品 Imagen 2 相比,Imagen 3 能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。
为了打消人们对 Deepfake 深度伪造 AI 换脸技术的可能性担忧,谷歌表示,Imagen 3 将使用 DeepMind 开发的 SynthID 方法,在媒体上应用隐形加密水印。
去年11月,OpenAI爆发了令圈内震惊的「宫斗罢免大剧」,现如今持续半年的OpenAI高层斗争风波,终于迈向了最终的尾声。
当地时间5月14日,OpenAI 联合创始人兼首席科学家 Ilya Sutskever 在推特(X)发文宣布,正式辞职离开 OpenAI 这家自己一手联合创办的企业。
在去年,Ilya Sutskever 是 OpenAI 董事会的组成成员之一,曾投票推动罢免 OpenAI CEO 奥特曼的行动,并且成为了罢免案里边的关键角色。
Ilya Sutskever首先肯定了OpenAI今天所取得的成绩,离不开创业团队的共同努力,他还在推文中还预告了下一步的职业动作,他将开启自主创业,并在后期与网友分享自己的创业计划细节。
1该网站提供AI智能扩写文案和生成精美视频的服务,可直接使用全中文网站。只需输入一句话,AI就能帮你扩写文案,并生成超精美的视频。
百川智能基础大模型的第三代,发布超千亿参数的最新版本大模型Baichuan 3。这次模型迭代更新,不仅参数规模巨大,还重点展示了模型在医疗场景的能力。
最近,文心大模型4 0正式发布,接下来,我们从语言理解能力、生成能力、逻辑能力和记忆能力四个方面对文心大模型的能力进行实测。
6月13日晚间,荣耀手机发布首款小折叠手机Magic V Flip。在发布会后,荣耀CEO赵明在接受专访中谈及了对于苹果进军AI领域的看法。
实测百度文心大模型4.0_媲美GPT-4,果真如此吗?
ChatGPT如何工作_ChatGPT如何进行多轮对话
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
大语言模型「新王」Claude 3全面测评:原生多模态大模型各项能力实力超群,连打麻将都学会,实测比GPT-4好用
我测评了10款好玩到哭的GPTs原生AI应用:教你减肥、调酒、帮你解梦…ChatGPT最新GPTs玩法大公开
Midjourney微调模式怎么用_Midjourney怎么修正画手指问题_Midjourney如何修复手指_Midjourney如何一键换衣
离线AI绘画工具Fooocus测评_免费AI绘画工具推荐_AI绘画工具Fooocus怎么用
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
天工AI搜索怎么用_天工AI搜索测评_AI搜索有哪些
AI女友生成器_恋AI脑红娘是什么_AI情侣合影怎么生成