来源:AICG工具箱 责编:网络 时间:2025-05-20 16:21:40
2023年7月31日报道丨7月28日,谷歌推出了一种新的人工智能(AI)模型 Robotics Transformer2(RT-2),可以帮助训练机器人理解扔*等任务。谷歌表示,RT-2 是一种视觉语言动作模型,可将互联网上采集的信息和图像转化为机器人可理解的动作,从而帮助提升机器人的学习能力。
虽然像捡*这样的任务对于人类来说听起来很简单,但机器人需要了解一系列知识后才能学习。例如,机器人必须首先能够识别哪些物品构成*,然后要知道如何将其捡起来并扔掉。
RT-2 允许机器人使用来自网络的知识来帮助它理解如何完成任务,而不是为机器人编程来完成这些特定的任务。即使机器人没有明确地接受过确切步骤的训练,也能通过 RT-2 学会完成新的任务。据外媒报道,谷歌近期没有计划发布或销售采用这项新技术的机器人,但最终这项技术或许可以用于仓储物流或家庭助理机器人。
DeepL 发布了新一代面向翻译和编辑应用的大型语言模型。据 DeepL 官方称,该模型在翻译质量和流畅度方面均优于当前市场上的其他竞争对手。
当地时间5月21日周二,欧盟理事会正式批准了世界上第一部真正意义的人工智能技术发展与监管的主要要律,该法律对全体欧盟成员国地区有效。
关于微软撤离中国AI团队这件事,或许早有预兆。目前,在AI研究方面,微软正在对中国区的员工进行一定的技术“隔离”。
很多人把Remini的黏土风效果跟国内的其它产品做对比,大部分会认为这是一家国外公司,但Remin最开始其实是一家中国公司做的出海产品。
阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图
Midjourney角色一致性测评体验丨使用场景探讨
实测科大讯飞星火大模型V3.5:输出回复完全不输GPT-4,全程语音交互比肩ChatGPT,数字人声唠嗑根本停不下来
controlnet怎么安装_controlnet怎么使用?
如何使用 ChatGPT 完善代码
DeepL推出新一代翻译编辑大模型:翻译质量超越竞争对手谷歌微软ChatGPT
Moshi最新消息_Moshi多模态大模型
华为HDC 2024大会将发布盘古大模型5.0丨谷歌Gemini手机版将迎来多项功能更新丨马斯克xAI计划融资60亿美元
“宝藏AI神器”阿里通义听悟最新更新丨支持超长音视频问答,高校师生可获500小时免费时长
OpenAI CEO奥特曼最新讲话汇总,再次曝光GPT-5细节:性能飞跃超乎想象,低估它的人都会被吓傻