来源:AICG工具箱 责编:网络 时间:2025-05-20 11:33:40
8月2日报道丨谷歌研究团队进行一项实验研究,他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。这项实验证明了聊天机器人作为研究助手的价值。具体来说,谷歌 Deep Mind 的研究科学家 Nicholas Carlini在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了如何通过指导 GPT-4设计攻击方法并撰写攻击原理的文本,以欺骗 AI-Guardian 的防御机制。AI-Guardian 是一种防御对模型的攻击的系统,旨在检测可能被篡改的图像以欺骗分类器。
GPT-4会发出用于调整图像的脚本(和解释)来欺骗分类器——例如,让它认为某人拿着枪的照片是某人拿着无害苹果的照片——而不会引发 AI-Guardian 的怀疑。AI-Guardian 旨在检测图像何时可能**纵以欺骗分类器,而 GPT-4的任务是逃避该检测。
通过 GPT-4的帮助,攻击者能够成功地破解 AI-Guardian 的防御,使其从98% 的稳健性降低到仅8%。然而,AI-Guardian 的开发者指出,这种攻击方法可能在改进的版本中失效。
据了解到,GPT-4作为研究助手的价值在于它能够快速生成代码,并且不会分心或疲劳,始终可用于完成指定的任务。然而,依赖 GPT-4并不完全解除人类合作者的责任,因为它仍然需要人类提供正确的提示并修复生成的代码中的错误。虽然 GPT-4还存在一些限制,但随着大型语言模型的改进,它们将为计算机科学家提供更多时间来开展有趣的研究问题。
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
修订于2018年《出口管制改革法案》,以防止外国竞争对手通过美国AI和其他技术用于其他目的。包括类ChatGPT、类Midjourney等开源AI大模型
快手可能找到了AI聊天机器人与社交软件合体的最佳方式。最近很多快手用户发现,一个名叫「AI小快」的账号格外活跃,与网友聊得火热,一个抛梗、一个接梗…
【2023年9月21日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
美国加州政府引入ChatGPT等AI工具辅助公务员办公,税收、交通、公卫与公共服务4大部门率先试用
美国议员发起新提案,拟立法禁止美国企业向中国出口AI大模型,我们胜算几何?
OpenAI重磅升级定档5月13日,CEO奥特曼暗示会有「魔法」效应,但GPT-5至少要等到年底
OpenAI高管发内部信:马斯克起诉奥特曼和OpenAI的行为,纯属个人恩怨,他就是不甘心
为人类福祉与未来而战?马斯克以个人名义起诉OpenAI及奥特曼等高管,要求法院裁决后者开源大模型
美图公司推出AI局部重绘功能!局部重绘让你随心所欲修改AI生成的图像作品,想怎么改就怎么改
OpenAI高管回应马斯克诉讼指控:GPT-4不是AGI大模型,OpenAI独立运营并与微软直接竞争
马斯克突然起诉OpenAI及奥特曼丨OpenAI反驳马斯克的控诉丨奥特曼隔空回应马斯克的指控
AI复刻《西游记》震撼百万网友!AI电影迈向商用:以色列公司推出AI电影一站式剪辑工具LTX Studio
韩国SK电信获得AI硬件终端Ai Pin的独家代理权,最快将于4月份上市