来源:AICG工具箱 责编:网络 时间:2025-05-03 09:07:11
2023年已经过去,这一年被不少科技博主称为「AI元年」。而今天,已经是2024年的第二天,也是全球打工人的第一个工作日。
来自Everypixel Journal的一份统计报告,以AI工具推出的时间线维度,为我们从头到尾梳理了2023年3月~12月AI行业值得关注的若干大事件。
这份报告将今年井喷的AI创作工具主要分为三大门类:文本生成、图像生成以及视频生成。
为啥要从3月开始看起?大概是这个月里,GPT-4、Bard先后发布,直接把大模型趋势推向更高潮。
这和Writerbuddy的数据也有所对应,2023年的3月~4月,光这一个月内,50大热门AI工具的总访问量增加了9亿,是调查期中AI工具日活增速最快的一个月。AI聊天机器人的能力也是从这时开始向各个维度延伸。
其中,谷歌的Bard使用多模态数据集训练而成。GPT-4发布后不断更新,扩展了插件、联网、支持语音、图像生成等功能。
另一边是Meta发布著名的开源大模型Llama 2,催生了大批“羊驼变种”,AI模型的开源社区也热闹了起来。
此外,开发者平台Stack Overflow推出OverflowAI,支持AI驱动搜索,开发者可在Visual Studio Code和Slack中轻松找到所需信息。
还有一款开源模型是Mistral AI推出的Mixtral 7B,Mixtral 7B也是开源基础模型里最强的那一档,可以越级挑战13B、34B。基于Mistral-7B微调的Zephyr-7B-beta也成为了多个评测排行榜前排唯一的7B模型。
另外,11月李开复的零一万物推出Yi-34B,在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT。
马斯克7月份成立的新公司xAI也发布了自家第一个大模型Grok,据说可以实时获取推特(X)平台的数据。
年末也很重磅,先是谷歌发布新模型Gemini,被称作是和ChatGPT性能最为接近的竞争者之一。
而后Mistral AI年末推出Mixtral 8x7B(70亿参数×8个专家模型),这是首个开源MoE大模型。MoE架构也就是传闻中GPT-4采用的方案,可以说这是开源大模型离GPT-4最近的一集。
2023年,图像生成领域竞争格外激烈。
3月份,Adobe Firefly大模型发布,Adobe Firefly被集成到最多人使用的绘图工具Photoshop中,艺术字文本创作的效果也是一大看点。
Midjourney推出V5版本,提高了图像生成效率、连贯性和分辨率 。最近的12月份,V6版本也问世,带来了5大升级,支持在图像上进行简单的文本单词生成。
不得不提的还有ChatGPT的绘图搭档DALL·E 3,DALL·E 3无需复杂提示工程,简化了图像生成,且还能根据用户反馈细化提示并进行图像调整。
图库网站Shutterstock也推出了AI功能,用户可使用AI生成新内容,也可对图库中的图片进行简单编辑、转换。
图片生成领域也已今时不同往日,下面是2007年文本-图像生成和2023年的效果对比:
视频生成效果在2023年发生显著变化。Pika在最初内测版推出的时候就引了50万用户,每周生成数百万视频。年末,Pika 1.0的升级使用户能够以3D动画、动漫、卡通、电影等各种风格创建编辑视频。
Meta这边还推出了Codec avatars,该模型专注于视频中的3D人脸生成。
Runway的Gen-2模型将视频效果一口气拉到了4K超逼真的高度,且做到这种效果只需简单一句话输入。
AI翻译配音工具HeyGen推出了AI视频创作工具,包含100+数字人素材和模板,还支持300+不同音色和40+语言。只需选形象、写文本、等输出三步,就能让霉霉很自然的开口说中文。
此外,Stability AI也推出了自家视频生成工具Stable Video Diffusion,不仅支持文本到视频、图像到视频生成,还支持物体从单一视角到多视角的转化。
总之,在AIGC的各个领域,都是竞争格外激烈的一年。
但行业中也发生了一些重大合作,值得关注。首先是行业领头羊之间的重大合作。
Stability AI & Init ML
Stability AI收购了图像处理应用ClipDrop背后的核心团队Init ML,将Stability AI整合到ClipDrop的生态系统中,促成了SDXL Turbo的开发。
Runway & Getty Images
Runway与Getty Images联手,推出了新的视频生成模型RGM,将Runway的AI功能与Getty Images的创意内容库相结合,改变了内容创作流程,使公司能够根据其品牌形象生成高质量的定制视频。
Snowflake & Neeva
数据仓库平台Snowflake收购了使用生成式AI工具来增强搜索体验的初创公司Neeva,Neeva最近关闭了无广告搜索引擎。
Shutterstock & OpenAI
Shutterstock和OpenAI已达成为期6年的合作伙伴关系,Shutterstock为OpenAI提供图像、视频、音乐库等高质量数据集。
整个人工智能行业也在2023年发生了一些里程碑事件。
最明显的就是法律方面——OpenAI等AI巨头都深陷维权争议,这也促成了AI方面立法脚步的推进。
比如欧洲议会、欧洲理事会和欧盟委员会三方就《人工智能法案》达成协议。该法案将成为全球首部人工智能领域的综合性监管法规。以及美国版权局明确了对AIGC生成的内容的司法立场:拒绝为AI生成的图像注册版权。同时全球各国也在积极出台治理AI方面的政策条款。
最后,报告还列出了一些行业热议事件。
其中3件都和OpenAI有关。分别是:
① 摩根大通、花旗集团等金融机构出于安全考虑限制员工使用ChatGPT;
② OpenAI低薪雇佣人工筛查ChatGPT敏感内容;
③ OpenAI的管理层与董事会之间发生的宫斗内讧。
另外,这份报告还关注了2023年索尼世界摄影大赛,首次出现评委将获奖颁给AI而非人类摄影师的事件,当时创作者拒绝领奖并宣布自己是AI生成图像,引发了关于AI创作方面的激烈讨论。
总之过去一年里,AI行业诞生了许多新事物,也发生了许多前所未有的大事件。通过它们可以更好理解2023,也能更好展望已经到来的2024。
商汤科技最新升级的AI文生图领域的预训练模型——秒画Artist v0 3 5版本,三个月后迭代。审美水平和专业度上达到顶尖水平,福利值(免费)直接拉满
Stable Diffusion 是一种基于扩散过程的图像生成模型,可以生成高质量、高分辨率的图像。它通过模拟扩散过程,将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性,可以生成具有多样化效果和良好视觉效果的图像
免费版的 ChatGPT 足以完成大多数任务,但如果想要更快的响应、更多的细节和访问最新的功能,应该考虑获取 ChatGPT Plus。现在Plus版本已经可以连接互联网,获取最新的消息,以及各种各样的小插件,非常好用!
【AI奇点网2024年8月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
ChatGPT Plus会员怎么付费_如何升级ChatGPT Plus会员
商汤全新AI绘图大模型“秒画Artist”v0.3.5版本上手测评:作画水平比肩Midjourney!划重点——免费
stable diffusion controlnet_stable diffusion模型哪个好
ChatGPT计划在年底将订阅费涨到22美元/月丨Llama 3.2发布:手机端侧可运行丨百度世界大会将于11月12日举行
字节跳动发布两款豆包系列视频模型丨ChatGPT「高级语音模式」功能全量上线丨「Apple智能」对存储空间要求进一步提高
国产最强文生视频模型「可灵」首发:直出2分钟超长视频,生成质量完胜OpenAI Sora丨免费体验
快手发布文生视频大模型「可灵」丨广东高考首次启用AI智能巡考丨支付宝推出AI毛发自测工具
字节跳动试水AI硬件研发:重整人马聚焦教育赛道与智能可穿戴终端,两条产品线同时推进
10年缘分说散就散:Ilya Sutskever官宣从OpenAI离职,麾下的“超级对齐团队”负责人也一并离职
ChatGPT年度更新曝光:免费用户升级GPT-4丨华为Pura 70修复「AI消除衣服」BUG丨商汤日日新5.0官网上线