来源:AICG工具箱 责编:网络 时间:2025-04-18 15:28:21
对于生成式AI,我一直是按照五个模态去进行分类的:
文本、图片、声音、视频、3D。
而声音领域,可能是在我的分类里,我最感兴趣也是最喜欢的一个。
在某一个路演的PPT上,我给声音又拆成了4个细分:
TTS、SVC、AI音效,我都写过,也玩了很久,而生成式AI音乐,是我一直没写过的东西。
不是我没玩,是我觉得这玩意,真的还没到值得去写去推荐的地步。。。
整个AI生成式音乐的代表,那肯定就是SunoAI了。
而且这玩意其实也火过2波了。
第一波是去年3、4月的时候,有一个很火的开源项目叫Bark,就是出自Suno之手,拿了将近32k的星标。
然后就是去年12月21号的时候,为了庆祝《海贼王》动画25周年,海贼王决定重制最开始的东海篇的那60集,然后尾田这货,给海贼王官方发了一首贺曲,叫《YO-HO-HOおれ達海賊》。
这事本身是个好事,但是好死不死的,这曲子是特么拿AI做的,就是用今天的主角Suno出的。。
这曲子大概就是这样,很糙,基本等于没法听的地步。
然后就被网友一通骂,你这个浓眉大眼的尾田怎么也用AI了。。。传着传着就变成《海贼王》重制版要用AI做了。。。于是骂的更凶了。。。
这个小插曲,还是挺有意思的,也间接的标明,当时的Suno的质量,是真的差。
直到今天,Suno终于上了V3版本。
在我听了很多demo和自己也跑了二十几首后,我觉得,AI音乐的"ChatGPT"时刻,终于到来了。
这是我的一个demo。
弊端就是Suno最多只能生成2分钟的音乐,所以可以听到最后,会戛然而止直接截断,但是已经比V2好很多了。
但是这个音质、咬字、节奏编排啥的,也都好太多太多了。
发给朋友听,她回了一句是:**,还是好听的。
网址在此:https://app.suno.ai/
点Create就是生成的主页。
主要用两种模式,一个是打开的"Custom Mode",这个是自定义模式,可以自己自定义歌词。
第二种是Instrumental,这个打开后就只会生成没有歌词的纯音乐了。
roll一次是同时出2首歌,一首消耗5积分,所以一次消耗10积分。
免费用户每天有50积分可以玩,可以roll5次出10首歌。
你要是氪金的话也挺便宜,10刀一个月,给2500积分,能玩很久很久。
要生成音乐的话,第一步肯定是写prompt,第二步(纯音乐没有)就是写歌词。
prompt这块,我比较推荐的写法就是:
音乐流派(如Kpop、Heavy Metal)、音乐风格(如Slow、Broadway)、情绪(如悲伤、愤怒)、乐器(如钢琴、吉他)、主题或场景、人声描述(如愤怒的男声、忧伤的女声)
但是说实话,写音乐的prompt对于不懂音乐的人来说,真的难,毕竟什么音乐流派、音乐风格很多都不懂,你咋写啊= =
歌词其实一样的道理,一首歌,正常是有结构的,比如有Verse(主歌)、Chorus(副歌)、有Bridge(快结束的时候经常那个不一样的部分)等等,普通人很多时候再写的时候也一脸懵逼,这特么咋写。。
别说大家,其实我去年刚玩Suno的时候,一样也是一脸懵逼。
让大家去现学我觉得也不现实。。。
那AI的方式,就必须用AI去解决,你说对吧。
所以,我就随手写了一个Prompt,让大模型来给你写歌曲Prompt和歌词。
什么玩意都给你弄好,你自己复制即用。就像这样:
这个Prompt长这样:
#01 你是歌词大师XX,现在,我需要你帮我写一段XX歌词,描述的是一个XX故事,整体歌曲时长2分钟以内,要押韵,要有文学气质,副歌部分要进行跨行重复。请按以下结构帮我创作:
"""
[instrumental intro]
[Verse 1]
<歌词>
[Chorus]
<歌词>
[Verse 2]
<歌词>
[Chorus]
<歌词>
[Bridge]
<歌词>
[Guitar solo]
[Chorus]
<歌词>
[Outro]
[End]
"""
#02 输出歌词以后,再根据歌词和故事内容,以英文词组的形式再给出歌曲的prompt。
请按以下格式帮我输出英文prompt:
"""<音乐流派(如Kpop、Heavy Metal)>、<音乐风格(如Slow、Broadway)>、<情绪(如悲伤、愤怒)>、<乐器(如钢琴、吉他)>、<主题或场景>、<人声描述(如愤怒的男声、忧伤的女声)>"""
直接拿去复制开箱即可用。
然后就直接把出来的结果,全都复制粘贴进去,当然,你也可以自己改吧改吧。
都扔进去之后,点那个黄的btn,直接开跑,速度挺快的,大概几十秒就出来了。
说实话,这个出来男声,让我有点心动了。。。。
当然,出来的歌,你不仅可以拿去直接发,你还可以玩一些骚操作,比如配合SVC,分离换声,换成自己的,可以参考这篇教程:
AI唱歌之终极喂饭教程 - SVC的极限就在这了
更多的歌,大家可以自己去Suno上跑着玩,体验一下AI音乐的魅力,这种直出的感觉,还是非常爽的。
虽然对很多专业歌手或者专业制作人来说,可能觉得还偏玩具,可控性差,不好编辑等等。
但至少,一定达到了大多数普通人的水准。
且这个趋势,一定是一个不可逆的未来。
这股子风,现在,终于到了音乐。
AI音乐的"ChatGPT"时刻,我觉得,终于到来了。
相信广大设计师朋友在工作中总会遇到一些B端类的视觉需求,通常是UI的装饰氛围模块以及UI视觉卡片。今天我们就来个小教程,帮助大家快速了解这类需求的设计方法和制作过程。
【AI奇点网2024年8月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
阿里云 AI 智领者峰会-北京站活动中,阿里云对外发布了新版的通义千问大模型,V2 5版本大模型正式发布,该版大模型的多项能力赶超了GPT-4。
硅谷AI大厂Meta官网上新,官宣Llama 3正式发布。提供80亿和700亿参数两个版本。有意思的是,80亿版本在某些测评项目的成绩上还超过了70亿版本。
B端设计教学_怎么进行UI视觉设计_B端设计教学
AI绘画教程_怎么用AI创作多角度人像_多角度人像_人物多角度
ChatGPT如何工作_ChatGPT如何进行多轮对话
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
基准测评国内第一:百川智能发布新一代大模型Baichuan 4,发布旗下首款AI智能搜索助理「百小应」
谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
controlnet怎么操作_stable diffusion模型拆解_controlnet控图的差异跟使用技巧有哪些
通义听悟如何将阿里云盘文件转文字
stable diffusion图生图技巧_stable diffusion怎么图生图