转跳到内容

【纯粹的AI】【纯粹的力量】【朴实无华的数值】少年!你想学会如何打BOSS吗!三个焚决!教会你死亡华尔兹的BGM合成配方。


推荐贴

发布于 (已修改) · 只看该作者

焚决通往的是:华尔兹和史诗战斗。

要点一:《动态控制系统》

要点二:《提示词:演奏乐器》

要点三:《自由发挥-元素组合》

另有几个提示词样本:

 

剧透

1. Genre & Mood
Future Bass / Kawaii Bass, 8‑bit — Rainy, Energetic, Dreamy, Bouncy with Snow.

2. Structure & Dynamics
Intro (BPM 80) → Verse → Pre‑drop (BPM 120) → Drop → Bridge (BPM 160) → Final Chorus → Outro (BPM 70, gradual slowdown).

3. Instrumentation & Techniques
Supersaw chords (7‑layer, detuned, side‑chain pump) with ACGN textures: granular synth from UI clicks, circuit‑bent guqin/guzheng/koto, prepared piano, wind chimes.

Pads from reversed game cartridge noise under wavetable arpeggios (8‑bit FM). Rises with bowed bicycle wheel, electric organ. Sub‑bass heartbeat (MGS alert‑style pulse).

Anison harmonies on hooks; filtered taiko with double‑hit replaced by gated bell impact (no voice).

4. Spatial & Production
Wide stereo, warm saturation, pumping side‑chain. Hall reverb, long tail, wet mix. Natural ambience. Final bell infinite decay.

5. Advanced Tags
8‑bit, ACGN, Rainy, Snow. No Glitch, No Newage.

(No human voice or vocals. )

《code 861》

ACGN soundscape: granular synth from UI clicks, circuit‑bent music box, prepared piano, toy piano — intimate.

Pads from reversed game cartridge noise under wavetable arpeggios (8‑bit FM). Rises to cinematic expanse with bowed bicycle wheel, electric organ.

Sub‑bass heartbeat uses MGS alert‑style pulse. Anison harmonies on hooks; filtered taiko replaced by gated fighting‑game button impact (no voice).

Game‑soundtrack atmosphere: melodies via vibraslap + filter‑swept sine, bit‑crushed koto. Textures: waterphone, glitched string machine.

Percussion: slowed 8‑bit snare, JRPG coin sound, visual novel text‑advance thud. Sustained tones: harmonica through shimmer reverb (save‑point feel).

Reversed arcade noise under prepared piano (screws between strings). Ground pulse: orchestral bass drum + sub‑dropped 808.

Anison harmonies, distorted “menu confirm” accents on hooks. Bridge to near‑silence: CRT hum, pixel‑eraser.
(No human voice or vocals.)

《玻璃球》

 

ACGN soundscape: music box, celesta, plucked harp harmonics, soft accordion, tin whistle — intimate.

Pads from reversed wind‑chime loops under music‑box arpeggios. Rises into cinematic warmth with sustained harmonium, bowed psaltery.

Sub‑bass heartbeat replaced by gentle timpani pulse. Anison harmonies on hooks; filtered taiko swapped for brushed cajón + toy bell hit.

Game‑soundtrack atmosphere: melodies via whistle + celesta duet, plucked mandolin. Textures: music box with felt, soft recorder.

Percussion: wooden claves, sleigh bells, distant frame drum. Sustained tones: harmonica through cathedral reverb (village square feel).

Reversed toy piano fragments under glockenspiel phrases. Ground pulse: orchestral bass drum + soft stomp.

Anison harmonies, gentle “chest open” chime accents on hooks. Bridge to near‑silence: single celesta note, faint wind, footstep on grass.
(No human voice or vocals.)

——————————————————————————————————————————————————

焚决一:《死兆钟》

Dynamic Control: Epic battle arc via layered intensity faders—massive orchestral tutti, pounding percussion;

sharp drop to waltz interlude (3/4, solo violin + harp) triggered by crossfade;

gradual rebuild through automated swell lanes, synth pulse ladder, crescendo gates, culminating in climactic final strike.

Orchestration & Synthesis: Strings: divisi, sul ponticello, col legno; Brass: fanfare trumpets, growling low brass, stopped horns;

Woodwinds: fluttering piccolos, bassoon growls; Percussion: timpani rolls, taiko clusters, anvils, chain rattles, cymbal swells;

Choir pads (no voice); Synths: sub‑bass layered with sub‑harmonic sine waves, reversed orchestral hits, granular textures, bitcrushed risers.

Waltz: celesta, muted strings, soft flutes, harp harmonics, muted horns, bowed psaltery.

(No human voice or vocals. )

焚决二:《子时舞》

Dynamic Control: Epic battle arc via intensity faders—massive orchestral tutti,

heavy drum patterns; sharp crossfade to waltz interlude (3/4, solo violin + harp);

gradual rebuild through automated swell lanes, rhythmic gate sequences, crescendo gates, culminating in final percussive climax.

Orchestration & Synthesis: Strings: divisi, sul ponticello;

Brass: fanfare trumpets, growling low brass; Woodwinds: fluttering piccolos, bassoon growls;

Percussion: layered taiko clusters, thunderous bass drum, snare rolls, anvils, chain rattles;

Synths: sub‑bass with side‑chain pulse, reversed hits, granular textures, bitcrushed risers.

Atmosphere: low brass drones, choir pads (no voice), distant battlefield textures.

Waltz: celesta, muted strings, soft flutes, harp harmonics, bowed psaltery.

(No human voice or vocals. )

焚决三:《去何方》

Dynamic Control: Epic battle arc via intensity faders—massive orchestral tutti, heavy drum patterns; sharp crossfade to waltz interlude (3/4, solo violin + harp);

gradual rebuild through automated swell lanes, rhythmic gate sequences, crescendo gates, culminating in final percussive climax.

Orchestration & Synthesis: Strings: divisi, sul ponticello, col legno battuto; Mid‑brass: horns and trombones in marcato stabs, snarling stopped horns;

Woodwinds: clarinets and bassoons in aggressive staccato ostinatos; Percussion: layered taiko clusters, thunderous bass drum, snare rolls, anvils, chain rattles;

Synths: sub‑bass with side‑chain pulse, reversed hits, granular textures, bitcrushed risers;

Atmosphere: low brass drones, choir pads (no voice), distant battlefield textures. Waltz: celesta, muted strings, soft flutes, harp harmonics, bowed psaltery.

(No human voice or vocals.)

,由TsumiKAMI修改
注释
阿露今日也在歌唱 阿露今日也在歌唱 70.00节操 教程糖~
发布于 · 只看该作者
7 小时前,bloodyliao2说道:

大佬!想请教一下,这种风格的音乐可以生成吗?

【地狱公主 Hell Maiden OST】 https://www.bilibili.com/video/BV1fPWWz3EH6/?share_source=copy_web&vd_source=09407e10c1f8998dd12c09dc0a3043db

泥用的是什么AI工具呀?

理论上是可以的——流派指定+弦乐+古典+特定时代风格+具体的乐器组 音色和明暗度+氛围参数+可能需要一点高级的随机种子参数

【自然语言能完整描述的话更稳定】。(这一块大概率是能稳定生成类似风格的纯音乐的)

tip:《巫师三》OST可以复现80%(打牌的小区和酒馆的小曲包括一些战斗描写 AI轻车熟路)

但《尼尔机械纪元》这一类的 是AI的史诗级难题。(自成一派的曲目是最难生成的,AI不太好关联,也许可以尝试负面提示词(但很麻烦)

【AI很擅长古典类的生成】【事实上 我昨天才开始正式尝试对AI提示词进行惨绝人寰的实验(所以我是萌新):wn007:

【如果你想让AI生成极具某位作者特色的作品——无法一键生成,需要多个样本拆解,混搭,采样,然后丢到宿主(音乐制作软件)里 进行二次合成】

或者《邪道》:光明正大使用绝对会挨打的那种wwwww:mx057:

————————————————————————————————————————

邪道:用外部工具【最简单的方式:你的嗓音去哼唱原曲并录制(离谱)】对原曲进行惨无人道的拷贝忍者卡卡西(侵权)行为是100%能成功的:mx051:

AI工具:音乐方面、目前SUNO的强度还是太权威了:YangTuo_OZ:

————————————————————————————————————————————————

tip2:公式化曲目生成相对简单。(AI嘎嘎乱杀、神仙来了都很难正面和AI对决)

个性化曲目生成有点烧脑。(与其直接用AI,不如自己直接学一整套音乐制作技能【个性化就是如此稀缺,除非AI直接夺舍(侵权)】)

 

 

发布于 (已修改) · 只看该作者
15 小时前,阿露今日也在歌唱说道:

由吐司的提示词所生成的音频确实与吐司提出的风格相符呢:wn025:

只要掌握了一系列的【基本原理】——我们就得到了一份教程书。(仅供参考ver)

大条目其实不加也可以?【不应该加进去  输入的提示词 只要保留大条目下的 子条目 即可】

举个例子:

——————————————————————————————————

A lone wanderer crosses a frozen sea at dusk.

Opera Jazz + Cossack Epic. Melancholic, Majestic, Unsettled.

 7/8 (Cossack dance) with swung jazz phrasing. Drum pattern: hybrid of taiko ōdaiko pulses and brushed snare.

Dorian mode with chromatic mediant shifts. Harmony: lush jazz voicings resolving to stark open fifths.

Intro (koto solo, 7/8 pulse) → Verse (strings col legno, low brass) → Pre-chorus (accelerando, crescendo) → Chorus (full brass, choir, fermata) → Bridge (subito piano, pizzicato) → Final Chorus with BPM 80→120→160.

Koto (glissando, ponticello), Cossack choir (shout), Trumpet (flutter-tongue, harmon mute), Taiko (felted, rim shots).

Frozen cathedral reverb (long decay, pre-delay), wide stereo, subtle distortion.

Aurora borealis over snow-covered pines. Breath fogs in the air. Distant horse hooves on frozen ground.

 -Vocals (except choir), -Glitch, Cinematic, World Fusion.

————————————————————————————————————————————————————————

一个 是的 大河剧的爵士曲 混合了很多 你懂的要素wwwww

【但是记得排除掉一些pop词条和电子科技类词条,可以把摇滚?排除了 就更接近爵士大河剧了】

但为了方便整理实验素材——但如果已经掌握了完整结构的全套术语!(可以融入,微操)

一些标点符号是有用的,包括但不限于括弧 逗号(慎用) 星号 加减? 等一系列标点符号。
 

一、结构化是基础【提示词不选择结构法1号or结构法2号等 完整结构】

使用单一大条目的胡乱写作法——就能让AI在不同的段落!开始胡乱演奏(BUG)(自纠正偶尔不一定起作用)

我们从最初零散的“替换元素”,逐步发展出一套稳定的模块化提示词结构。最终沉淀的核心模块包括:

  1. Core Concept / 核心概念 —— 一句话锚定音乐的灵魂叙事

  2. Genre & Mood / 流派与情绪 —— 风格骨架 + 情感强度

  3. Structure & Dynamics / 结构与动态 —— BPM变化、段落布局、动态弧线

  4. Instrumentation & Techniques / 乐器与技法 —— 音色选择 + 演奏方式

  5. Spatial & Production / 空间与制作 —— 混响、声场、质感、处理

  6. Atmosphere & Narrative / 氛围与叙事 —— 场景感、画面感

  7. Advanced Tags / 高级标签 —— 风格修饰词、排除项(有的工具有专门的排除项)

这套结构的价值在于:既保持了专业术语的严谨性,又为创意留出了充分空间


二、动态控制是音乐的灵魂

我们发现 Dynamic Control 模块(后来融入 Structure & Dynamics)是整个提示词中权重最高的部分。它决定了:

  • 情绪的起承转合

  • 张力的累积与释放

  • 段落的对比与连接

一个好的动态设计,能让AI生成的音乐从“平铺直叙”变成“有故事感”。BPM渐变、段落长度、音量弧线、节奏型切换,都是控制动态的关键工具。


三、乐器与技法的“精准”比“丰富”更重要

早期我们堆砌了很多乐器名称,但效果不佳。后来意识到:与其列出一长串乐器,不如写清楚“怎么演奏”

  • koto  koto (glissando, pizzicato)

  • strings  strings (col legno, sul ponticello, tremolo)

  • taiko  taiko (felted, distant, double-hit)

这些演奏术语(意大利语或英语)是AI音乐生成工具最容易理解的语言,也是最能让声音“活”起来的密码。


四、氛围与叙事是风格的“第二层皮肤”

我们多次尝试将风格进行“不兼容”的融合——比如东瀛 x 哥萨克 x 歌剧爵士。能成功的关键在于:在氛围层找到共同的情感锚点

例如:

  • 东瀛的“雪、竹林、木桥” + 哥萨克的“草原、马蹄、手风琴” + 江南的“雾、雨、灯笼”

  • 它们共享的是“冷冽、漂泊、诗意”的底色

氛围描述不需要长篇大论,但需要有画面感、有感官细节(听觉、视觉、触觉)。


五、创意突破来自“大胆替换”与“随机碰撞”

我们在某个节点放弃了“精准复刻某游戏OST”的目标,转而用骰子决定元素组合。这带来了意想不到的惊喜:

  • 水琴 + 8-bit + 古琴刮弦 + 打字机 + 深海沉没大教堂

  • 风铃 + 八音盒 + 硬槌 + 降比特 + 雪中古林

结论是:公式化可以保证质量,但真正的“奇思妙想”需要打破公式的勇气。随机组合 + 理性筛选,是一种有效的创意工作流。


六、字数控制是“性价比”的关键【无损压缩技巧让语言学含金量大幅提升】

我们反复压缩提示词,发现:

  • 100–120词 是最理想的区间——足够表达核心信息,又不会让AI“读晕”

  • 压缩不是删除,而是用更精确的术语替代冗余描述

  • 每个模块保留最关键的3–5个元素即可


七、最终经验:人机协作的“导演”角色【并非传统导演,而是保姆导演】

AI音乐生成工具(Suno、Udio等)本质上是一个“高智商但缺乏方向感的演奏者”。提示词的作用不是“命令”,而是“导演”:

  • 告诉它:这是什么故事(Core Concept)

  • 告诉它:情绪基调(Genre & Mood)

  • 告诉它:剧本结构(Structure & Dynamics)

  • 告诉它:演员怎么演(Instrumentation & Techniques)

  • 告诉它:舞台长什么样(Spatial & Atmosphere)

  • 最后,用高级标签划清边界

这样,AI生成的不再是“一首歌”,而是一段有叙事、有张力、有画面的声音体验。

——————————————————————————————————————————————————————————————————————————————

一、模块的“功能分工”与“相互作用”

 
 
模块 核心功能 对其他模块的牵引作用
Core Concept 确立音乐的精神内核(一句话故事) 决定所有后续模块的审美方向,是风格的“锚点”
Genre & Mood 划定风格边界与情感光谱 为乐器和制作定调,限制AI的“风格漂移”
Structure & Dynamics 提供时间轴上的叙事骨架 直接影响曲目时长、段落对比、情绪弧线
Instrumentation & Techniques 指定“演员”与“演技” 决定了音色质感、演奏表情、技术细节
Spatial & Production 构建听感空间与后期风格 塑造“舞台”大小、干湿比例、冷暖质感
Atmosphere & Narrative 注入画面感与感官细节 为音乐赋予“隐性情绪”,是风格的“皮肤”
Advanced Tags 快速修正风格倾向 用关键词收窄或拓宽AI的理解范围

这些模块相互支撑:Core Concept 提供了“为什么做”,Structure 决定了“如何展开”,Instrumentation  Spatial 则回答“用什么声音、在什么空间里”。Atmosphere 将抽象情绪具象化,Advanced Tags 做最后边界控制。


二、模块权重与影响排序

根据我们多次生成实验的经验,对最终音乐风格的影响力排序大致为:

  1. Structure & Dynamics(40%):动态弧线直接决定了音乐是否有“剧情”。【导入 副歌 桥 合唱 诗 导出  钩子 BPM(次选)等结构类的提示词标签是必须的,否则会严重影响时长】

  2. Genre & Mood(20%):告诉AI该往哪个大方向走,避免风格跑偏。【流派可以融合,代价是命运的骰子,只靠这部分的tag可以很公式化】

  3. Instrumentation & Techniques(15%):精确的演奏技法能让AI生成的音色摆脱“塑料味”。【如何演奏是一种极其酷炫的提示词】【找一些有质感的乐器也是关键】

  4. Spatial & Production(10%):影响声音的“高级感”和场景感。【我觉得应该是有用的?】

  5. Core Concept(8%):虽短,但为所有选择提供统一性,防止元素堆砌。【有没有用?难说】

  6. Atmosphere & Narrative(5%?):锦上添花,让音乐更有画面感。【很有用,但我觉得占比不止是5%,通常更自然的语言描述(需要AI支持)会让整体变得很酷炫】

  7. Advanced Tags(2%):微调,偶尔能挽救一次生成。【安慰剂】

在实际书写中,应优先保证 Structure  Genre 的清晰度,再填充其他模块。


三、模块内部的“可调参数”拆解

每个模块内部都包含可以独立控制的“旋钮”:

1. Core Concept

  • 叙事类型:史诗/私密/幽默/诡异

  • 主角形象:英雄/反英雄/自然元素/抽象概念

  • 情感关键词:2–3个形容词即可

2. Genre & Mood

  • 主流派(1–2个)+ 子流派(可选)

  • 情绪强度:用形容词的层级表达(calm → dreamy → euphoric → manic)

  • 可用“+”连接混合风格,如 “Opera Jazz + Grand Symphony”

3. Structure & Dynamics

  • BPM序列:可写具体数值,也可写 “accelerando” “ritardando”

  • 段落标签:Intro, Verse, Pre‑drop, Drop, Bridge, Final Chorus, Outro 等【重要,也可以按照这类结构进行提示词书写】【但用这种方式去制作教程可能会让一些表达略显模糊】

  • 小节数:可写数字(16 bars)或相对长度(short/long)

  • 动态变化:crescendo, subito piano, fermata 等术语

4. Instrumentation & Techniques

  • 乐器分类:按家族分组(strings, woodwinds, brass, percussion, keys, plucked, synths)

  • 演奏技法:用意大利语术语(arco, pizz, tremolo, col legno, flutter‑tongue)

  • 音色修饰语:felted, muted, overdriven, granular, glitched

  • 优先写“怎么演奏”而非“用什么乐器”

5. Spatial & Production

  • 空间类型:cathedral, hall, club, intimate room, cave, forest

  • 混响参数:decay time, pre‑delay, wet/dry mix

  • 效果器:side‑chain, saturation, distortion, reverb, delay, stereo width

  • 质感关键词:warm, bright, gritty, lo‑fi, polished

6. Atmosphere & Narrative

  • 感官细节:视觉(颜色、光线、物体)、听觉(雨声、风声、脚步声)、触觉(温度、湿度)

  • 故事性:不写完整情节,只写“决定性瞬间”或“凝固的画面”

  • 建议控制在1–2句话,避免喧宾夺主

7. Advanced Tags

  • 正向修饰:8‑bit, Cinematic, World Fusion, Experimental

  • 负向排除:用 “No X” 或 “-X” 形式,如 “No Vocals, No Glitch”

  • 有时可用括号组合,如 “(Operatic) (Big Band)”


四、跨风格适配:如何快速修改模块内容

如果你有一套基础模板,要适配不同风格,可以按以下思路替换:

 
 
风格 修改重点
史诗管弦 加强 Structure 的宏大动态(80→160 BPM 跳跃【其实应该用形容词强化乐器力度wwww】),Instrumentation 增加铜管、合唱、定音鼓,Spatial 用 cathedral reverb
Lo-fi Hip Hop Structure 简化为 loop 式,Instrumentation 用 felt piano, dusty drums, vinyl crackle,Spatial 用 small room reverb,Atmosphere 用“深夜、雨、窗户”
电子舞曲 Structure 强调 Drop 位置,Instrumentation 用 supersaw, 808, side‑chain,Spatial 用 bright hall,Advanced Tags 加 “House, Techno, Big Room”
世界融合 Genre 写多风格组合,Instrumentation 加入地域特色乐器(koto, balalaika, duduk),Atmosphere 加入当地场景

核心是:只改 2–3 个模块的核心元素,其他保留,就能快速产出新风格


五、创作工作流:从灵感到提示词

  1. 概念抓取:用一句话写下核心画面或情绪(Core Concept)

  2. 选骨架:确定 BPM 段落弧线(Structure & Dynamics)

  3. 选风格:选择主流派 + 情绪形容词(Genre & Mood)

  4. 定音色:列出主要乐器 + 演奏技法(Instrumentation & Techniques)

  5. 建空间:选择空间类型和关键效果(Spatial & Production)

  6. 加氛围:写 1–2 句场景描述(Atmosphere & Narrative)

  7. 修边界:用 Advanced Tags 微调

  8. 压缩:将总词数控制在 100–150 之间(150可能太多了wwww)(结构单元不能删!)

建议先从“模板复制”开始,再根据生成结果微调某一模块。


六、与不同AI工具的适配策略

 
 
工具 特点 适配建议
Suno 对结构标签敏感,支持续写 Structure 模块要写完整段落序列;可用 BPM + 小节数规划时长
Udio 对氛围描述敏感,续写灵活 Atmosphere 模块可写更详细;利用 “Extend” 功能分块生成
Stable Audio 对技术术语响应较好 Instrumentation 多用意大利语术语;Spatial 写具体效果器
国内工具 对中文关键词友好 可将模块翻译为中文,保留术语(如“渐强”“拨奏”)

通用原则:英文术语优先,结构清晰,避免歧义


七、结构变体:三种常见“配方”

  1. 极简版(<50 词)
    适合快速尝试:只保留 Genre + Mood + Structure + 3–5 个乐器关键词。
    示例:Cinematic Epic, 80→160 BPM, strings, brass, taiko, choir pads, cathedral reverb.

  2. 叙事版(80–100 词)
    强化 Core Concept 和 Atmosphere,适合生成有故事感的音乐。
    示例:Heist on heaven’s gate. Cinematic Epic. 80→120→160 BPM. Strings col legno, taiko clusters, sub-bass. Cathedral reverb. Crumbling sky fortress, lightning.

  3. 技术版(100–120 词)
    强调 Instrumentation 和 Spatial,适合需要精准音色的场景。
    示例:我们最终定型的多模块版本。


八、未来的扩展方向【不同的风格的曲目使用不一样的提示词结构也有特殊的效果——但代价是 《实验室爱吃时间》】

这套结构还可以继续演化:(不好说)

  • 加入“节奏型”模块:专门描述鼓组模式(4/4, 7/8, swung, breakbeat)

  • 加入“和声”模块:描述调式、和弦进行(minor, dorian, chromatic mediant)

  • 加入“人声”模块:虽然我们一直禁用,但可扩展为“女声/男声/合唱/无词哼鸣”

  • 加入“参考曲目”:有些工具支持类似 “in the style of…” 的提示,可作为第七模块。

,由TsumiKAMI修改
×
×
  • 新建...

重要消息

为使您更好地使用该站点,请仔细阅读以下内容: 使用条款