0%

配音人声后期处理方法


先把人声处理干净,如降噪、EQ高低切。然后再对人声修饰,如混响。先局部处理,再整体。

①手动降噪,把没有声音的间隔静音
②压限[振幅与压限-动态处理],使声音均衡,不忽大忽小
③低切[滤波与均衡-参数均衡器]

1、“人声和伴奏的融合度”

这个问题其实涉及到了一整套的贴唱混音制作流程,我会强调按照正确流程作业的重要性。
其实拆开来说,算是音量管理以及动态控制在起着决定性的作用,其他很多人重视的混响和延迟只是花边。
我接触过不少初学者做的贴唱作品,从“成品”的波形来看像是个鱼骨头一样,这是音量管理不善造成的:伴奏因为往往经过规范的母带制作而动态范围比较小,整体像是砖头,在调小音量之后看上去就像是鱼骨的横线;而贴唱的人声部分因为初学者不善控制它们的动态范围,以至于人声的动态范围较大,起伏很明显,看上去像是一块块突出的鱼刺一样。

解决的办法总的来说分为三步:

第一步是腾出 Headroom(动态余量)。
初学者可能不熟悉这个词,但是他们已经无意识之间做了这样的事情。那就是直接导入的伴奏声音听起来特别响,所以需要把音量降下去,这样做非常正确。但我们也要建立起规范,究竟降多少合适是有一个大概范围的。我在这里不讨论响度的测量方法,就拿三种类型的歌曲作为例子好了。一般来说,民谣、管弦乐、歌剧之类的曲子动态范围最大,成品音量适中;流行音乐动态范围适中,成品音量较大;摇滚或者金属乐之类动态范围最小,成品的音量特别大。那么第一种我们可以减 36 dB,第二种减 69 dB,第三种减 9~12 dB。
这样我们导入人声(此时的人声应该是修音对轨去杂音之后,可以直接拿来混音的素材),可以有一个大概合适的平衡关系,而人声个别字句过于响亮,或是被伴奏盖住,那么我们用包络之类的修整手段解决掉。在这一步,我们能解决掉 70% 的人声与伴奏比例之间的问题了。

第二步是效果器的事情了。
前面也说过,伴奏是有处理过的,而人声是未添加任何效果器的状态。那么该用的常规效果链,例如EQ - 压缩,以及发送的混响和延迟,该怎么用就怎么用。EQ 可以有两道,第一道用来解决问题,第二道用来设计曲线美化声音。而压缩是用来控制人声动态范围的。
什么是动态范围呢,你可以理解为在你的眼前划一条线,有一颗时刻发出恒定声音的球串在线中,可以随着线的轨迹移动。然后根据经验,球离我们越近声音越大,越远声音越小。而动态范围的关系可以这样来比较:假设球在五秒内往复从 0 的位置移动到 4 的位置;与在五秒内往复由 0 的位置移动到 8 的位置。那么这样一比较,显然后者的移动范围,或者理解成“动态范围”更大。
而让人声融合在伴奏的关键就是,假设伴奏的移动范围是从 3 到 5,而没处理的人声是从 1 到 8,那么显然人声时不时会“过于突出”,又时不时会被伴奏盖住。
通过合理的压缩参数设置,我们可以比较妥善地解决这个问题。关于压缩的使用方法,网上教程一大堆,自己去搜搜吧,这里就不多废话了。

第三步是把响度补回来。
这时我们在立体声输出的位置使用响度最大化(Limiter & Maximizer)效果器,前面我们一开始对伴奏减了多少音量,那么这时我们就补多少音量。具体效果器的选择,L2还是 Ozone 的 Maximizer,这个就看个人喜好了。
我们做出来的成品尽量与原曲响度匹配是个不错的选择,至少对于商业歌曲,它们的响度是合理的,所以可以用它们来作为参照。

补充一点,丁漫江老师也提到过做贴唱其实是“量体裁衣”,可以对伴奏进行处理以让它配合我们贴的人声去实现更好的效果。所以,对伴奏进行处理是可选的方案,但一定要谨慎。

贴耳感:
操作手法:压缩。
提高输入音量,压缩输出音量。效果器:压缩/限制器(Compressor/Limiter)
效果就是放大听感,像1寸的全身照只能看个人影,而1寸的大头照就是清楚的看清人,但忽略了其他。
压缩也是如此。

背景逻辑:EQ比例。
回规本质是EQ变化了。音量增加后,能量同时增加,但中高频中1段属于人耳敏感区,人耳感觉更清晰了,传统经验从远处走到跟前,甚至贴耳,而冠之贴耳感。所以有通过EQ调整来实现贴耳感,现实有,手机喇叭,喊话器就是这个逻辑结果。

录音质量低(没有录音师指导、没有足够好的声学环境和设备等),可能需要在混音之前检查录音素材的缺陷并修复。其中包括:

1.降噪,使用工具 iZotope RX 7 Voice de-noise(首选)
2.修复喷麦,使用工具 iZotope RX7 de-plosive
3.修复过载失真,使用工具 iZotope RX7 de-clip
4.修复咔哒音(爆音),使用工具 iZotope RX7 de-click(或Waves X-Click);如果咔哒音非常频繁形成了噼啪的局部区域,请使用 iZotope RX7 de-crackle(或Waves X-Crackle)
5.修复持续的电流声/其他固定频率的噪声,使用工具 iZotope RX7 de-hum(或Waves X-Hum)
6.处理歌手的口水音,使用工具 iZotope RX7 mouth de-click(如果自动去除不够干净,请使用Audition或RX7 Standalone光谱编辑器的自动修复功能)
7.控制歌手的呼吸音,使用工具 iZotope RX7 Breath Control(或Waves DeBreath)
*8.处理歌手的齿音,这部分不建议直接在修复阶段进行,但如果歌手齿音太过严重在干声时就已经让人感到严重不适,可以提前处理成正常齿音的大小。使用工具为FabFliter Pro-DS(或 iZotope RX7 de-ess 或 Waves Sibilance 或 Waves DeEsser 或 Waves RDeEesser)

注意:
*以上8点除8.以外均为破坏性处理(挂上选好了参数直接渲染)而不是实时处理(一直在音轨效果器机架上挂着运行),实时处理挂上去这个DAW就离崩溃不远了。
*以上8点并非每一点都需要,并且在不需要的时候也不要挂上去过一遍。可能会有不希望的破坏现象发生。
*由于本人常用的插件中修复套件就是这几套,还有更多的插件中也有类似的修复套件(比如Deesser几乎家家都有),所以欢迎补充认为更好的插件在这里。但是个人认为 iZotope RX7 的修复能力无出其右,在它的Standalone中还有更多特殊的修复工具(如de-reverb去混响、de-wind去风声、de-bleed去串扰、de-rustlede-rustle去除衣物摩擦的沙沙声等等)。

至于你所说的局部处理和全局处理,在有些情况下只有某一段有问题,可以只选中这一段进行处理。比如只有10s处有口水音,那么只选择这一部分挂上mouth de-click渲染有助于减少等待时间(以上那八个挂上去全应用按照五分钟时长的干声可能需要渲染二十分钟)和减少误处理(当然就算误处理了也听不出来)。但是像降噪、控制呼吸音和齿音这种就一般需要全局处理。

通常情况下,人声修音一切操作的目的,追求的是让声音变得更加“接近自然听见的声音”,也就是正常面对面说话唱歌的感觉,当然除去vocoder或者特殊的特效需求这种情况。

之所以要做各种操作,比如降噪eq混响齿音等等等等,原因是录音的过程,因为麦,环境拾音方式等种种原因,声音会变得不再自然。
比如说,人耳听别人说话是不会有近讲效应的,那么用麦录完音我们就会稍微衰减一些200以下的部分,声音就更接近真实的没有畸变过的; 麦克风会把s等齿音放大很多,因此我们用desser去除一些齿音,就更接近真实的听感。。。。。。千万要明白为什么这么做,不要看别人干啥就跟着干啥,事实上一条好的干声是完全可以做到除了压缩和eq其他什么效果器都不用加的,加一堆乱七八糟效果器出来的东西,往往也不会很好听,因为线路越长,音质就会越差。

修正,只是为了找回声音原本应有的样子。

知道了原理与动机后,再说些进阶的,那就是一切能通过改进录音实现的东西,千万不要留给修音解决。一切能够通过混音解决的问题,千万不要留给母带解决,
假如 izotope这样的软件真能那么有效的改善一切音质问题,那么那些价值几千万的装满声学装修的录音棚早就倒闭关门了。

在最开始的时候就尽量解决好一切问题,这也是一切艺术产品制作流程的共通思路。

背景音乐:听音乐风格,整体的配器手法,不同乐段的丰满程度以及声场的宽度、给人声留下了多少空间。

人声压缩+eq低切+eq中高频增益+高频衰减+齿音压缩+声像+音量自动化控制,添加发送式的混响和延迟
伴奏让位+轻度混响+多段压缩(选择性)
总线轻度混响+eq+多段压缩(选择性)

人声做一下低切,切到100-150hz左右,然后降低中低频,降低500-800hz左右,降低3-5db,适当提高1000-2000hz的频率,提高1-3db,高频也可以增加一些。5000-7000提高3db左右。12000以上的频率根据情况酌情考虑,可以增加,也可不增加。

小丸工具箱 2pass 1700kbps

x264程序:系统几位就几位,10bit技术上比8bit好,但是实际使用中没区别,所以8bit
分离器:auto就行
2Pass:2次编码,有目标码率限制而又有空余时间可以进行二次编码,费时间
CRF:恒定Rate Factor (码率系数)缺省值23,通过降低“less important”帧的质量来达到目的,0为无损模式,23为缺省,51质量最差,RF值加6,输出码率大概减少一半;减6,输出码率翻倍,从主观上讲,18~28是一个合理的范围,18往往被认为从视觉上看是近似无损的,小丸工具箱默认23.5,足够了,你可以选择22.5-23.5之间,一些1小时以上的长电影最好选22,其他的小丸工具箱默认23.5够用了
ps“less important”的意思是那些过于耗费码率又难以用肉眼察觉的帧,比如复杂或者高速运行的场景。省下来的码率会分配给其它更有效的帧。


参考资料
【请教】关于人声的处理!
用adobe audition怎样改变声音声场左右位置?
日经贴解答系列