当前位置: 首页 > news >正文

音频音量调整中的ramp up down

在日常生活中不管是打电话还是听音乐,都会遇到音量不合适而去调整音量的情况。如果音量调整软件处理不好,就会听到pop noise。产生pop noise的原因是音量直接从当前值骤变到目标值,而不是缓慢的变。如果缓慢的变就不会有pop noise了。图1显示的是音量变大时骤变和缓慢变的示意图。图2显示的是音量变小时骤变和缓慢变的示意图。

在技术上音量缓升叫ramp up,音量缓降叫ramp down。本文就讲讲如何处理好ramp up & ramp down。

音量调整也叫增益(gain)调整。音量的单位是dB,计算公式是dB = 20*log(gain) 。gain = Y/X ,X是原始PCM值,Y是音量变后的PCM值。当音量不变时,即Y = X或者gain = 1,就是0 dB(20 *log(1) = 0 dB)。通常每增加6dB音量就翻倍,即Y = 2X或者gain = 2,(20 *log(2) = 6.02 dB)。通常音量变化范围是-88dB~12dB。软件实现时用的却是gain,因此要从dB换算成gain。由上面的计算dB的公式可以得到gain,gain = 10^{dB/20}。为了减少运行时的运算量,就把音量(dB)和gain之间的mapping做成table。运行时只要根据dB值查表得到gain值。下表做了一个简单的示例。

float gain[101] = {

        0.0000398,  // -88 dB

        0.0000447,    // -87 dB

        …..

        1.0,               // 0 dB

        …..

        2.0,              // 6 dB

        …..

};

原始PCM值乘以gain就是变化后的PCM值了,即 Y = X * gain。

音频处理算法通常都是定点实现的,这样就需要把gain table定点化,以Q4.27为例,得到下表的示例。

Int gain[101] = {

        5343,            // -88 dB

        5995,            // -87 dB

        …..

        134217728 ,  // 0 dB

        …..

        267799575,  // 6 dB

        …

};

在音量ramp过程中,要想做好ramp up & down,ramp过程中每个采样点的gain都是不一样的,从当前的gain值逐渐变到目标gain值。首先得定好指标:1ms变化多少dB(定义为dBPerMS), 这个确定了就可算出需要多少毫秒从当前音量变到目标音量。例如指标是1ms变化1dB,那么音量要从0dB变到12dB就需要12ms。采样率不同,1ms内的采样点数也不一样(定义为samplesPerMS)。以8K采样率为例,1ms内有8个采样点,即samplesPerMS = 8。知道了dBPerMS和samplesPerMS,就可算出每个采样点变化的dB,即 dBPerMS/samplesPerMS,记为ΔdB。上面算出的是ramp up时的值,当ramp down时,就是-ΔdB。

在ramp过程中假设当前采样点的音量为N dB,对应的gain记为g1,则下个采样点的音量为(N + Δ) dB,对应的gain记为g2。可以得到如下两个表达式:

     N  =  20 * log(g1)           (1)

     N +  Δ = 20 * log(g2)      (2)

(2)式 - (1)式得式(3)

    Δ = 20 * log(g2) - 20 * log(g1) = 20 * log(g2/g1)        (3)

所以

    log(g2/g1) = Δ/20 ,    g2/g1 =  10^{\Delta /20} ,     g2 = g1 *  10^{\Delta /20}     (4)

这样就得到了下个采样点的gain(g2)与当前采样点的gain(g1)的数学表达式(式4)。当g2的值到达目标gain时就不再更新。10^{\Delta /20}可以称为ramp factor,事先把这个值算好,在软件中做定值用。在不同的指标和采样率下有不同的值。例如dBPerMS = 0.5,samplesPerMS = 48,则Δ/20 = 0.0005208,rampUpFactor =  10^{\Delta /20} = 1.0012,rampDownFactor = 10^{-\Delta /20} = 0.9988。Ramp factor确定后就可去做gain更新了。以从0dB ramp up到6dB ramp factor是1.0012为例,0 dB时gain是1,6dB时目标gain是2。算每个采样点时当前采样点的gain都是前一个采样点gain的1.0012倍,一直到gain达到2后保持不变。

 图3和图4是以正弦波为例做ramp up & down的原PCM和ramp后的PCM。

                                               图3 原PCM波形和频谱

                                          图4  ramp up & down后的波形和频谱

对上两图做一下解释。处理的是双声道的48k 采样的正弦波。通常声音刚开始播放时为了避免pop noise,会做一个ramp up,把音量从-88dB逐渐调整到0dB。30帧(每帧10ms)时,把音量调整到3dB,是个ramp up的过程。60帧时设成mute(mute是常见的一个场景,它可以算是音量调整中一个特例。mute时相当于把音量从当前值变为-88dB,unmute时就相当于把音量从-88dB变回去),是个ramp down的过程,几乎就听不到声音了。90帧时把音量设成0dB, 由于这时还处于mute,不生效,但音量值记住了。120帧时设成unmute,是个ramp up的过程,音量逐步变成0dB。150帧时把音量设成-6dB,是个ramp down的过程。

相关文章:

  • wordpress页眉描述/seo网站优化培训怎么做
  • 游戏网站建设网/石家庄百度关键词搜索
  • 微信商城网站怎么做/免费网站推广网站在线
  • 西宁摄网站制作/百度网盘在线登录
  • 织梦网站怎么做404页面模板/网络推广费用一般多少
  • 做网站需要哪些人手/百度百科怎么创建自己
  • LeetCode 5. 最长回文子串
  • 【阶段四】Python深度学习03篇:深度学习基础知识:神经网络可调超参数:激活函数、损失函数与评估指标
  • 一篇文章带你学会MySQL数据库的基本管理
  • 使用Python爬取CSDN历史博客文章列表,并生成目录
  • 打工人必学的法律知识(六)——《劳动法》案例-差绩效不等于「不能胜任工作」
  • iNav飞控AOCODARC-F7MINI固件编译
  • 【Redis】Redis实现分布式锁
  • SpringBoot实战(十一)集成RebbitMQ
  • python 代码注释
  • 从【卡内基梅隆大学机器人概论课】认识机器人学科需要哪些技能栈
  • 【ROS】—— 机器人导航(仿真)—导航原理(十七)
  • [C/Linux练习]进度条小程序