正文

使用 python 从音频文件中提取 1/3 个八度音阶

 2023-02-25  150

关键词：

【中文标题】使用 python 从音频文件中提取 1/3 个八度音阶【英文标题】：1/3 octave from audio file with python 【发布时间】：2019-06-27 13:02:46 【问题描述】：

我是信号处理的初学者，我想在 mp3 或 wav 文件上应用三倍频程带通滤波器（产生大约 30 个新的滤波时间序列）中心频率：39 Hz、50 Hz、63 Hz、79 Hz、99 Hz、125 Hz、157 Hz、198 Hz、250 Hz、315 Hz、397 Hz、500 Hz、……

第一种方式...

读完 mp3 文件后，我得到了立体声信号。然后我将 1 个音频文件分割成 4096 个样本。然后我把它分成左右声道。现在我有每个通道的数据数组。接下来，我将快速傅立叶变换应用于示例文件。问题是我需要对这些样本应用第三倍频程带通滤波器。由于我不太了解声学库，因此我需要有关如何做的建议。

另一种方式...

我找到了一些与我的期望相关的网站，但他使用倍频程带通滤波器。我使用迈克尔在https://www.dsprelated.com/thread/7036/octave-bandpass-filter-on-audio-wav-files 上的回复中的代码所以我想将此代码应用于第三个八度。

from scipy import signal
import numpy as np
import matplotlib.pyplot as plt
import math

sampleRate = 44100.0
nyquistRate = sampleRate/2.0

#center = [39, 50, 63, 79, 99, 125, 157, 198, 250, 315, 397, 500, 630, 
794, 1000, 1260, 1588, 2000, 2520, 3176, 4000, 5040, 6352, 8000, 10080, 
12704, 16000, 20160, 2508, 32000]
centerFrequency_Hz = 480.0;
lowerCutoffFrequency_Hz=centerFrequency_Hz/math.sqrt(2);
upperCutoffFrequenc_Hz=centerFrequency_Hz*math.sqrt(2);

# Determine numerator (b) and denominator (a) coefficients of the digital 
# Infinite Impulse Response (IIR) filter.
b, a = signal.butter( N=4, Wn=np.array([ lowerCutoffFrequency_Hz, 
upperCutoffFrequenc_Hz])/nyquistRate, btype='bandpass', analog=False, 
output='ba');

# Compute frequency response of the filter.
w, h = signal.freqz(b, a)

fig = plt.figure()
plt.title('Digital filter frequency response')
ax1 = fig.add_subplot(111)

plt.plot(w, 20 * np.log10(abs(h)), 'b')
plt.ylabel('Amplitude [dB]', color='b')
plt.xlabel('Frequency [rad/sample]')

ax2 = ax1.twinx()
angles = np.unwrap(np.angle(h))
plt.plot(w, angles, 'g')
plt.ylabel('Angle (radians)', color='g')
plt.grid()
plt.axis('tight')
plt.show()

fs, speech = wavfile.read(filename='segmented/atb30.wav');
speech = speech[:, 0]
fig=plt.figure()
plt.title('Speech Signal')
plt.plot(speech)

filteredSpeech=signal.filtfilt(b, a, speech)
fig=plt.figure()
plt.title('480 Hz Octave-band Filtered Speech')
plt.plot(filteredSpeech)

【问题讨论】：

【参考方案1】：

根据ANSI S1.11: Specification for Octave, Half-Octave, and Third Octave Band Filter Sets 中的公式 (5) 和 (6)，对于 1/3 倍频程，每个频段的低频和高频由下式给出：

factor = np.power(G, 1.0/6.0)
lowerCutoffFrequency_Hz=centerFrequency_Hz/factor;
upperCutoffFrequency_Hz=centerFrequency_Hz*factor;

其中G 为2（根据指定的base-2 规则设计过滤器时）或np.power(10, 0.3)（根据指定的base-10 规则设计过滤器时）。在您的情况下，您提供的中心频率接近使用 base-2 规则获得的值，因此您还应该 G = 2 保持一致。

请注意，对于给定的中心频率阵列，一些较高频率的值将大于奈奎斯特频率（采样率的一半）。当尝试使用scipy.signal.butter 设计滤波器时，这些将相应地产生无效的上归一化频率输入。为避免这种情况，您应该将中心频率阵列限制为小于 ~19644Hz 的值：

centerFrequency_Hz = np.array([39, 50, 63, 79, 99, 125, 157, 198, 250, 315, 
397, 500, 630, 794, 1000, 1260, 1588, 2000, 2520, 3176, 4000, 5040, 6352, 8000, 10080, 
12704, 16000])

另外，scipy.signal.butter 一次可以处理一组低频和高频，因此您应该循环遍历低频和高频阵列来设计每个带通滤波器：

for lower,upper in zip(lowerCutoffFrequency_Hz, upperCutoffFrequency_Hz):
    # Determine numerator (b) and denominator (a) coefficients of the digital 
    # Infinite Impulse Response (IIR) filter.
    b, a = signal.butter( N=4, Wn=np.array([ lower, 
    upper])/nyquistRate, btype='bandpass', analog=False, 
    output='ba');

    # Compute frequency response of the filter.
    w, h = signal.freqz(b, a)

    plt.plot(w, 20 * np.log10(abs(h)), 'b')

    # Filter signal
    filteredSpeech = signal.filtfilt(b, a, speech)

这应该会为您提供类似于以下幅度响应的图：

此时您可能会注意到最低频段的一些不稳定迹象。为避免此问题，您可以切换到sos 表示：

for lower,upper in zip(lowerCutoffFrequency_Hz, upperCutoffFrequency_Hz):
    # Design filter
    sos = signal.butter( N=4, Wn=np.array([ lower, 
    upper])/nyquistRate, btype='bandpass', analog=False, 
    output='sos');

    # Compute frequency response of the filter.
    w, h = signal.sosfreqz(sos)

    plt.plot(w, 20 * np.log10(abs(h)), 'b')

    # Filter signal
    filteredSpeech = signal.sosfiltfilt(sos, speech)

【讨论】：

非常感谢，正是我所需要的。我得到了像link 这样的幅度响应，对吗？接下来，我需要计算每个过滤时间序列的 RMS、pan、box 计数，我可以使用哪个值来提取这些特征？我在您的链接中看不到图片。对于应该像np.sqrt(np.mean(np.power(filteredSpeed, 2))) 一样简单的RMS。对于其他功能，您可能希望将其表述为另一个问题，包括您尝试使用它们的目的。哦，对不起。现在可以看到链接了。谢谢你的建议。震级响应看起来不错。【参考方案2】：

我最近开发了一个函数来轻松执行倍频程和分数倍频程滤波，它在 github 上可用：PyOctaveBand

它使用 SOS 系数并执行下采样以在低频下正确过滤。

【讨论】：

从python内存中的MPEG（.ts）文件中提取音频，而不将MPEG写入文件

...中提取音频。目前我需要先将文件保存到文件系统，然后使用moivepy 查看详情

从音频文件中提取音高特征

...:51:18【问题描述】：我正在尝试，用于分类问题。我正在使用python(scipy/numpy)进行分类。我想我可以使用scipy.fft获得频率特征，但我不知道如何使用频率来近似音符。我进行了一些研究，发现我需要获取将频率映射到12箱的色度特... 查看详情

使用 ffmpeg 和 python 将视频中的所有音频流提取到单独的音频文件中

】使用ffmpeg和python将视频中的所有音频流提取到单独的音频文件中【英文标题】：Extractallaudiostreamsfromvideointoseperateaudiofilesusingffmpegandpython【发布时间】：2020-11-1421:38:08【问题描述】：我正在尝试从视频中提取所有音频流/音轨（... 查看详情

如何使用 ffmpeg 从 MPEG-4 文件中提取音频 [关闭]

】如何使用ffmpeg从MPEG-4文件中提取音频[关闭]【英文标题】：HowtoextractaudiofromMPEG-4fileusingffmpeg[closed]【发布时间】：2015-04-1406:05:29【问题描述】：我们如何从视频文件（MPEG-4格式）中提取音频？存储提取的音频数据以供进一步分... 查看详情

iOS从.mov文件中提取音频

...说，我需要提取音频并将其保存为.aif或.aiff文件。我尝试使用AVMutableComposition，并将mov文件加载为AVAsset。在最终使用AVAssetExportSessio 查看详情

在 C++ 中使用 libsndfile 从 WAV 文件中提取原始音频数据

】在C++中使用libsndfile从WAV文件中提取原始音频数据【英文标题】：ExtractrawaudiodatafromWAVfilesusinglibsndfileinC++【发布时间】：2013-10-1110:29:48【问题描述】：我正在开发一个为某些设备提供音频输入的应用程序。设备期望以原始音频... 查看详情

使用javascript从视频流中提取音频

】使用javascript从视频流中提取音频【英文标题】：Extractaudiofromvideostreamusingjavascript【发布时间】：2012-06-2607:26:42【问题描述】：我想使用javascript从视频文件中提取音频，是否可以制作mp3文件或任何格式，以便我可以在html5的音... 查看详情

在 django 中使用 FFMPEG 在网络上上传后从视频中提取 WAV 音频文件

】在django中使用FFMPEG在网络上上传后从视频中提取WAV音频文件【英文标题】：ExtractWAVaudiofilefromvideoafteruploadingonweb,usingFFMPEGindjango【发布时间】：2019-07-3110:03:09【问题描述】：问题我正在尝试找到一种方法来从mp4视频文件中提取... 查看详情

python librosa 包 - 如何从频谱中提取音频

...mspectrum【发布时间】：2018-02-1109:29:57【问题描述】：如果使用Librosa进行人声分离，人声和背景音乐可以分开绘制，但我想从人声部分提取音频，人声部分的频谱位于名为“S_foreground”的变量中（请访问上面的演示链接）。如何... 查看详情

使用 FFMPEG 从 Quicktime 中提取多声道音频

】使用FFMPEG从Quicktime中提取多声道音频【英文标题】：UsingFFMPEGtoextractmultichannelaudiofromQuicktime【发布时间】：2020-07-0909:20:51【问题描述】：所以我有一个包含代理视频内容和8个音轨的quicktime文件。我需要将音频提取到单个多通道... 查看详情

从视频文件中提取音频并在 OpenAL 中播放

...是最简单的方法（与FFMPEG相比，不是吗？），但我找不到使用OpenAL获得可播放缓冲区的方法。我在Mac 查看详情

如何从 FLV 中提取音频？

...LV?【发布时间】：2011-04-2201:47:18【问题描述】：我需要从使用FMS录制的FLV文件中提取音频。我使用了在我的Flash应用程序中编码的SPEEX，它将音频和视频流式传输到FMS。我曾尝试使用FFMPEG，但没有成功。这是我的FLV的-i输出：FFmpeg... 查看详情

Java Media Framework：从 mp3 文件中提取音频信息

...的是从文件中提取音频数据并计算音乐相似度。我一直在使用javazoom来处理mp3文件。通过使用audioFormat，我从mp3文件中提取原始数据：byte[]audi 查看详情

使用 JAVA 从 wav 文件中提取振幅数组

】使用JAVA从wav文件中提取振幅数组【英文标题】：ExtractamplitudearrayfromawavFileusingJAVA【发布时间】：2017-01-1119:45:41【问题描述】：我正在尝试从音频文件（WAV文件）中提取振幅数组。我将使用这个幅度数组来绘制给定wav文件的幅... 查看详情

从视频文件中提取wav文件

...都可以，只要我可以将音频提取到wav文件中。目前我正在使用Windows窗体中的WindowsMediaPlayerCOM控件来播放视频，但任何其他嵌入式播放器也可以。关于如何做查看详情

使用ffmpeg从视频文件中提取音频文件视频抽帧和切割视频(代码片段)

目录ffmpeg下载使用ffmpeg从视频文件中提取音频文件批量提取文件夹下多个视频文件的音频使用ffmpeg从视频文件中提取视频帧使用ffmpeg将按固定时长将视频切割成多个小片段将分割得到的视频存放在新建文件夹下（这个我运行... 查看详情

如何使用 ffmpeg 提取 8khz 的音频

】如何使用ffmpeg提取8khz的音频【英文标题】：Howtoextractaudioin8khzusingffmpeg【发布时间】：2020-10-0113:04:20【问题描述】：我正在使用ffmpeg从视频中提取音频。下面的代码从视频文件中下载音频。我不确定这个程序的效率如何，但我... 查看详情

当我使用 ffmpeg 从视频中提取音频时，出现错误

】当我使用ffmpeg从视频中提取音频时，出现错误【英文标题】：wheniextractanaudiofromvideousingffmpeg,Itappearanerror【发布时间】：2017-03-1006:31:03【问题描述】：我需要视频中的音频。所以我找到了ffmpeg。当我使用ffmpeg-itest.mp4-acodeccopy-vnte... 查看详情