6

我有一个声音文件(.3gp),大约 1 分钟。我想每 1/4 秒得到这个声音文件的频率。我的想法是每 1/4 秒从音频文件中接收样本,并使用 FFT 我可能会得到频率值。有没有办法做到这一点?

实际上,我会将声音文件分成 1/4 秒的样本声音文件(总是覆盖以前的文件),然后使用 FFT 算法并检测幅度最大的频率。但是可能有更简单的解决方案,但是我也不知道如何做到这一点。

***更新 2 - 新代码

到目前为止,我使用此代码:

public class RecordAudio extends AsyncTask<Void, double[], Void> {

    @Override
    protected Void doInBackground(Void... arg0) {

        try {
             int bufferSize = AudioRecord.getMinBufferSize(frequency,
             AudioFormat.CHANNEL_IN_MONO, AudioFormat.ENCODING_PCM_16BIT);


            //int bufferSize = AudioRecord.getMinBufferSize(frequency, 
                  //  channelConfiguration, audioEncoding); 

            AudioRecord audioRecord = new AudioRecord( 
                    MediaRecorder.AudioSource.MIC, frequency, 
                    channelConfiguration, audioEncoding, bufferSize); 

            short[] buffer = new short[blockSize];
            //double[] toTransform = new double[blockSize];


            audioRecord.startRecording();


            // started = true; hopes this should true before calling
            // following while loop

            while (started) {
               sampling++;

               double[] re = new double[blockSize];
               double[] im = new double[blockSize];

               double[] newArray = new double[blockSize*2];
               double[] magns = new double[blockSize];

               double MaxMagn=0;
               double pitch = 0;

               int bufferReadResult = audioRecord.read(buffer, 0,
                        blockSize);


               for (int i = 0; i < blockSize && i < bufferReadResult; i++) {
                   re[i] = (double) buffer[i] / 32768.0; // signed   16bit
                   im[i] = 0;
               }    

               newArray = FFTbase.fft(re, im,true);

               for (int i = 0; i < newArray.length; i+=2) {

                   re[i/2]=newArray[i];
                   im[i/2]=newArray[i+1];
                   magns[i/2] = Math.sqrt(re[i/2]*re[i/2]+im[i/2]*im[i/2]);
               }

              // I only need the first half      

              for (int i = 0; i < (magns.length)/2; i++) {
                   if (magns[i]>MaxMagn)
                   {
                       MaxMagn = magns[i];
                       pitch=i;
                   }
               }                                           
                 if (sampling > 50) {
                   Log.i("pitch and magnitude", "" + MaxMagn + "   " + pitch*15.625f);
                   sampling=0;
                   MaxMagn=0;pitch=0;
                   }                   


            }

            audioRecord.stop();

        } catch (Throwable t) {
            t.printStackTrace();
            Log.e("AudioRecord", "Recording Failed");
        }
        return null;
    }

我用这个: http: //www.wikijava.org/wiki/The_Fast_Fourier_Transform_in_Java_%28part_1%29

吉他弦似乎是正确的,但我自己的声音并不好,因此:

在此处输入图像描述

两个峰值的幅度大部分时间都在变化,我总是找到最大的来获得基频。

4

2 回答 2

7

在 Stack Overflow 上经常询问使用 FFT 进行音高跟踪,我写了一篇带有示例代码的博客条目。代码在 C 中,但通过解释和链接,您应该能够做您想做的事。

至于将其划分为 1/4 秒增量,您可以按照您的建议简单地采用 1/4 秒段的 FFT,而不是默认值(我认为大约是 1 秒)。如果这不能为您提供所需的频率分辨率,您可能必须使用不同的音高识别方法。您可以做的另一件事是使用超过 1/4 秒的重叠段,但以相隔 1/4 秒的间隔开始。此方法在博客条目中有所提及,但可能不符合您的设计规范。

于 2012-08-07T22:46:59.190 回答
1

尝试AsyncTask

class GetFrequency extends AsyncTask<String, Void, Void> {
   public Void doInBackground(String... params) {
          while (true) {

             // Apply Logic Here

           try {
                Thread.sleep(250);
               } catch (Exception ie) {
                  // TODO Auto-generated catch block
                e.printStackTrace();
               }
       }
   }  
}

在你的 MainActivity 中调用它,

frequencyButtonListener.setOnClickListener(new OnClickListener() {

        @Override
        public void onClick(View v) {

        new GetFrequency.execute(params);

        }
    });
于 2012-08-07T11:50:00.760 回答