1

是否可以在 iPhone 上实时移相音频?

我有一个简单的应用程序设置,可以实时从麦克风输出音频。我想要做的是处理这个音频,即做一个相移。

我是否正确,唯一的方法是获取我的样本空间,进行 FFT,相移,然后逆 fft?

我知道 vDSP 库,但对于一个简单的任务来说似乎开销太大。

更新:我有来自 Elec Eng 的 DSP 基础,是的,我真的很想做相移。我不需要做频移或过滤,它们是单独的过程,我稍后会实施。

4

5 回答 5

3

是的,这是一种方法。

此示例 C 代码显示了它:

#include <stdio.h>
#include <math.h>

#ifndef M_PI
#define M_PI 3.14159265358979324
#endif

typedef struct
{
  double x, y;
} tComplex;

tComplex complexAdd(const tComplex* a, const tComplex* b)
{
  tComplex c;
  c.x = a->x + b->x;
  c.y = a->y + b->y;
  return c;
}

tComplex complexMul(const tComplex* a, const tComplex* b)
{
  tComplex c;
  c.x = a->x * b->x - a->y * b->y;
  c.y = a->x * b->y + a->y * b->x;
  return c;
}

void dft(tComplex out[], const tComplex in[], size_t n, int direction)
{
  size_t k, i;
  for (k = 0; k < n; k++)
  {
    tComplex r = { 0, 0 }, e;
    for (i = 0; i < n; i++)
    {
      e.x = cos(-2 * direction * M_PI / n * ((double)k - n / 2) * ((double)i - n / 2));
      e.y = sin(-2 * direction * M_PI / n * ((double)k - n / 2) * ((double)i - n / 2));
      e = complexMul(&e, &in[i]);
      r = complexAdd(&r, &e);
    }
    out[k] = r;
  }
}

double maxAbs(const tComplex in[], size_t n)
{
  double m = 0;
  while (n--)
  {
    double a = hypot(in->x, in->y);
    if (m < a) m = a;
    in++;
  }
  return m;
}

#define SAMPLE_CNT   32
#define SAMPLE_SHIFT 3

int main(void)
{
  tComplex signalIn[SAMPLE_CNT];
  tComplex signalOut[SAMPLE_CNT];
  tComplex tmp[SAMPLE_CNT];
  int i;

  // signalIn[] = square pulse
  for (i = 0; i < SAMPLE_CNT; i++)
  {
    signalIn[i].x = ((i - SAMPLE_CNT / 2) >= 0) * ((i - SAMPLE_CNT / 2) < SAMPLE_CNT / 4);
    signalIn[i].y = 0;
  }

  // tmp[] = DFT{signalIn[]}
  dft(tmp, signalIn, SAMPLE_CNT, 1);

  // tmp[] = DFT{signalIn[]} * exp(j * 2 * PI * f * TimeShift)
  for (i = 0; i < SAMPLE_CNT; i++)
  {
    tComplex e;
    e.x =  cos(2 * M_PI * (i - SAMPLE_CNT / 2) * SAMPLE_SHIFT / SAMPLE_CNT);
    e.y = -sin(2 * M_PI * (i - SAMPLE_CNT / 2) * SAMPLE_SHIFT / SAMPLE_CNT);
    tmp[i] = complexMul(&tmp[i], &e);
  }

  // signalOut[] = IDFT{tmp[]}
  dft(signalOut, tmp, SAMPLE_CNT, -1);

  printf("     Re{In[]}    .     Im{In[]}    |"
         "   |DFT{In[]}|   |"
         "    Re{Out[]}    .    Im{Out[]}\n");

  for (i = 0; i < SAMPLE_CNT; i++)
  {
    int j, s;

    s = signalIn[i].x / maxAbs(signalIn, SAMPLE_CNT) * 8 + .5;
    for (j = -8; j <= 8; j++) printf("%c", " *"[s == j]);
    printf(".");
    s = signalIn[i].y / maxAbs(signalIn, SAMPLE_CNT) * 8 + .5;
    for (j = -8; j <= 8; j++) printf("%c", " *"[s == j]);

    printf("|");

    s = hypot(tmp[i].x, tmp[i].y) / maxAbs(tmp, SAMPLE_CNT) * 8;
    for (j = -8; j <= 8; j++) printf("%c", " *"[s == j]);

    printf("|");

    s = signalOut[i].x / maxAbs(signalOut, SAMPLE_CNT) * 8 + .5;
    for (j = -8; j <= 8; j++) printf("%c", " *"[s == j]);
    printf(".");
    s = signalOut[i].y / maxAbs(signalOut, SAMPLE_CNT) * 8 + .5;
    for (j = -8; j <= 8; j++) printf("%c", " *"[s == j]);

    printf("\n");
  }

  return 0;
}

输出:

     Re{In[]}    .     Im{In[]}    |   |DFT{In[]}|   |    Re{Out[]}    .    Im{Out[]}
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |          *      |        *        .        *        
        *        .        *        |             *   |        *        .        *        
        *        .        *        |               * |        *        .        *        
                *.        *        |                *|        *        .        *        
                *.        *        |               * |        *        .        *        
                *.        *        |             *   |        *        .        *        
                *.        *        |          *      |                *.        *        
                *.        *        |        *        |                *.        *        
                *.        *        |         *       |                *.        *        
                *.        *        |         *       |                *.        *        
                *.        *        |         *       |                *.        *        
        *        .        *        |        *        |                *.        *        
        *        .        *        |        *        |                *.        *        
        *        .        *        |         *       |                *.        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |        *        |        *        .        *        

您可以看到,输出是输入的副本,按SAMPLE_SHIFT时间偏移了样本(此处为 3)。

您也可以更改SAMPLE_SHIFT为非整数值,以小数样本进行移位。

SAMPLE_SHIFT= 2.5的输出:

     Re{In[]}    .     Im{In[]}    |   |DFT{In[]}|   |    Re{Out[]}    .    Im{Out[]}
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |          *      |        *        .        *        
        *        .        *        |             *   |        *        .        *        
        *        .        *        |               * |        *        .        *        
                *.        *        |                *|        *        .        *        
                *.        *        |               * |        *        .        *        
                *.        *        |             *   |           *     .        *        
                *.        *        |          *      |                *.        *        
                *.        *        |        *        |              *  .        *        
                *.        *        |         *       |               * .        *        
                *.        *        |         *       |              *  .        *        
                *.        *        |         *       |               * .        *        
        *        .        *        |        *        |              *  .        *        
        *        .        *        |        *        |                *.        *        
        *        .        *        |         *       |           *     .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |        *        |        *        .        *        
        *        .        *        |         *       |        *        .        *        
        *        .        *        |        *        |        *        .        *        
于 2012-08-09T08:59:55.137 回答
0

您想要做的应该对应于输出是输入与内核的折叠积分。它可以作为脉冲输入的输出找到。如果你能找到它,请使用适当的数值积分方法进行折叠积分。这相当于一个 fft:s 只需要完成一次,其余的应该连续完成以连续提供输出。

于 2012-07-31T20:01:32.907 回答
0

是否可以在 iPhone 上实时移相音频?

嗯,是的,但这可能不是你真正想要做的。(见 TJD 的评论)

我有一个简单的应用程序设置,可以实时从麦克风输出音频。我想要做的是处理这个音频,即做一个相移。

处理音频并不等同于进行相移。也许你想“过滤”?

我是否正确,唯一的方法是获取我的样本空间,进行 FFT,相移,然后逆 fft?

假设您要做的是过滤音频,那么不,我不推荐 FFT。您将遇到许多问题,例如窗口化、重叠/添加和性能。FFT 不是设计滤波器的好方法。

我知道 vDSP 库,但对于一个简单的任务来说似乎开销太大。

我从未使用过 vDSP,但从快速检查来看,它看起来不像是正确的过滤解决方案。正确的解决方案更有可能使用简单的双二阶函数。你可以在这里阅读它们:

http://en.wikipedia.org/wiki/Digital_biquad_filter

这里有一本不错的“食谱”:

http://www.musicdsp.org/files/Audio-EQ-Cookbook.txt

于 2012-07-31T23:26:18.810 回答
0

应该可以在 iOS 设备上实时进行各种音频处理。有足够的处理能力。

也许你可以更详细地描述你想要做什么样的相移。严格来说,“唯一”的方法是使用 FFT,但它可能是最好的方法,至少在性能和电池寿命方面是这样。

当您说 vDSP 似乎有太多开销时,您指的是处理器性能还是工程工作量?我同意,vDSP 有一些不受欢迎的工程工作,主要是由于遗留接口需要将真实数据(例如,输入信号)重新排列成奇偶分割。但是,其他方面,例如 FFT 数据的设置,是必要的;他们被 FFT 的性质所驱使。

vDSP 例程的计算性能应该非常好。如果您在处理器性能或工程方面遇到困难,请报告错误(或功能请求)。

于 2012-08-08T17:28:32.273 回答
0

我同意其他人的观点,即(实时前向)相移不需要 DSP,因为它只是音频样本的时间偏移。当然,实时反向相移比 DSP 需要更多的努力,因为它需要时间旅行。

另一方面,我需要一种简单快速的方法来执行 iphone 麦克风音频样本的固定频移。实际上有几个频率偏移,例如 1 Hz 增量或大约。有人知道在 iPhone 上执行该任务的快速简便的方法吗?

于 2013-05-07T23:52:12.203 回答