linux - mmap 比 ioremap 慢

Question

我正在为运行 Linux 2.6.37 的 ARM 设备进行开发。我正在尝试尽快切换 IO 引脚。我做了一个小内核模块和一个用户空间应用程序。我尝试了两件事：

使用 . 直接从内核空间操作 GPIO 控制寄存器ioremap。
mmap()GPIO 控制寄存器没有缓存并从用户空间使用它们。

两种方法都有效，但第二种方法比第一种方法慢约 3 倍（在示波器上观察）。我想我禁用了所有缓存机制。

当然，我想充分利用这两个世界：从用户空间开发的灵活性和易用性以及内核空间的速度。

有谁知道为什么mmap()可能比慢ioremap()？

这是我的代码：

内核模块代码

static int ti81xx_usmap_mmap(struct file* pFile, struct vm_area_struct* pVma)
{
  pVma->vm_flags |= VM_RESERVED;
  pVma->vm_page_prot = pgprot_noncached(pVma->vm_page_prot);

  if (io_remap_pfn_range(pVma, pVma->vm_start, pVma->vm_pgoff,
                          pVma->vm_end - pVma->vm_start, pVma->vm_page_prot))
     return -EAGAIN;

  pVma->vm_ops = &ti81xx_usmap_vm_ops;
  return 0;
}

static void ti81xx_usmap_test_gpio(void)
{
  u32* pGpIoRegisters = ioremap_nocache(TI81XX_GPIO0_BASE, 0x400);
  const u32 pin = 1 << 24;
  int i;

  /* I should use IO read/write functions instead of pointer deferencing, 
   * but portability isn't the issue here */

  pGpIoRegisters[OMAP4_GPIO_OE >> 2] &= ~pin;    /* Set pin as output*/

  for (i = 0; i < 200000000; ++i)
  {
     pGpIoRegisters[OMAP4_GPIO_SETDATAOUT >> 2] = pin;
     pGpIoRegisters[OMAP4_GPIO_CLEARDATAOUT >> 2] = pin;
  }

  pGpIoRegisters[OMAP4_GPIO_OE >> 2] |= pin;    /* Set pin as input*/

  iounmap(pGpIoRegisters);
}

用户空间应用代码

int main(int argc, char** argv)
{
   int file, i;
   ulong* pGpIoRegisters = NULL;
   ulong pin = 1 << 24;

   file = open("/dev/ti81xx-usmap", O_RDWR | O_SYNC);

   if (file < 0)
   {
      printf("open failed (%d)\n", errno);
      return 1;
   }


   printf("Toggle from kernel space...");
   fflush(stdout);

   ioctl(file, TI81XX_USMAP_IOCTL_TEST_GPIO);

   printf(" done\n");    

   pGpIoRegisters = mmap(NULL, 0x400, PROT_READ | PROT_WRITE, MAP_SHARED, file, TI81XX_GPIO0_BASE);
   printf("Toggle from user space...");
   fflush(stdout);

   pGpIoRegisters[OMAP4_GPIO_OE >> 2] &= ~pin;

   for (i = 0; i < 30000000; ++i)
   {
      pGpIoRegisters[OMAP4_GPIO_SETDATAOUT >> 2] = pin;
      pGpIoRegisters[OMAP4_GPIO_CLEARDATAOUT >> 2] = pin;
   }

   pGpIoRegisters[OMAP4_GPIO_OE >> 2] |= pin;

   printf(" done\n");
   fflush(stdout);
   munmap(pGpIoRegisters, 0x400);    

   close(file);    
   return 0;
}

score 8 · Accepted Answer

这是因为 ioremap_nocache() 仍然在 VM 映射中启用 CPU 写入缓冲区，而 pgprot_noncached() 禁用缓冲性和缓存性。

苹果与苹果的比较将改为使用 ioremap_strongly_ordered() 。

score 3 · Accepted Answer

我的猜测是，由于mmap必须检查以确保您正在写入允许写入的内存，因此它会比内核版本慢（我相信/假设不会进行那种检查- - 使用你负责测试的内核模块，直到你非常确定你没有破坏东西）。

尝试从内核空间使用do_mmap（我相信这是一个）mmap，看看它的比较。如果它相对更快，那么我是对的。如果不是，那就是别的东西。

linux - mmap 比 ioremap 慢

内核模块代码

用户空间应用代码

2 回答 2

Related

Reference