2

我有一个在商业产品中工作了一年多的块设备驱动程序。REQ_DISCARD最近,我尝试通过启用丢弃和处理带有标志的请求来添加对精简配置的支持。每当我blk_end_request从任何上下文调用这些类型的请求的任何变体时,我似乎最多只能得到一个BUG()输出,最坏的情况是挂起或糟糕(变体包括以 .blk_end_request_all为前缀的未锁定版本__)。此外,似乎当我尝试以这种方式完成请求时(这对于正常的读/写请求工作正常),上面的文件系统驱动程序 ext4REQ_DISCARD有时即使使用相同的请求指针也会重新发出相同的请求。这是一个简化的请求函数(传递给blk_init_queue) 来说明问题。这大约在我可以转过请求的时候,所以它消除了我几乎所有的代码,这又适用于正常的读/写。

// This is a simplified version of the function that's passed into blk_init_queue
static void
my_request_fn(struct request_queue * queue)
{
    struct request * req;

    while ((req = blk_fetch_request(queue)) != NULL) {

        if (rq_data_dir(req) && (req->cmd_flags & REQ_DISCARD)) {
            printk(KERN_INFO "Received DISCARD request from process %d, sector=%lu, req %p\n",
                   pid_nr(task_pid(current)),
                   blk_rq_pos(req),
                   req);
            // FIXME: this is a lie
            __blk_end_request_all(req, 0);
            continue;
        }

// ... more code hidden for brevity
    }
}

这些请求是否有一些需要从根本上不同的处理方式?我尝试查看其他驱动程序,例如 sd、md、xenblk 等……但它们完全不同,所以不清楚。我想最根本的问题是你如何正确处理 REQ_DISCARD 请求并通知/发出完成的信号?

如果这是一个已知错误,我的内核版本由 uname -a 报告是Linux mydevbox 3.2.0-54-generic #82-Ubuntu SMP Tue Sep 10 20:08:42 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux

4

1 回答 1

3

我在这里发帖是因为我束手无策。解决方案很简单,也许这会帮助遇到同样问题的其他人。有与该discard功能相关的新限制。其中两个如下。

// WARNING: these values are bad, do not use
queue->limits.discard_zeroes_data = 1;
queue->limits.max_discard_sectors = 1;
queue->limits.discard_granularity = 2048;

我以某种方式转置了最后两个值,因此丢弃粒度非常大,最大扇区仅为 1。在注释掉第三行(这应该只是一个提示)并修复第二行的 RHS 值之后,一切正常!这些值如下所示。

queue->limits.discard_zeroes_data = 1;
queue->limits.max_discard_sectors = 2048
// queue->limits.discard_granularity = 1;

如果您在BUG()处理 REQ_DISCARDED 请求时遇到间歇性崩溃和堆栈跟踪,请仔细检查您的配置。

于 2013-10-21T14:08:01.293 回答