3

我正在浏览一个文件列表并将其中的 xml 数据解组为一个 structs 数组rArray。我打算处理大约 18000 个文件。当我处理了大约 1300 个文件时,程序会出现恐慌并说打开了太多文件。如果我将处理的文件数量限制为 1000 个安全数量,则程序不会崩溃。

如下所示,我正在使用ioutil.ReadFile读取文件数据。

for _, f := range files {

    func() {
        data, err := ioutil.ReadFile("./" + recordDir + "/" + f.Name())
        if err != nil {
            fmt.Println("error reading %v", err)
            return
        } else {
            if (strings.Contains(filepath.Ext(f.Name()), "xml")) {

                //unmarshal data and put into struct array
                err = xml.Unmarshal([]byte(data), &rArray[a])
                if err != nil {
                    fmt.Println("error decoding %v: %v",f.Name(), err)
                    return
                }
            }
        }
    }()
}

我不确定 Go 是否使用了太多的文件描述符或没有足够快地关闭文件。

阅读https://groups.google.com/forum/#!topic/golang-nuts/7yXXjgcOikM并查看http://golang.org/src/pkg/io/ioutil/ioutil.goioutil中的源代码后,代码for表示它用于关闭文件。当调用函数返回时运行并且是调用函数。我的理解正确吗?我还尝试将我的部分代码包装在一个函数中,但这没有任何区别。ioutil.ReadFiledeferdeferReadFile()ioutil.ReadFile

ulimit的设置为无限。

更新: 我相信太多文件的错误实际上是在我的解压缩功能期间发生的。

func Unzip(src, dest string) error {
    r, err := zip.OpenReader(src)
    if err != nil {
        return err
    }

    for _, f := range r.File {
        rc, err := f.Open()
        if err != nil {
            panic(err)
        }

        path := filepath.Join(dest, f.Name)
        if f.FileInfo().IsDir() {
            os.MkdirAll(path, f.Mode())
        } else {
            f, err := os.OpenFile(
                path, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, f.Mode())
            if err != nil {
                panic(err)
            }

            _, err = io.Copy(f, rc)
            if err != nil {
                panic(err)
            }
            f.Close()
        }
        rc.Close()
    }
    r.Close()
    return nil
}

我最初是从https://gist.github.com/hnaohiro/4572580Unzip获得的函数,但经过进一步检查,在 gist 作者的函数中使用似乎是错误的,因为文件只会在函数返回后关闭,为时已晚因为那时将打开 18000 个文件描述符。;)deferUnzip()

Close如上所示,我用显式替换了 deferred Close(),但仍然收到相同的“打开的文件太多”错误。我修改后的解压功能有问题吗?

更新# 2 糟糕,我在 Heroku 上运行它,并且一直在将我的更改推送到错误的应用程序。经验教训:在 heroku 工具带中验证目标应用程序。

来自https://gist.github.com/hnaohiro/4572580的解压缩代码不起作用,因为在处理完所有文件之前它不会关闭文件。

我上面明确关闭的解压缩代码有效,@peterSO 答案中的延迟版本也是如此。

4

1 回答 1

3

我会将 Unzip 函数从https://gist.github.com/hnaohiro/4572580修改为以下内容:

package main

import (
    "archive/zip"
    "io"
    "log"
    "os"
    "path/filepath"
)

func unzipFile(f *zip.File, dest string) error {
    rc, err := f.Open()
    if err != nil {
        return err
    }
    defer rc.Close()

    path := filepath.Join(dest, f.Name)
    if f.FileInfo().IsDir() {
        err := os.MkdirAll(path, f.Mode())
        if err != nil {
            return err
        }
    } else {
        f, err := os.OpenFile(
            path, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, f.Mode())
        if err != nil {
            return err
        }
        defer f.Close()

        _, err = io.Copy(f, rc)
        if err != nil {
            return err
        }
    }
    return nil
}

func Unzip(src, dest string) error {
    r, err := zip.OpenReader(src)
    if err != nil {
        return err
    }
    defer r.Close()

    for _, f := range r.File {
        err := unzipFile(f, dest)
        if err != nil {
            return err
        }
    }

    return nil
}

func main() {
    err := Unzip("./sample.zip", "./out")
    if err != nil {
        log.Fatal(err)
    }
}
于 2014-06-13T07:48:15.990 回答