3

我正在使用这个http://www.codeproject.com/Articles/31944/Implementing-a-TextReader-to-extract-various-files并且它大部分都在工作。

我编写了这个测试来检查过滤器是否会按预期从字节数组中读取。

private const string ExpectedText = "This is a test!";
[Test]
public void FilterReader_RtfBytes_TextMatch()
{
    var bytes = File.ReadAllBytes(@"Test Documents\DocTest.rtf");
    var reader = new FilterReader(bytes, ".rtf");
    reader.Init();
    var actualText = reader.ReadToEnd();
    StringAssert.Contains(ExpectedText, actualText);
}

测试失败并出现ErrorCode : FILTER_E_ACCESS,当我给它文件名时它工作正常。

new FilterReader(@"Test Documents\DocTest.rtf", ".rtf"); <-- works

我很困惑为什么会这样。我查看了代码,似乎是 rtf filter dll 返回了错误。这更令人费解。

它适用于其他文件类型,例如;.doc、.docx、.pdf

4

1 回答 1

2

在底层,使用 iFilter 的具体工作方式是由构造函数定义的:当你使用构造函数时,FilterReader(byte[] bytes, string extension)使用 IPersistStream 从内存中加载内容,当FilterReader(string path, string extension)- IPersistFile 用于从文件加载时。

为什么 rtf-ifilter 在与 IPersistStream 一起使用时返回错误,恐怕我们无法知道,因为源代码没有打开

在我的情况下,我在构造函数中封装了过滤器的特定内容,并以接下来的方式重构代码:

  • 删除所有构造函数
  • 删除public void Init()方法
  • 实现一个自定义构造函数public FilterReader(string fileName, string extension, uint blockSize = 0x2000)

    #region Contracts
    
    Contract.Requires(!string.IsNullOrEmpty(fileName));
    Contract.Requires(!string.IsNullOrEmpty(extension));
    Contract.Requires(blockSize > 1);
    
    #endregion
    
    const string rtfExtension = ".rtf";
    
    FileName = fileName;
    Extension = extension;
    BufferSize = blockSize;
    
    _buffer = new char[ActBufferSize];
    
    // ! Take into account that Rtf-file can be loaded only using IPersistFile.
    var doUseIPersistFile = string.Compare(rtfExtension, extension, StringComparison.InvariantCultureIgnoreCase) == 0;
    
    // Initialize _filter instance.
    try
    {
        if (doUseIPersistFile)
        {
            // Load content using IPersistFile.
            _filter = FilterLoader.LoadIFilterFromIPersistFile(FileName, Extension);
        }
        else
        {
            // Load content using IPersistStream.
            using (var stream = new FileStream(path: fileName, mode: FileMode.Open, access: FileAccess.Read, share: FileShare.Read))
            {
                var buffer = new byte[stream.Length];
                stream.Read(buffer, 0, buffer.Length);
    
                _filter = FilterLoader.LoadIFilterFromStream(buffer, Extension);
            }
        }
    }
    catch (FileNotFoundException)
    {
        throw;
    }
    catch (Exception e)
    {
        throw new AggregateException(message: string.Format("Filter Not Found or Loaded for extension '{0}'.", Extension), innerException: e);
    }
    
于 2014-12-15T08:17:08.097 回答