3

我正在阅读一个小的 MSWord 文档并将其内容存储在一个字符串中。

此字符串中包含 SOH 特殊字符。在将它们写入新文本 (.txt) 文件之前,我想用占位符字符串替换它们,例如“#placeholder1”。请注意,我不想修改/编辑 MSWord 文档

我不确定 string.Replace 是否适合这个,或者我是否需要走不同的路线。它可能只是我用于 SOH 字符的参数。

建议?

4

2 回答 2

7

你正在做的事情没有理由不起作用。这是一个可以在ideone上测试的最小示例:

using System;
public class Test
{
    public static void Main()
    {
        String s = "\u0001 This is a test \u0001";
        s = s.Replace("\u0001","Yay!");
        Console.WriteLine(s);
    }
}

我认为您可能做错的唯一另一件事是没有将调用的结果存储到Replace.

于 2013-05-13T17:21:58.950 回答
0

您可以使用以下功能读取 Microsoft Word 文档的内容(需要参考Microsoft.Office.Interop.Word):

public string ReadWordDoc(string Path)
{
    // microsot word app object
    Microsoft.Office.Interop.Word.Application _objWord=null;

    // microsoft word document object
    Microsoft.Office.Interop.Word.Document _objDoc= null;

    // obj missing value (ms office)
    object _objMissing = System.Reflection.Missing.Value;

    // string builder object to hold doc's content
    StringBuilder _sb = new StringBuilder();

    try
    {
        // create new word app object
        _objWord= new Microsoft.Office.Interop.Word.Application();

        // check if the file exists
        if (!File.Exists(Path)) throw (new FileNotFoundException());

        // full path to the document
        object _objDocPath = Path;

        // readonly flag
        bool _objReadOnly = true;

        // open word doc
        _objDoc = _objWord.Documents.Open(
            ref _objDocPath,
            ref _objMissing,
            _objReadOnly,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing,
            ref _objMissing);

        // read entire content into StringBuilder obj
        for (int i = 1; i <= _objDoc.Paragraphs.Count; i++)
        {
            _sb.Append(_objDoc.Paragraphs[i].Range.Text.ToString());
           _sb.Append("\r\n");
        }

        // return entire doc's content
        return _sb.ToString();
    }
    catch { throw; }
    finally 
    {
        _sb = null;

        if (_objDoc != null) { _objDoc.Close(); }
        _objDoc = null;

        if (_objWord != null) { _objWord.Quit(); }
        _objWord = null;
    }
}
于 2013-05-13T17:44:31.003 回答