我正在阅读一个小的 MSWord 文档并将其内容存储在一个字符串中。
此字符串中包含 SOH 特殊字符。在将它们写入新文本 (.txt) 文件之前,我想用占位符字符串替换它们,例如“#placeholder1”。请注意,我不想修改/编辑 MSWord 文档
我不确定 string.Replace 是否适合这个,或者我是否需要走不同的路线。它可能只是我用于 SOH 字符的参数。
建议?
你正在做的事情没有理由不起作用。这是一个可以在ideone上测试的最小示例:
using System;
public class Test
{
public static void Main()
{
String s = "\u0001 This is a test \u0001";
s = s.Replace("\u0001","Yay!");
Console.WriteLine(s);
}
}
我认为您可能做错的唯一另一件事是没有将调用的结果存储到Replace
.
您可以使用以下功能读取 Microsoft Word 文档的内容(需要参考Microsoft.Office.Interop.Word
):
public string ReadWordDoc(string Path)
{
// microsot word app object
Microsoft.Office.Interop.Word.Application _objWord=null;
// microsoft word document object
Microsoft.Office.Interop.Word.Document _objDoc= null;
// obj missing value (ms office)
object _objMissing = System.Reflection.Missing.Value;
// string builder object to hold doc's content
StringBuilder _sb = new StringBuilder();
try
{
// create new word app object
_objWord= new Microsoft.Office.Interop.Word.Application();
// check if the file exists
if (!File.Exists(Path)) throw (new FileNotFoundException());
// full path to the document
object _objDocPath = Path;
// readonly flag
bool _objReadOnly = true;
// open word doc
_objDoc = _objWord.Documents.Open(
ref _objDocPath,
ref _objMissing,
_objReadOnly,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing,
ref _objMissing);
// read entire content into StringBuilder obj
for (int i = 1; i <= _objDoc.Paragraphs.Count; i++)
{
_sb.Append(_objDoc.Paragraphs[i].Range.Text.ToString());
_sb.Append("\r\n");
}
// return entire doc's content
return _sb.ToString();
}
catch { throw; }
finally
{
_sb = null;
if (_objDoc != null) { _objDoc.Close(); }
_objDoc = null;
if (_objWord != null) { _objWord.Quit(); }
_objWord = null;
}
}