我正在编写一个 C# asp.net Web 应用程序,它接收各种格式的简历,即 doc、docx、pdf、文本等。
我想知道是否有一种简单的方法可以从文档中删除某些信息,无论它是什么文件类型,然后将编辑后的文件传递给最终用户?
要删除的信息将保存在一个字符串中
我正在编写一个 C# asp.net Web 应用程序,它接收各种格式的简历,即 doc、docx、pdf、文本等。
我想知道是否有一种简单的方法可以从文档中删除某些信息,无论它是什么文件类型,然后将编辑后的文件传递给最终用户?
要删除的信息将保存在一个字符串中
您将需要使用单独的 API 解析每种文件类型。
如果您使用流式阅读器 (http://msdn.microsoft.com/en-us/library/system.io.streamreader.aspx) 阅读文档,则可以使用 ReadToEnd 函数将所有内容存储在字符串中,然后使用功能:
MyString.Replace("Something to replace", "");
删除匹配项。如果文件格式无法作为字符串读取,则必须考虑不同的选项。但是,考虑到文件格式,可能有更快的解决方案,并且可能不会简单地存储。