我有一个仅包含文本的 .html 文件(以某种方式格式化)。我想知道是否有一种方法可以复制所有文本(就像使用 ctrl+A 一样)并将其分配给字符串所以我可以将其导出到 .txt 文件?所有这一切都必须从代码隐藏中发生(打开 html,选择文本并将其分配给字符串)。
在Microsoft.Office.Interop
我记得有一个用于复制活动窗口选择或其他东西的选项,所以我想知道这是否可能在这里。
我有一个仅包含文本的 .html 文件(以某种方式格式化)。我想知道是否有一种方法可以复制所有文本(就像使用 ctrl+A 一样)并将其分配给字符串所以我可以将其导出到 .txt 文件?所有这一切都必须从代码隐藏中发生(打开 html,选择文本并将其分配给字符串)。
在Microsoft.Office.Interop
我记得有一个用于复制活动窗口选择或其他东西的选项,所以我想知道这是否可能在这里。
使用HttpAgilityPack。有人可能会说它被夸大了,但明天你会问我们如何转换 &code; 那些在文件中,第二天你会问别的东西。
使用它从文件中读取
using (StreamReader sr = new StreamReader("TestFile.html"))
{
String line = sr.ReadToEnd();
Console.WriteLine(line);
}
http://msdn.microsoft.com/en-us/library/db5x7c0d.aspx
这是从 url 读取的
WebClient client = new WebClient();
String htmlCode = client.DownloadString("http://test.com/file.html");