-3

我有一个word文档。当我上传该文档时,我需要从中获取名称。我总是在第一行有名字,word文档中的数据是这样的,

Shanish K
shanish@gmail.com
.....
......

为此,我只是将 word 文件转换为 html,并从中尝试读取名称。一旦我转换了 word 文件,我style defenitions也得到了实际内容。我不知道如何仅获取first row. 有谁可以帮我离开这里吗。提前致谢...

注意:-我在调试时注意到一些事情,实际内容在段落标记之间,例如<p .....>Shanish</p> .....,是否可以在第一个标记之间获取数据<p></p>

4

1 回答 1

3

是的,您可以使用HTMLAgilityPackFizzlerExCSQuery

我会使用 FizzlerEx。加载文档并选择第一个匹配的 p 元素。

using HtmlAgilityPack;
using Fizzler.Systems.HtmlAgilityPack;

var web = new HtmlWeb();
var document = web.Load("http://example.com/page.html")
var page = document.DocumentNode;

var name = page.QuerySelector("p:eq(0)");
于 2013-05-20T05:38:08.020 回答