我正在尝试从我从网上抓取的 .txt 文件中的字符行中提取日期;日期总是在同一行,后面跟着相同的 HTML,但是日期本身会随着每个文本而变化。下面演示了来自两个 .txt 文件的代码的两个示例。
"17" <div align=\\center\\><br /><font face=\\Times New Roman\\ size=\\3\\><b>Tuesday, 3 February 2009</b></font>
"17" "<div align=\"center\"><br /><font face=\"Times New Roman\" size=\"3\"><b>Tuesday, 10 February 2009</b></font>"
xpathSApply() 不起作用,因为我将它们作为 .txt 文件作为字符读取到 R 中;关于如何最好地提取它的任何想法?谢谢!