所以我有一个从第 3 方生成的 HTML 文件,它每天都会通过电子邮件发送给我(和我的小组)。它包含一个 ID 号、姓名和多个电子邮件地址(如果适用)的表格。它用于更新 AD 中的组成员身份,我希望能够在 powershell 中执行此操作,因为组成员身份更新部分很容易。解析 HTML 文件以提取电子邮件地址(也是他们的 AD 用户名)是困难的部分。我有点在树桩上。我尝试过使用 HTMLAgilityParser,它似乎对我的目的没有那么好。如果我能以某种方式将数据放入 .CSV 以方便使用,那就太好了。
我需要的是 A) 直接从 HTML 中提取电子邮件地址并将它们放在 CSV 文件中或 B) 将 HTML 文件转换为要解析的 .CSV。
原因是这些数据每天都会出现,因此必须自动化。
谢谢!
来自 html 文件的示例,所有识别信息已被删除和/或调整:
<table>
<tr>
<td class=xl27>
<span class=font7>ID</span>
</td>
<td class=xl27>
<span class=font7>Name</span>
</td>
<td class=xl27>
<span class=font7>Primary E-Mail</span>
</td>
<td class=xl27>
<span class=font7>Alternate E-Mail</span>
</td>
</tr>
<tr>
<td class=xl28>
<span class=font8>00000000</span>
</td>
<td class=xl28>
<span class=font8>Smith,John R</span>
</td>
<td class=xl28>
<span class=font8></span>
</td>
<td class=xl28>
<span class=font8>John_Smith@addr</span>
</td>
</tr>