我有一个word文档(2003)。我正在使用 Powershell 来解析文档的内容。该文档在顶部包含几行文本,十几个具有不同列数的表格,然后是更多文本。
我希望能够像下面这样阅读文档:
- 阅读文件(制作必要的物品等)
- 获取每一行文本
- 如果不是表格的一部分,则作为文本处理并写入输出
- 别的
- 如果表的一部分
- 获取表号(按顺序)并根据列解析输出
- 万一
下面是我已经开始写的powershell脚本:
$objWord = New-Object -Com Word.Application
$objWord.Visible = $false
$objDocument = $objWord.Documents.Open($filename)
$paras = $objDocument.Paragraphs
foreach ($para in $paras)
{
Write-Output $para.Range.Text
}
我不确定 Paragraphs 是否是我想要的。有什么更适合我的目的吗?我现在得到的只是文档的全部内容。我如何控制我得到的东西。就像我想得到一条线一样,能够确定它是否是表格的一部分,并根据它是什么数字表格采取行动。