-1

我正在使用一堆包含 3 到 14 列的 Excel 电子表格:

  • 有些真的只有3列
  • 有些有许多隐藏列(例如:隐藏 5 列,可见 9 列)
  • 其余的都是完整的(所有数据,没有隐藏的列等),最多 14 列

幸运的是,在所有情况下,我只需要该数据的一个子集,它们都包含我需要的内容。我最初的想法是阅读 Excel 文档并将内容作为对象返回,但我很难概念化一个适用于具有不同列的 Excel 文档的过程。

下面的代码显示了这两个示例,而在现实世界中我只会使用一个。

Function Get-ExcelContent
    {
        [CmdletBinding()]
        Param
            (
            [Parameter(Mandatory=$false)]
            [string]$ExcelFile,
            [Parameter(Mandatory=$false)]
            [string]$SheetName,
            [alias('Visible')]
            [switch]$VisibleFieldsOnly
        )


        If(!(Test-Path -Path $ExcelFile -PathType Leaf))
            {
                write-host "Unable to find excel file: $ExcelFile"
                break
            }

        # for 64-bit os'
        $strProvider = "Provider=Microsoft.ACE.OLEDB.12.0"
        # otherwise 32-bit os
        #$strProvider = "Provider=Microsoft.Jet.OLEDB.4.0"

        $strDataSource = "Data Source = $ExcelFile"
        $strExtend = "Extended Properties=Excel 8.0"
        $strQuery = "Select * from [$SheetName]"
        $objConn = New-Object System.Data.OleDb.OleDbConnection("$strProvider;$strDataSource;$strExtend")
        $sqlCommand = New-Object System.Data.OleDb.OleDbCommand($strQuery)
        $sqlCommand.Connection = $objConn
        $objConn.open()
        $DataReader = $sqlCommand.ExecuteReader()

        If($VisibleFieldsOnly)
            {
                # Get count of the non-hidden fields
                $CountOfColumns = $DataReader.VisibleFieldCount
            }
        Else
            {
                # Get all the fields
                $CountOfColumns = $DataReader.FieldCount
            }

        $ColumnCounter = 0
        $pscoExcelData = @()

        While($DataReader.read())
            {
                ###########################################################
                # IF I KNOW THE COUNT OF COLUMNS AHEAD OF TIME, THIS WORKS
                ###########################################################
                $pscoExcelData += [pscustomobject][ordered] @{
                    $DataReader.GetName(0) = $DataReader[0].Tostring()
                    $DataReader.GetName(1) = $DataReader[1].Tostring()
                    $DataReader.GetName(2) = $DataReader[2].Tostring()
                    $DataReader.GetName(3) = $DataReader[3].Tostring()
                    $DataReader.GetName(4) = $DataReader[4].Tostring()
                    $DataReader.GetName(5) = $DataReader[5].Tostring()
                    $DataReader.GetName(6) = $DataReader[6].Tostring()
                    $DataReader.GetName(7) = $DataReader[7].Tostring()
                    $DataReader.GetName(8) = $DataReader[8].Tostring()
                }
                ###########################################################
                # BUT HOW DO I DO IT WHEN THE COLUMN COUNT VARIES?
                ###########################################################
                for($i=0; $i -le $CountOfColumns-1;$i++)
                {
                      $pscoExcelData += [pscustomobject][ordered] @{ $DataReader.GetName($i) = $DataReader[$i].Tostring() }
                }
            }

        $dataReader.close()
        $objConn.close()

        $pscoExcelData
    }

Get-ExcelData 'C:\path\to\Book1.xlsx' 'Sheet1$' -VisibleFieldsOnly
4

1 回答 1

0

您只需在循环中创建哈希表,然后在最后将其转换为 PowerShell 对象。类似于以下内容(未测试):

$rec = @{}
for($i=0; $i -lt $CountOfColumns; $i++)
{
    $rec[$DataReader.GetName($i)] = $DataReader[$i].Tostring()
}
$pscoExcelData += [pscustomobject][ordered]$rec

编辑:应该保留列顺序的另一种可能性(也未测试):

$rec = New-Object pscustomobject
for($i=0; $i -lt $CountOfColumns; $i++)
{
    $rec | Add-Member -Name $DataReader.GetName($i) -Value $DataReader[$i].Tostring()
}
$pscoExcelData += $rec

(顺便说一句,通常使用-lt而不是-le在 for 循环中。)

于 2015-09-21T02:22:33.343 回答