1

我正在尝试将 .xlsx 文件转换为 .xml 文件。.xlsx 文件的第一行(标题)将成为 xml 文件的标签。

我在下面编写了运行良好的代码-

 open(XML, ">temp.csv") or die "not able to open $!";

 use Spreadsheet::XLSX;
 my $excel = Spreadsheet::XLSX -> new ('test.xlsx');

 foreach my $sheet (@{$excel -> {Worksheet}}) {
         $sheet -> {MaxRow} ||= $sheet -> {MinRow};
         foreach my $row ($sheet -> {MinRow} .. $sheet -> {MaxRow}) {
                $sheet -> {MaxCol} ||= $sheet -> {MinCol};
                foreach my $col ($sheet -> {MinCol} ..  $sheet -> {MaxCol}) {
                        my $cell = $sheet -> {Cells} [$row] [$col];
                        if ($cell) {
                           print XML $cell -> {Val};
                        }
                        unless($col == $sheet -> {MaxCol}) {print XML ",";} 
                }
                unless( $row == $sheet -> {MaxRow}){print XML "\n";}
         }
  }
 close(XML);
 use XML::CSV; 
 my $csv_obj = XML::CSV->new(); 
    $csv_obj->parse_doc("temp.csv", {headings => 1});
    $csv_obj->print_xml("out.xml");

任何人都可以提出更好的代码(模块),因为我必须处理大型 .xlsx 文件。

提前致谢。

男人

4

3 回答 3

2

如果您的代码正常工作,那么您为什么需要更好的东西?如果只是为了速度,您需要找到一种方法来避免写入临时 .csv 文件。文件 IO 很慢,您正在写入,然后重新读取和重新解析。您能否不将数据读入散列,然后使用XML::SimpleCPAN 上的类似或任何其他 XML 模块将其转储到 XML 文件中?再次编写 CSV,重新读取、重新解析和写入 XML 会很慢!

于 2011-03-19T04:42:58.207 回答
1

您是否可以访问带有 excel 2007 或更高版本的 Windows 机器?然后你可以做类似的事情:

my $excel = Win32::OLE->new( 'Excel.Application' )
  or die "Could Not Start Excel.\n";
$excel->{ 'Visible' }           = 0;
$excel->{ DisplayAlerts }       = 0;

my $workbook = $excel->Workbooks->Open( 'test.xlsx' );

#save as Spreadsheet XML (46)
# 51 = xlsx, more mappings here: http://www.datapigtechnologies.com/downloads/Excel_Enumerations.txt
$workbook->SaveAs( $output_file, 46 );
$workbook->Close();
$excel->Quit();
于 2011-03-17T10:56:15.377 回答
0

github上有一个开发轻量级XLSX阅读器的项目。它目前处于某种 alpha 状态,但它确实有效。如果你喜欢,你可以试试。

于 2013-07-11T17:34:09.040 回答