0

我正在尝试上传一个 excel 表并将其保存为文本文件,然后从该文本文件中读取。我的一个朋友在他的应用程序中实现了这样的功能,并且运行良好。我只是复制了他的代码,但它不能正常工作。它将 excel 工作表保存为文本文件,但是当我打开文本文件时,我发现数据已损坏,并且有很多 Unicode 或奇怪的符号以及许多不必要的行,例如:

          ;          þÿÿÿ    þÿÿÿ    :  

ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ

ASP.NET 代码:

<asp:FileUpload ID="Upload" runat="server" />
<asp:Button ID="btn_upload" runat="server" Text="Upload" OnClick="UploadButton_Click" />
<asp:Label ID="Label1" runat="server" />

C#代码:

protected void UploadButton_Click(object sender, EventArgs e)
    {
        if (Upload.HasFile)
        {
            try
            {
                Upload.SaveAs(Server.MapPath("~/Files/Test_" + DateTime.Now.Year + "_" + DateTime.Now.Month + ".txt"));
                LabelUpload.Text = "Upload File Name: " + Upload.PostedFile.FileName + "<br>" + "Type: " + Upload.PostedFile.ContentType + " File Size: " + Upload.PostedFile.ContentLength + " kb<br>";

                string filename = Server.MapPath("~/Files/Test_" + DateTime.Now.Year + "_" + DateTime.Now.Month + ".txt");
                if (System.IO.File.Exists(filename))
                {
                    LabelUpload.Text = LabelUpload.Text + "Uploaded Successfully";
                }
            }
            catch (Exception ex)
            {
                Label1.Text = "Error: " + ex.Message.ToString();
            }
        }

        else
        {
            LabelUpload.Text = "Please select a file to upload.";

        }
    }

我正在使用带有 C# 的 ASP.NET 4,所以你能告诉我应该怎样才能将 Excel 工作表保存为 txt 文件然后从中读取吗?

4

2 回答 2

5

为了在文本编辑器中读取 Excel 文件,必须将其转换为 CSV 文件格式。这是因为 .xlsx Excel 文档 (2007+) 是复杂的 XML 层次结构。如果您想了解 .xlsx 文件的真正组成部分,请将其扩展名更改为 .zip,然后解压缩。

因此,您不能简单地将 .xlsx 文件的扩展名更改为 .txt 或 .csv 并期望它在文本编辑器中可读。您必须从一开始就以这种格式保存文件。

在 Excel 中,将电子表格另存为 .csv 而不是 .xlsx,然后您可以立即在文本编辑器中打开它!如果您真的愿意,您甚至可以将扩展名更改为 .txt。

如果您不告诉 Excel 将自身保存为纯文本而不是其正常的 XML 结构,那么这些都不会起作用。

如果您坚持支持 .xlsx 文件,有一种方法。Office XML 文件格式是一种开放的公共格式,您可以随意操作它。

您将需要:

  1. 下载 Open XML SDK

  2. 仔细阅读文档

在您的情况下,您可能想要访问特定的单元格值,读取它们的内容,然后将它们流式传输到一个新文件中。

上述文档提供了以下代码片段,用于访问 Excel 文档中的单元格值:

public static string XLGetCellValue(string fileName, string sheetName, string addressName)
{
   const string worksheetSchema = "http://schemas.openxmlformats.org/spreadsheetml/2006/main";
   const string sharedStringSchema = "http://schemas.openxmlformats.org/spreadsheetml/2006/main";

   string cellValue = null;

   //  Retrieve the stream containing the requested
   //  worksheet's info.
   using (SpreadsheetDocument xlDoc = SpreadsheetDocument.Open(fileName, false))
   {
      //  Get the main document part (workbook.xml).
      XmlDocument doc = new XmlDocument();
      doc.Load(xlDoc.WorkbookPart.GetStream());

      //  Create a namespace manager, so you can search.
      //  Add a prefix (d) for the default namespace.
      NameTable nt = new NameTable();
      XmlNamespaceManager nsManager = new XmlNamespaceManager(nt);
      nsManager.AddNamespace("d", worksheetSchema);
      nsManager.AddNamespace("s", sharedStringSchema);

      string searchString = string.Format("//d:sheet[@name='{0}']", sheetName);
      XmlNode sheetNode = doc.SelectSingleNode(searchString, nsManager);
      if (sheetNode != null)
      {
         //  Get the relId attribute.
          XmlAttribute relationAttribute = sheetNode.Attributes["r:id"];
         if (relationAttribute != null)
         {
            string relId = relationAttribute.Value;
            //  Load the contents of the workbook.
            XmlDocument sheetDoc = new XmlDocument(nt);
            sheetDoc.Load(xlDoc.WorkbookPart.GetPartById(relId).GetStream());

            XmlNode cellNode = sheetDoc.SelectSingleNode(string.Format("//d:sheetData/d:row/d:c[@r='{0}']", addressName), nsManager);
            if (cellNode != null)
            {
               XmlAttribute typeAttr = cellNode.Attributes["t"];
               string cellType = string.Empty;
               if (typeAttr != null)
               {
                  cellType = typeAttr.Value;
               }

               XmlNode valueNode = cellNode.SelectSingleNode("d:v", nsManager);
               if (valueNode != null)
               {
                  cellValue = valueNode.InnerText;
               }
               if (cellType == "b")
               {
                  if (cellValue == "1")
                  {
                     cellValue = "TRUE";
                  }
                  else
                  {
                     cellValue = "FALSE";
                  }
               }
               else if (cellType == "s")
               {
                   if (xlDoc.WorkbookPart.SharedStringTablePart != null)
                   {
                      XmlDocument stringDoc = new XmlDocument(nt);
                      stringDoc.Load(xlDoc.WorkbookPart.SharedStringTablePart.GetStream());
                      //  Add the string schema to the namespace manager.
                      nsManager.AddNamespace("s", sharedStringSchema);

                      int requestedString = Convert.ToInt32(cellValue);
                      string strSearch = string.Format("//s:sst/s:si[{0}]", requestedString + 1);
                      XmlNode stringNode = stringDoc.SelectSingleNode(strSearch, nsManager);
                      if (stringNode != null)
                      {
                          cellValue = stringNode.InnerText;
                      }
                   }
                }
            }
         }
       }
   }
   return cellValue;
}

从那里,您可以对单元格值做任何您喜欢的事情 =)

于 2013-07-03T18:48:48.680 回答
2

Excel 文件不能保存为文本格式,需要使用.csv扩展名而不是 xlsx 或 xls,并将其另存为.txt.

于 2013-07-03T18:37:52.570 回答