我有一个包含四列的 Excel(可能是 2010 或 2013,不知道以后会不会出现问题)文档。前三列存储电话号码,它们基本上是一个包含 10 个或更多字符的字符串。仅四列将永远存储 1、2、3 或 4,它是一个类别。我需要检查A列中的每个数字是否出现在B列和C列中,所以我认为读取每列的所有 Excel 单元格并存储在一个列表中(尚未实现,因为我将在下面解释这个问题) . 为此,我制作了以下代码:
private void btnCargarExcel_Click(object sender, EventArgs e)
{
if (this.openFileDialog1.ShowDialog() == DialogResult.OK)
{
if (System.IO.File.Exists(openFileDialog1.FileName))
{
filePath.Text = openFileDialog1.FileName.ToString();
Excel.Application xlApp;
Excel.Workbook xlWorkBook;
Excel.Worksheet xlWorkSheet;
Excel.Range range;
string str;
int rCnt = 0;
xlApp = new Microsoft.Office.Interop.Excel.Application();
xlWorkBook = xlApp.Workbooks.Open(openFileDialog1.FileName, 0, true, 5, "", "", true, Microsoft.Office.Interop.Excel.XlPlatform.xlWindows, "\t", false, false, 0, true, 1, 0);
xlWorkSheet = (Excel.Worksheet)xlWorkBook.Worksheets.get_Item(1);
range = xlWorkSheet.UsedRange;
for (rCnt = 1; rCnt <= range.Rows.Count; rCnt++)
{
str = (range.Cells[rCnt, 1] as Excel.Range).Value2.ToString();
//bd.Add(cleanString(str));
bd.Add(cleanString(str, 10));
}
for (rCnt = 1; rCnt <= range.Rows.Count; rCnt++)
{
str = (range.Cells[rCnt, 2] as Excel.Range).Value2.ToString();
//bd.Add(cleanString(str));
bl.Add(cleanString(str, 10));
}
for (rCnt = 1; rCnt <= range.Rows.Count; rCnt++)
{
str = (range.Cells[rCnt, 3] as Excel.Range).Value2.ToString();
//bd.Add(cleanString(str));
cm.Add(cleanString(str, 10));
}
nrosProcesados.Text = bd.Count().ToString();
listBox1.DataSource = bd;
noProcesadosBL.Text = bl.Count().ToString();
listBox2.DataSource = bl;
noProcesadosCM.Text = cm.Count().ToString();
listBox3.DataSource = cm;
xlWorkBook.Close(true, null, null);
xlApp.Quit();
releaseObject(xlWorkSheet);
releaseObject(xlWorkBook);
releaseObject(xlApp);
}
else
{
MessageBox.Show("No se pudo abrir el fichero!");
System.Runtime.InteropServices.Marshal.ReleaseComObject(appExcel);
appExcel = null;
System.Windows.Forms.Application.Exit();
}
}
}
因此,我在列中迭代槽单元格,并在进行一些字符串更改后将每个数字存储在列表中,正如您在代码中看到的那样。这里的问题是A列有797340个单元格,B列有91617个单元格,C列有95891个单元格,所以如果我运行应用程序,加载Excel并等待我的PC挂出(即使有12GB的RAM和Core i3处理器)我需要打开任务管理器并结束任务。为了得到我想要的东西(只留下不重复的数字)而不是挂出我的电脑,最好的解决方案是什么?每个周期都可以将事情分成单独的线程(我对此不太了解,因为我是从 C# 开始的,所以任何帮助都将不胜感激)?你对这个话题有什么看法?
编辑:添加一个新的干净的方法
因此,在阅读并阅读并从这里的一些成员那里获得帮助后,我对代码进行了一些改进,但现在我遇到了另一个问题(在代码下方注释)。现在看代码:
// this goes first when I declare vars
public static System.Array objRowAValues;
// this goes in action when I click the button (I leave only relevant part)
Excel.Application xlApp;
Excel.Workbook xlWorkBook;
Excel.Worksheet xlWorkSheet;
Excel.Range range, rngARowLast;
string str;
int rCnt = 0;
long lastACell, fullRow;
xlApp = new Microsoft.Office.Interop.Excel.Application();
xlWorkBook = xlApp.Workbooks.Open(openFileDialog1.FileName, 0, true, 5, "", "", true, Microsoft.Office.Interop.Excel.XlPlatform.xlWindows, "\t", false, false, 0, true, 1, 0);
xlWorkSheet = (Excel.Worksheet) xlWorkBook.Worksheets.get_Item(1);
range = xlWorkSheet.UsedRange;
fullRow = xlWorkSheet.Rows.Count;
lastACell = xlWorkSheet.Cells[fullRow, 1].End(Excel.XlDirection.xlUp).Row;
rngARowLast = xlWorkSheet.get_Range("A1", "A" + lastACell);
objRowAValues = (System.Array) rngARowLast.Cells.Value;
现在因为我将用来自 objRowAValues 的值填充 ListBox,而 ListBox 只接受 List 作为 DataSource,所以我需要将 objRowAValues 转换为字符串列表。我试试这个,但它不适合我。有什么帮助吗?