我有一个包含大约 100000 篇文章的文本文件。文件结构为:
.文档 ID 42944-YEAR:5 .日期 03\08\11 .Cat 政治 文章内容1 .文档 ID 42945-YEAR:5 .日期 03\08\11 .Cat 政治 文章内容二
我想在 c# 中打开这个文件以逐行处理它。我试过这段代码:
String[] FileLines = File.ReadAllText(
TB_SourceFile.Text).Split(Environment.NewLine.ToCharArray());
但它说:
引发了“System.OutOfMemoryException”类型的异常。
问题是如何打开这个文件并逐行阅读。
- 文件大小:564 MB(591,886,626 字节)
- 文件编码:UTF-8
- 文件包含 Unicode 字符。