-1

好的,首先我想指出我知道使用逗号或制表符等解析 .csv 文件。但是我仍然遇到问题,我有点卡住了。

我要做的是构建一个读取 .csv 调查答案文件的应用程序(最好是所有扩展类型,但让我们从一个开始)。这些调查答案文件是由其他网站预先生成的。(即用户从调查网站下载他们的调查答案,然后使用我的应用程序)。该应用程序的目的是对数据进行统计分析。

所以我遇到的问题是弄清楚如何阅读并将问题 - 从答案 - 与不相关的文本分开。对于具有不同问题类型等的多个答案文件,我需要一种可重用的方法。

我知道一个更简单的方法是让用户使用我的应用程序创建一个调查,然后对其进行分析,这样我就可以控制格式,但目前这不是一个选项。

注意:我计划将所有变量读入系统,然后允许用户从列表中选择变量并对其执行分析算法。

我再次知道他们是高级 csv 阅读器,我只是在寻找有关如何解决我的问题的想法。

4

3 回答 3

1

use Microsoft.VisualBasic.FileIO.TextFieldParser

it is specifically designed to parse .csv files. it handles commas in fields too.

于 2011-06-29T18:09:45.267 回答
0

文件的第一行(CSV(分隔符是逗号)或 TSV(分隔符是制表符))是否包含“列”名称?所有行是否具有相同数量的值(如有必要,连续分隔符指定缺失值或空值)?

如果两个问题的答案都是肯定的,那么一种选择是使用带有 JET 4.0 驱动程序的 ADO 来读取每个文件作为关系数据源。

有大量示例可以演示该技术。从这里开始

于 2011-06-29T18:42:58.547 回答
0

对于解析 CSV,您可以使用我在我的解决方案中描述的正则表达式。这将被逐行评估。

于 2011-06-29T17:44:28.750 回答