我正在使用 Super CSV 解析管道(“|”)分隔的文件。该文件不使用“文本限定符”或 Super CSV 所称的引号字符。问题是 Super CSV需要引号字符。我看不到跳过这个或提供空字符的方法。目前我正在传递一些希望永远不会出现在输入文件中的古怪 unicode 字符。
有没有办法让 Super CSV 在不使用引号字符的情况下解析文件?
我猜您无法控制要解析的文件的编写方式,并且它永远不会在数据中包含嵌入的管道字符?
我能看到的解决方案是:
使用永远不会出现在文件中的字符(如您所建议的那样)。这有点狡猾,但会起作用。
在构建 Reader 时提供您自己的 Tokenizer(您可以复制Super CSV 实现并删除引用功能)。
向我们发送功能请求,我们会考虑添加它。这可能只是添加另一个在解析时禁用引用的首选项的情况。
我会考虑一下,看看我是否能想到实现这一目标的最佳方法。
使用分隔符作为引号字符。例如:
CsvPreference cp = new CsvPreference('|'/*quote char*/,'|'/*delimiter char*/, "\n");