0

我不确定是否有人遇到过这个问题。

基本上我有一个大约 100,000 行的文本文档,我试图将它导入到一个带有单列的 SQLite 表中。

这样做之后,当我进行通用查询时SELECT * FROM table WHERE field LIKE "%something%",我意识到出现了不相关的结果。进一步挖掘,原因是原始文本文件中的某些行被连接成巨大的行条目。这给人一种错误结果的印象(这仅仅是由于巨大的行有匹配)。我只有 50,000 条奇数和 2 条LENGTH(field)超过 1,000,000 个字符的记录,而不是 100,000 条记录。

我首先想到的是特殊字符可能会搞砸事情,所以我strings FILE在 BASH 中做了一个。问题仍然存在。

所以,长话短说,有谁知道这个的原因(以及如何解决这个问题)?考虑到表格只有一个字段,我认为分隔符与此无关吗?

4

1 回答 1

0

我已将此问题追溯到为引用 csv 中的字符串而保留的不平衡双引号。所以如果我在一行上有一个开放的报价,它只会在找到下一个报价时才算作记录 - 这可能是很多行。

于 2013-06-07T12:45:51.110 回答