1

我是 Weka 的新手,在将包含 Tweets 的 CSV 文件转换为 Arff 文件时遇到问题。

CSV 看起来像这样

Tweet,Class
Conference Update: 50% Off Registration to End .. http://t.co/nZtkSzZnJ6,Yes

当我尝试使用资源管理器转换为 .arff 时,我收到以下错误“...未识别为 CSV 数据文件原因:值的数量错误。读取 1 预期 2,读取令牌 [EOF],第 2 行”

删除“%”字符允许文件无错误地转换为 arff。我可以删除“%”和其他字符,但我真的不想更改我的推文数据。用单引号或双引号括起来也无济于事。知道我做错了什么吗?

感谢任何帮助

4

1 回答 1

2

Weka 可以将“%”解释为注释的开头,并且可以忽略“%”和该行的其余部分。

请用引号将包含字符“%”的整个字段括起来(单引号“'”和双引号'"'都可以)。

例如:一个 csv 文件,其内容如下两行,Weka 可以将其转换为 Arff 文件。

推文,课程“会议更新:注册结束可享受 50% 的折扣 .. http://t.co/nZtkSzZnJ6 ”,是的

PS对不起,我之前的回答不正确。PRIVIOUS ANSWER(错误答案)是:尝试将“%”字符替换为“\%”。“\”用作转义字符,因此“\”使注释分隔符“%”变为普通字符“%”。

于 2014-06-25T02:45:05.407 回答