2

如何将 RFC4180 标准的 CSV 文件读入 SPSS?具体来说,如何处理嵌入了双引号的字符串值(正确地)用第二个双引号转义?

这是一个值有问题的记录的实例:

2985909844,,3,3,3,3,3,3,1,2,2,"I recall an ad for ""RackSpace"", but I don't recall if this was here or in another page.",200,1,1,1,0,1,0,Often

我使用的 SPSS 语法如下:

GET DATA
  /TYPE=TXT
  /FILE="/Users/pieter/Work/Stackoverflow/2013_StackOverflowRecoded.csv"
  /IMPORTCASE=ALL
  /ARRANGEMENT=DELIMITED
  /DELCASE=LINE
  /FIRSTCASE=2
  /DELIMITERS=","
  /QUALIFIER='"'
  /VARIABLES=  ... list of column names...

导入成功,但在遇到此类值后偏离轨道并引发警告。

4

2 回答 2

2

恐怕这是 SPSS 中的一个错误,因此无法解决。

如果您觉得有帮助,您可能想向 IBM 支持团队询问此问题并在此处发布他们的答案。

一种解决方法是将 *.csv 文件中的转义双引号更改为其他引号类型。如果您在类似 UNIX 的操作系统上使用高级文本编辑器(例如 notepad++)或“sed”命令行工具,这应该只是很少的工作。

于 2014-08-05T16:54:05.453 回答
1

在当前版本的 Statistics (22) 中尝试示例双标识符处理正确,但是,如果您使用文本向导生成语法,则生成的语法中的字段太短,因此您需要增加宽度。

于 2014-08-06T15:20:39.277 回答