0

我从 Scopus 获得了一个逗号分隔的 csv 文件。文件的每一行都有这样的结构:

"A, B, C,D","1111;2222;3333;4444;","A,B,C",1111,"ABCDE","XYZ",,,"338","347",,,"11.10000/111-2-642-35236-2_34",Conference Paper,,Scopus,2-s2.0-1243213123

虽然它是逗号分隔的,但在某些字段(如第一个)中,当我使用pandas.DataFrame.from_csvpandas 无法区分分隔符逗号和非分隔符逗号时,存在内部逗号会引发错误。有什么方法可以将这样的 csv 文件加载到数据框中?

4

1 回答 1

0

如果分隔符是逗号,则:

df= pd.read_csv("file.csv", delimiter = ',' , header = None) 

空值被视为 NaN

         0                     1      2     3         ...                        13  14      15                 16
0  A, B, C,D  1111;2222;3333;4444;  A,B,C  1111        ...          Conference Paper NaN  Scopus  2-s2.0-1243213123

Pandas 会将逗号检测为分隔符,而无分隔符,如字符串“A、B、C、D”中的分隔符

于 2018-10-29T14:24:51.007 回答