1

我需要找到所有换行符的表示来规避 AzureML 的设计者造成的问题,如下所示:

By default (support_multi_line=False), all line breaks,
including those in quoted field values,
will be interpreted as a record break.

因此,这种设计选择通过夸大其记录并在我的管道中创建错误来破坏我的 DF。

我试过这个:

df.replace(to_replace=[r"\\t|\\n|\\r", "\t|\n|\r"], value=["", ""], regex=True, inplace=True)

但它不起作用——在我的 DF 中仍然可以找到换行符——我还应该寻找什么?

4

1 回答 1

2

df.replace()在数据框的所有行和列中搜索整个值,并将这些值替换为指定的值。它不会替换字符串的一部分。

您正在寻找df[column].str.replace

df[column] = df[column].str.replace('[\n|\r|\t]|\\\\[nrt]', '', regex=False)
于 2021-11-09T02:01:45.340 回答