0

在此处输入图像描述

我正在尝试训练一个 ML 模型来根据电影标题预测书籍类型,但由于每部电影都混合了类型,因此我的模型的准确性非常低,因为它无法正确匹配类型。我只想保留出现在“流派”列中的第一个流派。我怎样才能实现它?我试过了

df['Genre'].split(',')[0]

但这似乎不起作用。

4

3 回答 3

2
df['Top_Genre'] = df['Genre'].str.split(pat = ",", expand=True)[0]
于 2020-05-12T11:34:17.623 回答
1
df['Genre'] = [ data.split(',')[0] for data in df['Genre']]

我希望这可以帮助你

于 2020-05-12T11:26:54.770 回答
0

您可以编写一个函数来执行此操作,前提是 Genre 列有一个 Genres 字符串

def get_first_genre(x):
    return x.Genre.split(',')[0]

df["firstGenre"] = df.apply(get_first_genre, axis=1)
于 2020-05-12T11:30:01.623 回答