0

我有一个有 20,000 行和 4 列的 pandas df(“原始”)。

由于我的 cols 有两个类别,因此我创建了两个列表,每个类别一个:

financial_news = [["finance.com", "money.com", "coin.com", "dollars.com"]]

general_news = [["bbc.com", "news.com", "breaking.com", "times.com", "abcnews.com"]]

我的目标是遍历原始 df 并检查列表中的每个元素,然后将其附加到新的 df 中。如果在原始 df 中找到列表中的元素,我想将该行添加到另一个数据框中。这意味着如果执行 2 次,我会将所有 20,000 行数据放入各自的类别中。如果这可以在一个带有列表的函数中完成,那就更好了!

这是我尝试过的逻辑,但出现列表类型错误:

for word in financial_news:
    if original_df[original_df["Domain"].str.contains(word)]: #check if word is in original df 
        financial_news_df.append(word) #Get row into other df  

我希望这是有道理的,有人可以提供帮助!

4

0 回答 0