我有一个有 20,000 行和 4 列的 pandas df(“原始”)。
由于我的 cols 有两个类别,因此我创建了两个列表,每个类别一个:
financial_news = [["finance.com", "money.com", "coin.com", "dollars.com"]]
general_news = [["bbc.com", "news.com", "breaking.com", "times.com", "abcnews.com"]]
我的目标是遍历原始 df 并检查列表中的每个元素,然后将其附加到新的 df 中。如果在原始 df 中找到列表中的元素,我想将该行添加到另一个数据框中。这意味着如果执行 2 次,我会将所有 20,000 行数据放入各自的类别中。如果这可以在一个带有列表的函数中完成,那就更好了!
这是我尝试过的逻辑,但出现列表类型错误:
for word in financial_news:
if original_df[original_df["Domain"].str.contains(word)]: #check if word is in original df
financial_news_df.append(word) #Get row into other df
我希望这是有道理的,有人可以提供帮助!