我有一个包含 2 列的 pandas 数据框,我想在其中之一中sklearn TfidfVectorizer
用于文本分类。但是,此列是列表列表,并且 TFIDF 想要将原始输入作为文本。在这个问题中,如果我们只有一个列表列表,他们提供了一个解决方案,但我想问一下如何在我的数据框的每一行中应用这个函数,哪一行包含一个列表列表。先感谢您。
Input:
0 [[this, is, the], [first, row], [of, dataframe]]
1 [[that, is, the], [second], [row, of, dataframe]]
2 [[etc], [etc, etc]]
想要的输出:
0 ['this is the', 'first row', 'of dataframe']
1 ['that is the', 'second', 'row of dataframe']
2 ['etc', 'etc etc']