我尝试使用 Flair https://github.com/flairNLP/flair对印度尼西亚语中的句子列表进行 POS 标记
结果是一个list
,名字是pos
:
['Sejarah <NOUN> perkembangan <NOUN> ilmu <NOUN> ekonomi <NOUN> Adam <PROPN> Smith <PROPN> sering <ADV> disebut <VERB> sebagai <ADP> yang <PRON> pertama <NUM> mengembangkan <VERB> ilmu <NOUN> ekonomi <NOUN> pada <ADP> abad <NOUN> 18 <NUM> sebagai <ADP> satu <DET> cabang <NOUN> tersiri <NOUN> dalam <ADP> ilmu <NOUN> pengetahuan <NOUN>', 'Melalui <ADP> karya <NOUN> besarnya <NOUN> General <PROPN> Theory <PROPN> Employment <PROPN> Interest <PROPN> and <PROPN> Money <PROPN> yang <PRON> menyatakan <VERB> bahwa <SCONJ> pasar <NOUN> tidak <PART> selalu <ADV> mampu <ADV> menciptakan <VERB> keseimbangan <NOUN> dan <CCONJ> karena <SCONJ> itu <DET> intervensi <NOUN> pemerintah <NOUN> harus <ADV> dilakukan <VERB> agar <SCONJ> distribusi <NOUN> ber <VERB> daya <NOUN> mencapai <VERB> sasarannya <NOUN>']
我想将该列表转换为数据框,如下所示:
Text Label
0 Sejarah NOUN
1 perkembangan NOUN
2 ilmu NOUN
3 ekonomi NOUN
4 Adam PROPN
5 Smith PROPN
6 sering ADV
7 disebut VERB
8 sebagai ADP
9 yang PRON
10 pertama NUM
... ... ...
... ... ...
我努力了:
df = pd.DataFrame(pos, columns=['Text', 'Label'])
但我得到了这个错误:
ValueError: Shape of passed values is (6921, 1), indices imply (6921, 2)
我的代码有什么问题?