问题标签 [universal-pos-tag]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2105 浏览

python - 如何使用带有 nltk.pos_tag() 函数的通用 POS 标签?

我有一个文本,我想找到“ADJs”、“PRONs”、“VERBs”、“NOUNs”等的数量。我知道有.pos_tag()功能,但它给了我不同的结果,我想得到“ADJs”的结果','代词','动词','名词'。这是我的代码:

上面的代码有效,但我想找到一种方法来获取这种类型的标签:

我看到这里有一章:https ://www.nltk.org/book/ch05.html

说的是:

但我不知道如何将其应用于我的例句。谢谢你的帮助。

0 投票
1 回答
1001 浏览

python - 如何使用 conllu 库创建 TokenList?

我正在尝试使用 conllu 库创建一个 CoNLL-U 文件,作为我正在处理的通用依赖标记项目的一部分。

我在 python 列表中有很多句子。这些包含令牌、词条、POS 标签、特征等的子列表。例如:

我想自动化将这些转换为 CoNLL-U 解析句子的过程,所以我编写了以下函数:

当我尝试运行此代码时,出现以下错误:

问题是我正在尝试创建一个普通列表并在其serialize()上运行该方法。TokenListparse()函数在 CoNLL-U 文件格式的字符串上运行时,我不知道如何创建库创建的类型。

当您尝试打印该类型的列表时,您会得到以下输出:

在这种类型的列表上运行该serialize()方法会将其重新转换为 CoNLL-U 格式字符串data,如上例所示。但是,当您尝试在普通的 python 列表上运行它时,它会中断。

如何创建一个TokenList这样的而不是普通的 python 列表对象?