问题标签 [universal-pos-tag]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用带有 nltk.pos_tag() 函数的通用 POS 标签?
我有一个文本,我想找到“ADJs”、“PRONs”、“VERBs”、“NOUNs”等的数量。我知道有.pos_tag()
功能,但它给了我不同的结果,我想得到“ADJs”的结果','代词','动词','名词'。这是我的代码:
上面的代码有效,但我想找到一种方法来获取这种类型的标签:
我看到这里有一章:https ://www.nltk.org/book/ch05.html
说的是:
但我不知道如何将其应用于我的例句。谢谢你的帮助。
python - 如何使用 conllu 库创建 TokenList?
我正在尝试使用 conllu 库创建一个 CoNLL-U 文件,作为我正在处理的通用依赖标记项目的一部分。
我在 python 列表中有很多句子。这些包含令牌、词条、POS 标签、特征等的子列表。例如:
我想自动化将这些转换为 CoNLL-U 解析句子的过程,所以我编写了以下函数:
当我尝试运行此代码时,出现以下错误:
问题是我正在尝试创建一个普通列表并在其serialize()
上运行该方法。TokenList
当parse()
函数在 CoNLL-U 文件格式的字符串上运行时,我不知道如何创建库创建的类型。
当您尝试打印该类型的列表时,您会得到以下输出:
在这种类型的列表上运行该serialize()
方法会将其重新转换为 CoNLL-U 格式字符串data
,如上例所示。但是,当您尝试在普通的 python 列表上运行它时,它会中断。
如何创建一个TokenList
这样的而不是普通的 python 列表对象?