问题标签 [treetagger]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Treetag 包 koRpus R
首先,对不起我的英语,我的英语说得很糟糕。
所以,我有一个关于 R 上 koRpus 包中的 treetag 函数的问题。我想对文本进行词形还原,使用 Treetagger 对我来说没问题。我使用了treetag函数:
我获得了令牌,标签...
但是在此 Lemmatization 之后,我想获得标记的文本,但我没有解决方案来做到这一点。我想在我的文本中用他的引理替换每个标记。
那么,你有我的解决方案吗?
非常感谢 !
python - 将 TreeTagger 与 Python 一起使用:找不到 Treetagger bin
我正在尝试将 TreeTagger 与 Python 一起使用。我按照以下步骤进行安装: treetagger-python miotto
当我在命令提示符下使用 TreeTagger 时效果很好,但是当我尝试从 Python 启动它时,这就是我所拥有的:
Traceback (most recent call last):
File "C:/Users/Marine/PycharmProjects/treetag/treetagtest.py", line 4, in <module>
NLTK was unable to find the TreeTagger bin!
pprint(tt_fr.tag(u'Mon Dieu, faites que ça marche!'))
File "C:\Users\Marine\Anaconda3\lib\site-packages\treetagger.py", line 117, in tag
p = Popen([self._treetagger_bin],
AttributeError: 'TreeTagger' object has no attribute '_treetagger_bin'
这是 treetagger.py 文件:
我想我的配置有问题,但我不知道是什么。我在 Windows 中工作,也许这与 treetagger_paths 变量中的路径格式有关?我的 bin 文件在这里: C:\treetagger\bin ,所以我添加了这个路径是 treetagger_paths 变量。
谢谢 !
python - Python - 错误:无法创建“treetagger.egg-info”:权限被拒绝
我尝试使用以下命令安装 python 模块(treetager-python):
尝试此操作时,我收到错误消息:
我阅读了有关使用 flag 的信息--user
,但这根本不起作用:
我知道使用sudo
可能会解决这个问题,但我不喜欢使用 root 权限执行 3rd 方文件/代码。
那么有什么方法可以在不使用' sudo
'的情况下解决这个问题?
我试过这个Mac OS
,如果我需要任何其他信息,请告诉我。
提前致谢!
解决方案:
所以答案表明问题是源文件夹中的权限问题。当我下载这个文件所有者被设置为“root”时,使用改变所有者chown
解决了这个问题。感谢您的快速帮助!
nlp - UIMA Ruta 使用 DKProCore 词性标注器运行错误(德语小说教程)
一步一步地按照关于 UIMA Ruta for German Novels 的本教程进行操作时,我在运行 Main.ruta 时收到以下错误:
我已经验证了我的 TREETAGGER_HOME 的位置,它是在我的环境变量和 Eclipse 中设置的。我还考虑使用更新的树标记器版本,发现以下错误:
1.7.0 严重:发生异常 org.apache.uima.analysis_engine.AnalysisEngineProcessException:注释器处理失败。(...) 引起:java.lang.ClassNotFoundException: de.tudarmstadt.ukp.dkpro.core.api.parameter.Messages at java.net.URLClassLoader.findClass(Unknown Source) at java.lang.ClassLoader.loadClass( Unknown Source) at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source) at java.lang.ClassLoader.loadClass(Unknown Source) ... 43 更多
1.8.0 严重:发生异常 org.apache.uima.analysis_engine.AnalysisEngineProcessException:“不支持的语言 [de]。” 在 de.tudarmstadt.uk (...) 引起:java.io.IOException:无法加载资源 [classpath:/de/tudarmstadt/ukp/dkpro/core/treetagger/lib/tagger-de-le.properties] : FileNotFoundException: 在 [classpath:/de/tudarmstadt/ukp/dkpro/core/treetagger/lib/tagger-de-le.properties] 找不到文件
在最后一次尝试中看到错误后,我再次检查了必要格式下存在的德语语言参数。关于如何解决这个问题的任何建议?
r - koRpus 包在 macOS 上使用 R (RStudio) 中的 TreeTagger
我正在探索 macOS 上 R 中的 koRpus 包,试图在以下对象上使用treetag函数:
文字 [1] “因为我不能为死亡停下来-” “他好心为我停下来-”
[3] “马车停着,但只有我们自己-” “和不朽”
使用以下语法
> tagged.text <- treetag(as.vector(paste(text, collapse = '')), format = "obj", debug = TRUE)
我收到以下错误
矩阵中的错误(unlist(strsplit(tagged.text,“\t”)),ncol = 3,byrow = TRUE,:“数据”必须是向量类型,为“NULL”
当我在其等效项上尝试上面的加粗命令时,我得到了这个
matrix(unlist(strsplit(paste(text, collapse = ''), "\t"))) [,1] [1,] "因为我无法为死神停下来-他好心地为我停下来-马车举行了,但是只有我们自己——和不朽”
我的工作空间如下
sessionInfo() R 版本 3.4.2 (2017-09-28) 平台:x86_64-apple-darwin15.6.0 (64-bit) 运行于:macOS High Sierra 10.13.1
矩阵产品:默认 BLAS:/System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib LAPACK:/Library/Frameworks/R.framework/Versions/3.4/Resources /lib/libRlapack.dylib
语言环境:[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
附加的基础包:[1] stats graphics grDevices utils
datasets methods base其他附加软件包:[1] quanteda_0.99.12 koRpus_0.10-2
data.table_1.10.4-3 scales_0.5.0 [5] purrr_0.2.4
readr_1.1.1 tidyr_0.7.2 tibble_1.3.4 [9] tidyverse_1.1.1 gutenbergr_0.1.3 ggplot2_2 .2.1
stringr_1.2.0 [13] dplyr_0.7.4 janeaustenr_0.1.5
tidytext_0.1.4通过命名空间加载(未附加):[1] reshape2_1.4.2
Have_1.1.0 lattice_0.20-35 colorspace_1.3-2 [5] htmltools_0.3.6 SnowballC_0.5.1 yaml_2.1.14
rlang_0.1.2 [9] foreign_0.8 -69 glue_1.2.0
modelr_0.1.1 readxl_1.0.0 [13] bindrcpp_0.2
bindr_0.1 plyr_1.8.4 munsell_0.4.3 [17] gtable_0.2.0 cellranger_1.1.0 rvest_0.3.2
psych_1.7.8 [21] evaluate_0.10.1 knitr_1.17
forcats_0.2.0 parallel_3.4.2 [25] broom_0.4.2
tokenizers_0.1.4 Rcpp_0.12.13 backports_1.1.1 [29] RcppParallel_4.3.20 jsonlite_1.5 fastmatch_1.1-0
mnormt_1.5-5 [33] hms_0.3 digest_0.6.12
stringi_1.1.5 bookdown_0.5 [37] grid_3.4.2
rprojroot_1.2 tools_3.4.2 magrittr_1.5 [41] lazyeval_0.2.1 pkgconfig_2.0.1 Matrix_1.2-11 xml2_1.1.1 [45] lubridate_1.7.1 assertthat_0.2.0 rmarkdown_1.6
httr_1.3.1 [49] R6_2.2.2 nlme_3.1-131
编译器_3.4.2
python-3.x - 在 pos-Tags,Python 中指示性别
我试图用 TreeTagger Wrapper 对法语句子进行 Pos-Tag,但它并不表示名词的性别
这是一个例子:
这是输出:
无论如何我可以在标签中获得语法特征,例如:
性别(GND='F' 或 GND='M')
第三句(动词和代词)中的人(Pers='3Pl' or VER:pres+3+Pl)')?
提前谢谢
r - 在 R 中设置和使用 TreeTagger 的问题
我正在尝试使用 R 中的 TreeTagger 函数进行 POS 分析(在 Mac 笔记本电脑上)。
但是,在运行以下代码时,我不断收到错误消息:
错误消息:path.expand(path) 中的错误:'path' 参数无效
我设置包如下:
有谁知道这里可能是什么问题?
python-3.x - 法语名词的引理
当我运行以下代码时,我得到名词“Suppression”的引理是同一个词“Suppression”。
我等待的结果是得到实际的动词“Supprimer”。是因为语言(法语)吗?还是不做这项工作的 Treetagger?还是我不明白引理的含义?
nlp - TreeTagger 如何获得单词的引理?
我正在使用 TreeTagger 来获取西班牙语单词的词条,但我观察到有太多单词没有按应有的方式进行转换。我想知道这个操作是如何工作的,如果它是使用决策树或机器学习算法等技术完成的,或者它只是包含一个带有相应引理的单词列表。有人知道吗?谢谢!!
python - shell命令没有写入python代码中的文件
使用TreeTagger时出现以下问题
上面的代码片段在命令行中工作。但是当我尝试在 python 代码中执行它时,即使给出了任何错误,输出文件中也没有写入任何内容。