问题标签 [treetagger]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
739 浏览

r - Treetag 包 koRpus R

首先,对不起我的英语,我的英语说得很糟糕。

所以,我有一个关于 R 上 koRpus 包中的 treetag 函数的问题。我想对文本进行词形还原,使用 Treetagger 对我来说没问题。我使用了treetag函数:

我获得了令牌,标签...

但是在此 Lemmatization 之后,我想获得标记的文本,但我没有解决方案来做到这一点。我想在我的文本中用他的引理替换每个标记。

那么,你有我的解决方案吗?

非常感谢 !

0 投票
1 回答
2661 浏览

python - 将 TreeTagger 与 Python 一起使用:找不到 Treetagger bin

我正在尝试将 TreeTagger 与 Python 一起使用。我按照以下步骤进行安装: treetagger-python miotto

当我在命令提示符下使用 TreeTagger 时效果很好,但是当我尝试从 Python 启动它时,这就是我所拥有的:

Traceback (most recent call last): File "C:/Users/Marine/PycharmProjects/treetag/treetagtest.py", line 4, in <module> NLTK was unable to find the TreeTagger bin! pprint(tt_fr.tag(u'Mon Dieu, faites que ça marche!')) File "C:\Users\Marine\Anaconda3\lib\site-packages\treetagger.py", line 117, in tag p = Popen([self._treetagger_bin], AttributeError: 'TreeTagger' object has no attribute '_treetagger_bin'

这是 treetagger.py 文件:

我想我的配置有问题,但我不知道是什么。我在 Windows 中工作,也许这与 treetagger_paths 变量中的路径格式有关?我的 bin 文件在这里: C:\treetagger\bin ,所以我添加了这个路径是 treetagger_paths 变量。

谢谢 !

0 投票
1 回答
8042 浏览

python - Python - 错误:无法创建“treetagger.egg-info”:权限被拒绝

我尝试使用以下命令安装 python 模块(treetager-python):

尝试此操作时,我收到错误消息:

我阅读了有关使用 flag 的信息--user,但这根本不起作用:

我知道使用sudo可能会解决这个问题,但我不喜欢使用 root 权限执行 3rd 方文件/代码。

那么有什么方法可以在不使用' sudo'的情况下解决这个问题?

我试过这个Mac OS,如果我需要任何其他信息,请告诉我。

提前致谢!

解决方案: 所以答案表明问题是源文件夹中的权限问题。当我下载这个文件所有者被设置为“root”时,使用改变所有者chown解决了这个问题。感谢您的快速帮助!

0 投票
1 回答
188 浏览

nlp - UIMA Ruta 使用 DKProCore 词性标注器运行错误(德语小说教程)

一步一步地按照关于 UIMA Ruta for German Novels 的本教程进行操作时,我在运行 Main.ruta 时收到以下错误

我已经验证了我的 TREETAGGER_HOME 的位置,它是在我的环境变量和 Eclipse 中设置的。我还考虑使用更新的树标记器版本,发现以下错误:

1.7.0 严重:发生异常 org.apache.uima.analysis_engine.AnalysisEngineProcessException:注释器处理失败。(...) 引起:java.lang.ClassNotFoundException: de.tudarmstadt.ukp.dkpro.core.api.parameter.Messages at java.net.URLClassLoader.findClass(Unknown Source) at java.lang.ClassLoader.loadClass( Unknown Source) at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source) at java.lang.ClassLoader.loadClass(Unknown Source) ... 43 更多

1.8.0 严重:发生异常 org.apache.uima.analysis_engine.AnalysisEngineProcessException:“不支持的语言 [de]。” 在 de.tudarmstadt.uk (...) 引起:java.io.IOException:无法加载资源 [classpath:/de/tudarmstadt/ukp/dkpro/core/treetagger/lib/tagger-de-le.properties] : FileNotFoundException: 在 [classpath:/de/tudarmstadt/ukp/dkpro/core/treetagger/lib/tagger-de-le.properties] 找不到文件

在最后一次尝试中看到错误后,我再次检查了必要格式下存在的德语语言参数。关于如何解决这个问题的任何建议?

0 投票
0 回答
210 浏览

r - koRpus 包在 macOS 上使用 R (RStudio) 中的 TreeTagger

我正在探索 macOS 上 R 中的 koRpus 包,试图在以下对象上使用treetag函数:

文字 [1] “因为我不能为死亡停下来-” “他好心为我停下来-”
[3] “马车停着,但只有我们自己-” “和不朽”

使用以下语法

> tagged.text <- treetag(as.vector(paste(text, collapse = '')), format = "obj", debug = TRUE)

我收到以下错误

矩阵中的错误(unlist(strsplit(tagged.text,“\t”)),ncol = 3,byrow = TRUE,:“数据”必须是向量类型,为“NULL”

当我在其等效项上尝试上面的加粗命令时,我得到了这个

matrix(unlist(strsplit(paste(text, collapse = ''), "\t"))) [,1] [1,] "因为我无法为死神停下来-他好心地为我停下来-马车举行了,但是只有我们自己——和不朽”

我的工作空间如下

sessionInfo() R 版本 3.4.2 (2017-09-28) 平台:x86_64-apple-darwin15.6.0 (64-bit) 运行于:macOS High Sierra 10.13.1

矩阵产品:默认 BLAS:/System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib LAPACK:/Library/Frameworks/R.framework/Versions/3.4/Resources /lib/libRlapack.dylib

语言环境:[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

附加的基础包:[1] stats graphics grDevices utils
datasets methods base

其他附加软件包:[1] quanteda_0.99.12 koRpus_0.10-2
data.table_1.10.4-3 scales_0.5.0 [5] purrr_0.2.4
readr_1.1.1 tidyr_0.7.2 tibble_1.3.4 [9] tidyverse_1.1.1 gutenbergr_0.1.3 ggplot2_2 .2.1
stringr_1.2.0 [13] dplyr_0.7.4 janeaustenr_0.1.5
tidytext_0.1.4

通过命名空间加载(未附加):[1] reshape2_1.4.2
Have_1.1.0 lattice_0.20-35 colorspace_1.3-2 [5] htmltools_0.3.6 SnowballC_0.5.1 yaml_2.1.14
rlang_0.1.2 [9] foreign_0.8 -69 glue_1.2.0
modelr_0.1.1 readxl_1.0.0 [13] bindrcpp_0.2
bindr_0.1 plyr_1.8.4 munsell_0.4.3 [17] gtable_0.2.0 cellranger_1.1.0 rvest_0.3.2
psych_1.7.8 [21] evaluate_0.10.1 knitr_1.17
forcats_0.2.0 parallel_3.4.2 [25] broom_0.4.2
tokenizers_0.1.4 Rcpp_0.12.13 backports_1.1.1 [29] RcppParallel_4.3.20 jsonlite_1.5 fastmatch_1.1-0
mnormt_1.5-5 [33] hms_0.3 digest_0.6.12
stringi_1.1.5 bookdown_0.5 [37] grid_3.4.2
rprojroot_1.2 tools_3.4.2 magrittr_1.5 [41] lazyeval_0.2.1 pkgconfig_2.0.1 Matrix_1.2-11 xml2_1.1.1 [45] lubridate_1.7.1 assertthat_0.2.0 rmarkdown_1.6
httr_1.3.1 [49] R6_2.2.2 nlme_3.1-131
编译器_3.4.2

0 投票
0 回答
227 浏览

python-3.x - 在 pos-Tags,Python 中指示性别

我试图用 TreeTagger Wrapper 对法语句子进行 Pos-Tag,但它并不表示名词的性别

这是一个例子:

这是输出:

无论如何我可以在标签中获得语法特征,例如:

性别(GND='F' 或 GND='M')

第三句(动词和代词)中的人(Pers='3Pl' or VER:pres+3+Pl)')?

提前谢谢

0 投票
0 回答
372 浏览

r - 在 R 中设置和使用 TreeTagger 的问题

我正在尝试使用 R 中的 TreeTagger 函数进行 POS 分析(在 Mac 笔记本电脑上)。

但是,在运行以下代码时,我不断收到错误消息:

错误消息:path.expand(path) 中的错误:'path' 参数无效

我设置包如下:

有谁知道这里可能是什么问题?

0 投票
1 回答
47 浏览

python-3.x - 法语名词的引理

当我运行以下代码时,我得到名词“Suppression”的引理是同一个词“Suppression”。

我等待的结果是得到实际的动词“Supprimer”。是因为语言(法语)吗?还是不做这项工作的 Treetagger?还是我不明白引理的含义?

0 投票
1 回答
282 浏览

nlp - TreeTagger 如何获得单词的引理?

我正在使用 TreeTagger 来获取西班牙语单词的词条,但我观察到有太多单词没有按应有的方式进行转换。我想知道这个操作是如何工作的,如果它是使用决策树或机器学习算法等技术完成的,或者它只是包含一个带有相应引理的单词列表。有人知道吗?谢谢!!

0 投票
1 回答
124 浏览

python - shell命令没有写入python代码中的文件

使用TreeTagger时出现以下问题

上面的代码片段在命令行中工作。但是当我尝试在 python 代码中执行它时,即使给出了任何错误,输出文件中也没有写入任何内容。