问题标签 [treetagger]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
613 浏览

chunking - org.annolab.tt4j - 搜索分块教程

我试图了解如何使用 TreeTagger

http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/

由 tt4j 包裹

http://reckart.github.io/tt4j/

分块一些文本。

我找不到任何教程。

谢谢您的帮助

0 投票
0 回答
930 浏览

java - Java 的树标记器 (tt4j)

我正在用 Java 创建一个 Twitter 情绪分析工具。我正在使用 Twitter4J API 通过 twitter 中的标签功能搜索推文,然后对这些推文进行情绪分析。通过研究,我发现最好的解决方案是使用 POS 和 TreeTagger for Java。

目前,我正在使用提供的示例来查看代码是如何工作的,尽管我遇到了一些问题。

这是代码

}

目前,当它运行时,我收到一个错误,上面写着

TreeTaggerWrapper 无法解析为类型
TokenHandler 无法解析为类型

我将不胜感激给予的任何帮助

谢谢

0 投票
1 回答
184 浏览

perl - 关于使用 Lingua-TreeTagger-0.06

我对 NLP 之类的东西非常非常陌生。因此,我有一个非常基本的问题。我想使用 TreeTagger 使用 POS 标记文件语料库Mac OSX 10.6.8。我已使用http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/TreeTagger提供的说明进行安装

[我将它安装在 /Applications ]

然后我安装Lingua-TreeTagger-0.06了'用于调用 TreeTagger 并操作其输出'。这需要付出很多努力才能做到。

[我将它安装在 /Applications ]

我想我在前面的步骤中已经成功了。怎么办?我的意思是如何调用 Tree-Tagger?

感谢任何可以帮助我的人?

麦克

0 投票
1 回答
188 浏览

stanford-nlp - 如何读取 stanford pos tagger 附带的 .tagger 文件

我无法使用文本编辑器读取我的语言的 stanford maxent 标记器随附的 .tagger 文件。我如何查看 .tagger 文件的内容。

0 投票
0 回答
54 浏览

java - 是否可以将 Java 的 ProcessBuilder 与虚拟文件一起使用?

我目前正在将 Heideltime(目前是一个独立的应用程序)集成到一个使用 Wildfly 部署的 Web 应用程序中。我已经重写了很多代码以使用 JBoss VFS 而不是常规文件,但是当谈到 Heideltime 对另一个独立应用程序 TreeTagger 的依赖时,我陷入了困境。

Heideltime 使用 Java 的 ProcessBuilder 和 Runtime.getRuntime().exec 从本地文件系统上的路径运行 TreeTagger:

例如

但我需要使用虚拟文件作为输入来运行 TreeTagger,而不依赖于在他/她自己的计算机上安装了 TreeTagger 的用户。

有没有办法使用虚拟文件运行进程?如果没有,是否有类似 ProcessBuilder for VFS 的东西?一个 VirtualProcessBuilder,如果你愿意的话?

0 投票
2 回答
245 浏览

r - R 在 tm 包中由 lemme 聚合令牌

我在 R 中加载并清理了一个语料库:

使用treetagger ,我编写了一个函数,例如:

在这一点上,我有tdm类似的东西

现在我想用我的 lemme dictonnary 来汇总字数,用于分组 travaillé、travaille、travaillant、travaillent ......

在我的功能词形还原的结果中,我有:

我不知道如何进行此聚合

0 投票
4 回答
2671 浏览

r - R中的TreeTagger

我已经下载了适用于 Windows 的 TreeTaggerv3.2,并根据 install.txt 对其进行了配置。我正在尝试在带有 koRpus 包的 R 中使用它。我已将 kRp.env 设置为 -

.我要标记的数据在一个文件中,并试图将其用作 treetag("myfile.txt") 但它抛出了错误-

矩阵错误(unlist(strsplit(tagged.text,“\t”)),ncol = 3,byrow = TRUE,:“数据”必须是向量类型,为“NULL”

另外:警告信息:运行命令'C:\windows\system32\cmd.exe /c C:\TreeTagger\bin\tag-english.bat

C:\Users\vivsingh\Desktop\NLP\tree_tag_ex.txt' 的状态为 255

独立的 TreeTagger 正在由 windows 开发。知道它是如何工作的吗?

0 投票
1 回答
406 浏览

r - treetager - Linux - 错误:找不到指定的文件:

嗨,我正在使用 treetager 从数据中提取名词,但是我收到以下错误消息。

这是我的 R 脚本

错误:

0 投票
1 回答
323 浏览

python-3.x - 通过 Python 运行 TreeTagger

我是编程新手,但我有 python 3 的基础知识并安装了 treetagger,并且通过我的命令 shell 我可以 POS 标记文件。

但是,我试图自动打开并运行 Treetagger 的文件夹中有 427 个文件,但我不知道如何实现这一点。我当前的代码是这样的:

我想自动检查一个包含超过 427 个文件的文件夹,并将适当的文件标记为 POS

我认为这需要下面的一些组合以及包括 SUBPROCESS 命令的代码来让 TreeTagger 完成它的工作,我绝对不明白如何使用,但试图从堆栈溢出的另一个问题的反馈中实现。

示例代码

如何让 movie_pos 成为 treetagger 在遍历文件夹中的文件时将 POS 标记的文件?

然后:输出??我是否需要已经为输出创建了 427 个单独的文件,或者有没有办法自动使输出成为输入的修改后的标题,这样输出就不会混淆。(在文件的标题中,是当前存储元数据的位置)。

0 投票
2 回答
650 浏览

ruby - 错误:使用自制软件安装时替换失败?

我想在 OS X 中安装treetagger。为了更容易,我尝试搜索 Homebrew 是否可以这样做。所以我查看了网络并从 pepijnkokke 用户那里找到了这个公式。接下来,我尝试按如下方式安装treetagger:

但是,我收到以下错误:

我删除了上述文件和 sha 行 (sha1 "d823320b718eb41a5b4fef449a711307caaf0d88") 并再次尝试。不过我得到了这个:

知道如何使用自制软件安装 treetagger 吗?