问题标签 [syntaxnet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1668 浏览

nlp - 法律文本的 NLP?

我有一个包含几十万份法律文件(主要来自欧盟)的语料库——法律、评论、法庭文件等。我试图通过算法来理解它们。

我已经模拟了已知的关系(时间、this-changes-that 等)。但在单文档级别,我希望我有更好的工具来快速理解。我对想法持开放态度,但这里有一个更具体的问题:

例如:是否有 NLP 方法来确定文档的相关/有争议的部分,而不是样板文件?最近泄露的TTIP论文有数千页的数据表,但其中某处的一句话可能会摧毁一个行业。

过去我玩过 google 的新Parsey McParfaceNLP 和其他 NLP 解决方案,但虽然它们工作得非常好,但我不确定它们在隔离意义方面有多好。

0 投票
0 回答
2560 浏览

tensorflow - 如何在 Tensor Flow 中开始使用 SyntaxNet

随着 Google 推出他们的 NLU 程序 SyntaxNet 和 English Parser Parsey McParseface。如何从训练模型开始?

0 投票
1 回答
888 浏览

tensorflow - Bazel 构建失败,并在构建 syntaxnet 时出现“Executing genrule @six_archive//:copy_six failed”错误

我正在尝试按照syntaxnet 的 github 页面上的说明来构建 syntaxnet 解析器模型。

我的系统是 Debian Wheezy。与 Ubuntu 14.04 LTS 或 15.05 应该没有太大区别。我已经从源代码编译了 bazel 0.2.2(而不是 0.2.2b),它似乎可以正常工作。

每当我启动bazel test syntaxnet/... util/utf8/...命令时,都不会执行任何测试(全部跳过),并带有一些非常神秘的错误消息。这是一个例子:

我按照推荐使用 Oracle Java 8 JDK,我的编译器是:

尝试查看namespace-sandbox错误消息中提到的二进制文件,但在我深入研究之前,我想我会在这里问。

命令似乎工作正常:

任何想法?

更新:我在 Ubuntu 14.04 LTS(我的小型工作站,而不是运行 Debian 的生产服务器)上完成了完全相同的步骤,并且一切正常,所有测试都通过了。我想知道有什么区别。

0 投票
1 回答
2629 浏览

python - 语法网入门

下载并安装 Syntaxnet 后,如何在应用程序中使用 Parsey McParseface 模型?我使用了syntaxnet/demo.sh,并成功标记了词性,如GitHub 自述文件中所示。我现在如何用这个创建一个 python 应用程序?

0 投票
1 回答
3409 浏览

syntax - 如何从 SyntaxNet 获取依赖解析输出

如何从 SyntaxNet ( https://github.com/tensorflow/models/tree/master/syntaxnet ) 获得依赖解析(不是语法树)输出?我看到了依赖解析的描述......关于如何训练模型的描述,但没有看到如何获得依赖解析输出。

SyntaxNet(特别是 Parsey McParseface 模型)是否甚至可以开箱即用地进行依赖解析?

0 投票
3 回答
2729 浏览

tensorflow - 无法构建/测试 (bazel) Syntaxnet (Tensorflow)

我正在尝试按照https://github.com/tensorflow/models/tree/master/syntaxnet上的说明运行基本教程

当我这样做时,我收到以下错误bazel test syntaxnet/... util/utf8/...

以下是错误片段:

//syntaxnet:arc_standard_transitions_test 在 0.0 秒内通过
//syntaxnet:parser_features_test 在 0.0 秒内通过
//syntaxnet:sentence_features_test 在 0.0 秒
内通过 //syntaxnet:shared_store_test 在 0.2 秒内通过
//syntaxnet:tagger_transitions_test 在 0.0 秒内通过
//util/utf8 :unicodetext_unittest 在 0.0s 内通过
//syntaxnet:beam_reader_ops_test 在 0.1s
内失败 //syntaxnet:graph_builder_test 在 0.1s 内失败
//syntaxnet:lexicon_builder_test 在 0.1s 内失败 //syntaxnet:parser_trainer_test 在 0.1s 内失败
//syntaxnet:reader_ops_test 在 0.1s
内失败s
//syntaxnet:text_formats_test FAILED in 0.1s

执行了 12 个测试中的 12 个:6 个测试通过,6 个在本地失败。有些测试的指定大小太大。使用 --test_verbose_timeout_warnings 命令行选项查看这些是哪些。

有人熟悉这种错误吗?任何帮助将不胜感激。

非常感谢您提前。

0 投票
2 回答
952 浏览

python - 为什么 SyntaxNet demo.sh 没有找到正确的导入?

我浏览了https://github.com/tensorflow/models/tree/master/syntaxnet并做了它所说的一切。

我跑了这个来测试:

我只能使 6 次测试通过,6 次失败。

但是当我运行演示时,我得到了错误。

这是怎么回事?demo.sh 是否在与其放置位置不同的位置寻找那些 python 导入?

0 投票
3 回答
1725 浏览

python - SyntaxNet 创建树到根动词

我是 Python 和 NLP 世界的新手。Google 最近发布的 Syntaxnet 引起了我的兴趣。但是,我在理解有关语法网和相关工具(nltk 等)的文档时遇到了很多麻烦。

我的目标:给定诸如“Wilbur kicked the ball”之类的输入,我想提取词根动词(kicked)和它与“the ball”相关的对象。

我偶然发现了“spacy.io”,这个可视化似乎封装了我想要完成的事情:POS 标记一个字符串,并将其加载到某种树结构中,以便我可以从根动词开始并遍历句子。

我玩弄了syntaxnet/demo.sh,并按照这个线程中的建议注释掉了最后几行以获得conll输出。

然后我在 python 脚本中加载了这个输入(我自己拼凑在一起,可能不正确):

我看到我可以访问 corp.tagged_words(),但单词之间没有关系。现在我被困住了!如何将此语料库加载到树型结构中?

任何帮助深表感谢!

0 投票
2 回答
380 浏览

tensorflow - 为 syntaxnet 构建 bazel 时出现安装错误

我正在尝试在我的计算机上运行 Syntaxnet,但在安装 bazel 时卡住了。当我执行“bazel test syntaxnet/... util/utf8/...”时,所有测试目标都被跳过了。错误代码如下。 截图

谢谢。

0 投票
3 回答
978 浏览

nlp - 训练 SyntaxNet 模型

我正在尝试使用http://universaldependencies.org/上提供的数据集并按照本教程以不同的语言训练 Google Syntaxnet 模型。我编辑了syntaxnet/context.pbtxt文件,但是当我尝试运行bazel's script指南中提供的文件时,出现以下错误:

我的疑问是:我必须提供此文件和其他文件,例如fine-to-universal.map、等tag-mapword-map或者训练步骤必须使用训练数据集创建它们?如果我必须提供它们,我该如何构建它们?

提前致谢