问题标签 [syntaxnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 法律文本的 NLP?
我有一个包含几十万份法律文件(主要来自欧盟)的语料库——法律、评论、法庭文件等。我试图通过算法来理解它们。
我已经模拟了已知的关系(时间、this-changes-that 等)。但在单文档级别,我希望我有更好的工具来快速理解。我对想法持开放态度,但这里有一个更具体的问题:
例如:是否有 NLP 方法来确定文档的相关/有争议的部分,而不是样板文件?最近泄露的TTIP论文有数千页的数据表,但其中某处的一句话可能会摧毁一个行业。
过去我玩过 google 的新Parsey McParface
NLP 和其他 NLP 解决方案,但虽然它们工作得非常好,但我不确定它们在隔离意义方面有多好。
tensorflow - 如何在 Tensor Flow 中开始使用 SyntaxNet
随着 Google 推出他们的 NLU 程序 SyntaxNet 和 English Parser Parsey McParseface。如何从训练模型开始?
tensorflow - Bazel 构建失败,并在构建 syntaxnet 时出现“Executing genrule @six_archive//:copy_six failed”错误
我正在尝试按照syntaxnet 的 github 页面上的说明来构建 syntaxnet 解析器模型。
我的系统是 Debian Wheezy。与 Ubuntu 14.04 LTS 或 15.05 应该没有太大区别。我已经从源代码编译了 bazel 0.2.2(而不是 0.2.2b),它似乎可以正常工作。
每当我启动bazel test syntaxnet/... util/utf8/...
命令时,都不会执行任何测试(全部跳过),并带有一些非常神秘的错误消息。这是一个例子:
我按照推荐使用 Oracle Java 8 JDK,我的编译器是:
尝试查看namespace-sandbox
错误消息中提到的二进制文件,但在我深入研究之前,我想我会在这里问。
命令似乎工作正常:
任何想法?
更新:我在 Ubuntu 14.04 LTS(我的小型工作站,而不是运行 Debian 的生产服务器)上完成了完全相同的步骤,并且一切正常,所有测试都通过了。我想知道有什么区别。
python - 语法网入门
下载并安装 Syntaxnet 后,如何在应用程序中使用 Parsey McParseface 模型?我使用了syntaxnet/demo.sh
,并成功标记了词性,如GitHub 自述文件中所示。我现在如何用这个创建一个 python 应用程序?
syntax - 如何从 SyntaxNet 获取依赖解析输出
如何从 SyntaxNet ( https://github.com/tensorflow/models/tree/master/syntaxnet ) 获得依赖解析(不是语法树)输出?我看到了依赖解析的描述......关于如何训练模型的描述,但没有看到如何获得依赖解析输出。
SyntaxNet(特别是 Parsey McParseface 模型)是否甚至可以开箱即用地进行依赖解析?
tensorflow - 无法构建/测试 (bazel) Syntaxnet (Tensorflow)
我正在尝试按照https://github.com/tensorflow/models/tree/master/syntaxnet上的说明运行基本教程
当我这样做时,我收到以下错误bazel test syntaxnet/... util/utf8/...
以下是错误片段:
//syntaxnet:arc_standard_transitions_test 在 0.0 秒内通过
//syntaxnet:parser_features_test 在 0.0 秒内通过
//syntaxnet:sentence_features_test 在 0.0 秒
内通过 //syntaxnet:shared_store_test 在 0.2 秒内通过
//syntaxnet:tagger_transitions_test 在 0.0 秒内通过
//util/utf8 :unicodetext_unittest 在 0.0s 内通过
//syntaxnet:beam_reader_ops_test 在 0.1s
内失败 //syntaxnet:graph_builder_test 在 0.1s 内失败
//syntaxnet:lexicon_builder_test 在 0.1s 内失败 //syntaxnet:parser_trainer_test 在 0.1s 内失败
//syntaxnet:reader_ops_test 在 0.1s
内失败s
//syntaxnet:text_formats_test FAILED in 0.1s
执行了 12 个测试中的 12 个:6 个测试通过,6 个在本地失败。有些测试的指定大小太大。使用 --test_verbose_timeout_warnings 命令行选项查看这些是哪些。
有人熟悉这种错误吗?任何帮助将不胜感激。
非常感谢您提前。
python - 为什么 SyntaxNet demo.sh 没有找到正确的导入?
我浏览了https://github.com/tensorflow/models/tree/master/syntaxnet并做了它所说的一切。
我跑了这个来测试:
我只能使 6 次测试通过,6 次失败。
但是当我运行演示时,我得到了错误。
这是怎么回事?demo.sh 是否在与其放置位置不同的位置寻找那些 python 导入?
python - SyntaxNet 创建树到根动词
我是 Python 和 NLP 世界的新手。Google 最近发布的 Syntaxnet 引起了我的兴趣。但是,我在理解有关语法网和相关工具(nltk 等)的文档时遇到了很多麻烦。
我的目标:给定诸如“Wilbur kicked the ball”之类的输入,我想提取词根动词(kicked)和它与“the ball”相关的对象。
我偶然发现了“spacy.io”,这个可视化似乎封装了我想要完成的事情:POS 标记一个字符串,并将其加载到某种树结构中,以便我可以从根动词开始并遍历句子。
我玩弄了syntaxnet/demo.sh,并按照这个线程中的建议注释掉了最后几行以获得conll输出。
然后我在 python 脚本中加载了这个输入(我自己拼凑在一起,可能不正确):
我看到我可以访问 corp.tagged_words(),但单词之间没有关系。现在我被困住了!如何将此语料库加载到树型结构中?
任何帮助深表感谢!
nlp - 训练 SyntaxNet 模型
我正在尝试使用http://universaldependencies.org/上提供的数据集并按照本教程以不同的语言训练 Google Syntaxnet 模型。我编辑了syntaxnet/context.pbtxt
文件,但是当我尝试运行bazel's script
指南中提供的文件时,出现以下错误:
我的疑问是:我必须提供此文件和其他文件,例如fine-to-universal.map
、等tag-map
,word-map
或者训练步骤必须使用训练数据集创建它们?如果我必须提供它们,我该如何构建它们?
提前致谢