问题标签 [syntaxnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - 用于命名实体识别的 TensorFlow RNN
我正在尝试找出适应开放命名实体识别问题的最佳模型(生物学/化学,因此不存在实体字典,但必须通过上下文识别它们)。
目前我最好的猜测是调整 Syntaxnet,这样它不会将单词标记为 N、V、ADJ 等,而是学习标记为 BEGINNING、INSIDE、OUT(IOB 表示法)。
但是我不确定这些方法中哪一种是最好的?
- 语法网
- word2vec
- seq2seq(我认为这不是正确的,因为我需要它来学习两个对齐的序列,而 seq2seq 是为翻译中不同长度的序列而设计的)
将不胜感激指向正确方法的指针!谢谢!
tensorflow - syntaxnet 词性标注模型
我正在尝试使(罗马尼亚语)语法网络模型在我的语料库的一部分上运行。我将解压缩的文件映射到 docker 容器中。当我运行用于标记化的脚本时:
cat sent.txt | syntaxnet/models/parsey_universal/tokenize.sh $MODEL_DIRECTORY/
我收到与丢失文件相关的核心转储错误,特别是 char-map。查看解压后的文件夹,我注意到那里确实没有字符映射文件(只有 char-ngram-map)。我在这里想念什么?如果档案确实缺少一些文件,那么它是如何上传到那里的?
谢谢
syntaxnet - 意大利语和西班牙语的 SyntaxNet 标记化
我们正在尝试在英语、意大利语和西班牙语上使用 SyntaxNet,并在我们在这里找到的通用依赖数据集上使用预训练模型https://github.com/tensorflow/models/blob/master/syntaxnet/universal.md。
对于意大利语和西班牙语,我们在收缩和 clitics 的标记化水平上遇到了一些问题。缩略词是介词和限定词的组合,因此我们希望将它们分成两部分。我们注意到分词器总是失败,这意味着对句子的整个分析都出错了。同样的情况也发生在 clitics 身上。
我们推出的模型如下:
下面是我们现在获得的输出示例以及我们希望拥有的输出示例。
意大利语 (SyntaxNet analisys)
意大利语(所需输出)
我们该如何处理这个问题?提前致谢。
docker - 使用 Docker Toolbox 安装 SyntaxNet 耗尽虚拟内存
尝试使用 Docker 工具箱从此Dockerfile安装SyntaxNet时,我耗尽了虚拟内存。编译 Dockerfile 时收到此消息:
我觉得这可以通过使用 (例如) 更改 Bazel 的默认作业限制来解决--jobs=1
,但是我不确定将其放在 Dockerfile 中的哪个位置。
tensorflow - 依存分析树如何用于情感分析?
随着 Google 发布 Parsey McParseface syntaxnet的公告,据称 它是最准确的依赖解析器。我想了解如何使用此解析器进行更准确的情绪分析?如果有人可以分享一些可以帮助我理解整体流程的博客或研究论文或教程。
tensorflow - 将 Syntaxnet 与 TensorFlow Serving 结合使用
我尝试将 Syntaxnet 与 TensorFlow Serving 一起使用。
我在这里找到了这个链接。我尝试运行脚本来启动服务器:
但是对于下面的行(在构建 parsey_api 时):
我收到一个错误:
是在file workspace.bzl
目录中$BUILD_DIRECTORY/tensorflow/tensorflow
我在用:
- Ubuntu 14.04
- 巴泽尔 0.4.4
- 安装了python gPRC
谢谢,欢迎提出任何建议。
python - SyntaxNet:没有名为 mock 的模块
我按照在我的 Mac OS X Sierra 10.12.3 中安装 SyntaxNet 的说明进行操作。
我安装了所有必需的软件:
- 蟒蛇2.7
- 巴泽尔(通过
brew install bazel
) - 痛饮(通过
brew install swig
) - 协议缓冲区(通过
pip install -U protobuf==3.0.0b2
) - 模拟(通过
pip install mock
) - asciitree(通过
pip install asciitree
) - numpy(通过
pip install numpy
)
然后我构建和测试 SyntaxNet:
过程中 6 次测试都失败了(正如其他用户在 Github 问题列表中评论的那样)。由于这是预期的行为,我继续运行第一个演示:
预期结果:
但是出现了以下错误:
内容demo.sh
如下:
更新 sudo pip freeze
并pip freeze
返回相同的东西:
tensorflow - 如何判断一个句子是否是指令(祈使句)?
我想确定一个给定的句子是否是命令式的,即它包含某人做某事的指令。例如:
- (请)(如果可以的话,那就太好了)把我要的 PDF 发给我
- (我要求你)(请)明天提交你的辞职信
具体来说,我正在寻找类似于以下内容的答案:如何确定一个句子是否是一个问题(疑问)?
这里,包含可选 SQ 节点的 SBARQ 节点表示问题(疑问)。有没有类似的方法来检查命令?
我的一个想法是检查根节点是否是动词(VB、VBP、VBD 等),但这可能太宽泛/不完整?还有其他想法吗?
tensorflow - 使用 SyntaxNet/DragNN 从头开始训练英语/俄语/...模型需要多长时间?
我想重新训练 SyntaxNet/DragNN 的现有模型,并寻找一些实数,为任何语言训练模型需要多长时间(这将为我的语言提供良好的基线)。在此过程中您使用了哪些硬件?
先感谢您!
nlp - 如何处理我从 syntaxnet 获得的树?(conll 格式)
我想我需要 edu.stanford.nlp 包中的 Semgrex。对于这项任务,我需要从 edu.stanford.nlp.trees.Tree 构造 Tree 并像处理该树一样
实际上我需要一些关于如何从 conll 中构造树的建议。