问题标签 [textsum]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1205 浏览

tensorflow - 这是 tensorflow 文本摘要的正确指南吗?

阅读 tensorflow 文本摘要模型,它指出“下面描述的结果基于在多 GPU 和多机器设置上训练的模型。它已被简化为仅在一台机器上运行以用于开源目的。”

在指南中进一步调用此命令:

此命令与 cuda/gpu 无关吗?为什么这个命令被截断?

0 投票
0 回答
103 浏览

docker - 使用 docker 实例运行 tensorflow 汇总服务

可以使用 tensorflow docker 实例调用tensorflow 汇总模型吗?

模型的文档是指使用bazel build作为构建模型的步骤的一部分。但是运行 tensorflow docker 容器不允许运行汇总模型,除非容器是从源代码构建的,因为这个模型是在 master 上的。

0 投票
2 回答
1616 浏览

tensorflow - Tensorflow - TextSum 模型:如何创建我自己的训练数据

我正在尝试为 TextSum 模型创建自己的训练数据。据我了解,我需要将我的文章和摘要放入二进制文件(在 TFRecords 中)。但是,我无法从原始文本文件创建自己的训练数据。我不太清楚格式,所以我尝试使用以下代码创建一个非常简单的二进制文件:

我尝试使用下面的代码来读出这个 test_data 文件的值

但我总是收到以下错误:

我不知道出了什么问题。如果您有任何解决此问题的建议,请告诉我。

0 投票
1 回答
2049 浏览

tensorflow - Tensorflow 文本摘要设置:什么是工作区文件?

阅读 Tensorflow 文本摘要文档设置:https ://github.com/tensorflow/models/tree/master/textsum它指出clone the code to your workspace and create empty WORKSPACE file.

我创建了一个新文件夹并将https://github.com/tensorflow/tensorflow.git克隆到此文件夹,这就是“将代码克隆到您的工作区”的意思吗?什么是空工作区文件?它是一个名为 'WORKSPACE' 的空文件吗?

0 投票
1 回答
1418 浏览

tensorflow - 如何使用文本?

我一直在关注链接以使用 textsum。我已经使用提供的命令训练了模型。但我在“textsum/log_root/”目录中没有看到任何文件夹“train”。由于训练是在样本文件上进行的,该模型是否能够处理实时测试数据?如果没有,我该如何制作训练数据并训练模型?最重要的是如何测试/使用模型来查看结果汇总?

0 投票
1 回答
600 浏览

tensorflow - textsum 束搜索解码器提供所有结果

我一直在用二进制数据和 gigaword 数据测试 textsum,训练模型并进行测试。波束搜索解码器为我提供了包含数据集和模型的所有“UNK”结果。我使用的是默认参数设置。

我首先更改了data.py和batch_reader.py中的数据接口,从gigaword数据集中读取和解析文章和摘要。我在大约 170 万个文档上训练了一个包含超过 90K 小批量的模型。然后我在不同的测试集上测试了模型,但它返回了所有结果。 使用 gigaword 训练的模型的解码器结果

然后我使用 textsum 代码附带的二进制数据来训练一个少于 1k 小批量的小型模型。我测试了相同的二进制数据。它给出了解码文件中的所有结果,除了一些“for”和“.”。 使用二进制数据训练的模型的解码器结果 我还查看了关于训练损失的张量板,它显示训练收敛。

在训练和测试中,我没有更改任何默认设置。有没有人尝试过和我一样的事情并发现了同样的问题?

0 投票
0 回答
1028 浏览

tensorflow - TensorFlow TextSum 解码错误:无法展平字典

我尝试运行TensorFlow textsum 模型

训练进行得很顺利,但是当我尝试使用模型作者提供的玩具数据运行“解码”模式时,我收到此错误:

我运行解码的命令:

可能是什么原因造成的?

CUDA 7.5

CUDNN 5.1

TensorFlow 0.10

更新:我尝试安装以前版本的 TensorFlow:0.9,基于对 GitHub 问题的评论:https ://github.com/tensorflow/models/issues/417 它有助于解决问题。我仍然不知道为什么它不适用于 0.10 版。

0 投票
0 回答
165 浏览

tensorflow - textsum decode 给出其他文章的摘要作为结果

我使用给定的玩具数据集训练模型。为了快速查看结果,我尝试仅使用来自玩具数据集的一篇文章进行测试。当我用一篇文章进行测试时,解码器给出了另一篇文章的摘要(我在训练中使用的另一篇文章),这与我测试的内容完全无关。

例如:我的测试文章是the sri lankan government ...

和摘要是 sri lanka closes schools as war escalates

但是解码器给了这个 output=outdrink germans [UNK] in stakes

当我尝试使用多篇文章进行测试时,解码器正在给出其他文章的摘要。有人有类似的问题吗?我错过了什么或做错了什么?

0 投票
1 回答
270 浏览

tensorflow - 如何格式化 textsum data_convert_example 的输入数据

我希望有人能够看到我在这里失败的地方。所以我已经从 Buzzfeed 中抓取了一些数据,现在我正在尝试格式化一个文本文件,然后我可以将其发送到 data_convert_examples text_to_data 格式化程序中。

我以为我有几次答案,但是当我将其作为二进制处理然后尝试针对数据进行训练时,我仍然遇到了障碍。

我所做的是在玩具数据集上运行 binary_to_text,然后在 windows 下的 notepad++ 中打开文件,显示所有字符,并匹配我认为的格式。

我为下面的长函数道歉,但我真的不确定问题可能出在哪里,并认为这是提供足够信息的最佳方式。有人有什么想法或建议吗?

0 投票
2 回答
3056 浏览

tensorflow - 使用 tensorflow textsum 的样本数据(玩具样本数据)进行训练需要多长时间?

我正在研究 tensorflow 的 textsum(文本摘要模型)。我已将其运行以使用样本数据训练模型,即从 git 克隆时随模型提供的玩具数据集。我想知道用样本数据集训练模型和解码需要多少时间?它已经花费了 17 多个小时并且仍在运行。