问题标签 [summarization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
61 浏览

javascript - 算法:聚合子串以确定相关信息

我正在尝试做一个聚合算法,它将根据用户突出显示文本中最重要的元素。

想象一下,您有一个包含 n 个单词的文本,您可以从文本中选择 k 个连续单词作为“相关突出显示”,其中 1<=k<=n.(k 是 n 的子字符串)

假设我们从这 k 个亮点中选择 10 到 10000 个,是否有任何算法可以确定最重要的信息?

考虑到许多亮点会重叠,我们需要考虑到这一点。我也最好在 javascript 中寻找解决方案,因为它是针对 chrome 扩展的。

这不是针对课程的,而是针对基于人群的总结的个人项目。

0 投票
0 回答
322 浏览

text - 关于抽象文本摘要(基于知识)

我正在做关于抽象文本摘要的第四年项目。

我的任务是使用基于知识的抽象方法开发文本摘要器。我已经对这个主题进行了一些研究,我也发现了一些研究论文,其中大部分仅包含理论部分,而没有提及实施。

我必须在 2-3 个月内完成这项任务。请提出任何好的资源和一些想法来实施这个项目。

0 投票
2 回答
120 浏览

r - dplyr 没有总结

我有这张桌子:

我需要按客户分组并获得一些指标:

结果是:

所以,我没有得到总和(客户端 10669 和 31259 是两次)。

我还尝试了以下方法并得到了相同的结果:

0 投票
2 回答
7339 浏览

r - data.table:使用 with=False 并转换函数/摘要函数?

我想总结 data.table 中的几个变量,以宽格式输出,可能作为每个变量的列表输出。由于其他几种方法都不起作用,我尝试做一个外部 lapply,将变量的名称作为字符向量。我想使用 with=FALSE 传递这些。

由于这不起作用,我尝试了没有 lapply 的更简单的方法。

这也不起作用。有没有办法做这样的事情?是否需要这种“与”行为?(我知道?data.table仅提及选择列,但在我的情况下,能够转换它们也会很有用)

当 with=FALSE 时,j 是要选择的名称或位置的向量,类似于 data.frame。with=FALSE 通常在 data.table 中用于动态选择列。

编辑我的目标是针对不同的变量以宽格式获得每个组的摘要。我试图扩展以下仅适用于一个变量的变量列表。

可悲的是,SO不允许我发布我的其他问题。在那里我描述了我想要一个类似于:

预期输出将类似于:

0 投票
2 回答
4010 浏览

elasticsearch - Elasticsearch:可以处理聚合结果吗?

我使用 SUM-Aggregation 计算我的服务流程的持续时间。执行过程的每一步都将保存在 Elasticsearch 中的调用 ID 下。

这是我监控的:

筛选:

这将返回该过程的完整持续时间,并告诉我该过程的哪一部分是最快的以及哪一部分是最慢的。

接下来我想通过 serviceId计算所有已完成进程的平均持续时间。在这种情况下,我只关心每个服务的总持续时间,所以我可以比较它们。

如何从我的 total_durations 创建平均值、最小值和最大值?

编辑:我添加了一些示例数据,希望您可以使用它。

呼叫1:

呼叫2:

服务 ID #1 的所有服务调用的聚合 这是我要计算的:

0 投票
1 回答
159 浏览

r - R从具有多列信息的数据框中计算摘要数据框

我有一个包含多列信息的数据框,例如:

我想创建一个汇总数据框,计算每个基因有多少聚集区域。我认为一个集群有任意数量的行,其中站点编号的差异不大于 1,000(我的数据按 chr 和站点排序)。首先,我创建了一个新列来计算连续行中站点之间的距离:

我想为每个基因创建一个汇总表,其中汇总了在每个基因中发现的平均值为正或负的簇的数量。在上面的示例中,表格如下所示:

0 投票
1 回答
1036 浏览

python - 设置 pyrouge_set_rouge_path 错误

我有 Windows 7 并使用 Python 3.4

我正在尝试使用 ROUGE 从 pypi 安装 pyrouge。

我按照网站上的安装步骤https://pypi.python.org/pypi/pyrouge/0.1.2

但是命令:

不执行。

我在命令提示符下尝试:

和错误:

如果您能帮我做点什么,我将不胜感激。谢谢

0 投票
2 回答
3554 浏览

python-2.7 - Pyrouge 安装测试结果为“FAILED (errors=10)”

在我在 Stackoverflow 上发布的上一个问题中,我询问了 Pyrouge 的安装。收到答案后,我申请了。从pypi安装步骤,我做到了

然后(这里是我替换 pypi 原始步骤 2 的地方,

与我从stackoverflow收到的答案):

然后,我运行以下命令以确保它正确安装:

我应该收到以下输出:

但是得到了以下输出:

除此之外,我每次测试尝试都收到一个错误。

以下是详细的第一个和最后一个错误:

第一个错误:“””

"""

上次错误:“””

"""

我打开了目录:C:\Users\IQ\AppData\Roaming\pyrouge\,但它是空的。我想知道这是什么问题,以及如何解决它。

谢谢你。

0 投票
4 回答
94 浏览

java - 数组总结(工作代码),不抓一行代码

学习数组atm(自以为是的菜鸟)有人可以解释一下这部分代码是什么意思吗?

我无法理解它的逻辑。显然“答案”是我的计数器。频率增加 1 直到它到达数组 #11(即数字 10),但括号内发生的事情让我感到困惑。但如果达到最大数量 10,结果(正确)给出实际频率。我的猜测是这段代码操纵了这个类的很大一部分。
我建立在这段代码之上,但我默认使用这部分代码(因为它本身就在书中给出)。

谢谢你。

这是完整的代码

0 投票
3 回答
119 浏览

r - 使用 min 和维护行号按列组汇总

我有一个包含 3 列的数据框

我需要恢复每个组的最小值(ID1,ID2)和这个最小值在原始表中的位置(row.name)。

使用 group_by 和 summarise,我已经获得了最小值,但我看不到获得位置的方法,因为 summarise 摆脱了未汇总且未用于组的列。

关于如何解决这个问题的任何想法?

提前致谢