问题标签 [summarization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
12765 浏览

r - 绘制汇总统计

对于以下数据集,

我想构建一个 ggplot2 折线图,其中 x 轴是Genre,y 轴是所有金额的总和(以 为条件Genre)。

我尝试了以下方法:

但无济于事。

0 投票
1 回答
717 浏览

mahout - 什么适合我?generateAllGrams() 或 generateCollocations() 对我来说足够了吗?

我正在开发一个基于 wordnet 的文档 summaryr.in 的项目,我需要提取搭配。我尝试尽可能多地进行研究,但由于在我难以理解 CollocDriver.java 的工作原理(在 API 上下文中)之前我没有与 Mahout 合作过

在网上搜索时,我发现了这个: Mahout Collocations

这就是问题所在:我有一个 POSTagged 输入文本。我需要识别其中的搭配。我有 collocdriver.java 代码。现在我需要知道如何使用它?是否使用 generateAllGrams() 方法或仅 generateCollocations() 方法对于我的摘要器中的子任务就足够了..??

最重要的是如何使用它?我提出这个问题是因为我承认,我不太了解 API,

我还得到了collocdriver 的grepcode 版本,这两种实现似乎略有不同..输入是 grepcode 版本的字符串和原始路径对象的形式...

我的问题:输入参数中的配置对象是什么以及如何使用它?源/目标将是字符串(如 grepcode)还是路径(如原始)?输出会是什么?

我对 collocdriver 程序做了一些进一步的研发……我发现它使用了一个序列文件,然后是矢量生成……我想知道这个序列文件/矢量生成是如何工作的……请帮助……

0 投票
1 回答
366 浏览

ruby - 问题构建总结 gem

我正在尝试在 Ruby 中使用 Summarize gem,但是当我执行gem install summarize时,我得到:

有任何想法吗??

0 投票
3 回答
180 浏览

r - R. 汇总数据而不合并

我有一个数据框(df),其中包含按日期对不同球队的进球数

我希望制作一个汇总表,显示这些球队在每个日期的比赛场数和淘汰对手的场数

我可以使用 ddply 分别获取游戏和空白

然后合并 df.a 和 df.b 得到我的答案。但是,我相信一定有一个更简单优雅的解决方案

0 投票
2 回答
2492 浏览

python - 总结维基百科文章

我发现自己必须一直学习新事物。我一直在想办法加快学习新学科的过程。我认为如果我可以编写一个程序来解析维基百科文章并删除除最有价值的信息之外的所有内容,那可能会很简洁。

我首先阅读了关于PDF的 Wikipedia 文章并提取了前 100 个句子。我根据我认为它的价值给每个句子打分。我最终创建了一个以下格式的文件:

然后我解析了这个文件并试图找到将每个句子与我给它的值相关联的各种函数。我刚刚开始学习机器学习和统计等等,所以我在这里做了很多摸索。这是我的最新尝试: https ://github.com/JesseAldridge/Wikipedia-Summarizer/blob/master/plot_sentences.py 。

我尝试了一堆似乎根本没有产生任何相关性的东西——平均字长、文章中的位置等。几乎唯一能产生任何有用关系的东西就是字符串的长度(更具体地说,计算小写字母“e”的数量似乎效果最好)。但这似乎有点蹩脚,因为很明显更长的句子更有可能包含有用的信息。

有一次,我以为我找到了一些有趣的函数,但是当我尝试删除异常值(仅计算内部四分位数)时,结果发现它们产生的结果更差,然后只为每个句子返回 0。这让我想知道我可能做错了多少其他事情......我也想知道这是否是解决这个问题的好方法。

你认为我在正确的轨道上吗?或者这只是一个傻瓜的差事?链接代码中是否存在明显的缺陷?有谁知道解决总结维基百科文章问题的更好方法?我宁愿有一个快速而肮脏的解决方案,而不是需要很长时间才能完成的完美解决方案。也欢迎任何一般性建议。

0 投票
2 回答
4722 浏览

python - Textrank:使用networkx补充pagerank以进行句子提取

我正在尝试实现用于句子提取的 textrank 算法,如此处所述。为此,需要用加权边来补充 pagerank 算法并让它在无向图上运行。Networkx pagerank 算法实现允许我轻松集成加权边,据说可以将有向图转换为无向图:请参见此处。但是,当我测试时,它似乎仍然使用有向图。我在这里想念什么?帮助很大。

例子:


输出:{'A':0.25974025929223499,'C':0.40692640737443164,'B':0.33333333333333331}

0 投票
5 回答
2163 浏览

javascript - jQuery 三点插件但可扩展

是否有任何 jQuery 插件可以总结我的文字,即:

进入

但是,当我单击这三个点时,它将展开并显示:

没有插件 css 和 jquery 是受欢迎的。

有任何想法吗?

0 投票
2 回答
1528 浏览

php - 在 PHP 中添加重复的数组行

我想在 PHP 中创建一个函数,将数组的行与共享列值相加。

所以输入。

并输出。

我在想

其中 $col 是重复的自由数组。所以,就我而言,

会给我我想要的输出。感谢您对此的任何帮助。

0 投票
3 回答
2840 浏览

r - 总结R中循环的结果?

我已经创建了这个小代码,并且无法总结循环的结果。有人可以帮我吗?

结果我得到8个数字,但只能显示最后一个

0 投票
2 回答
1792 浏览

python - 自动文本摘要

我决定使用 Python/Django 开发一个自动文本摘要工具。

有人可以推荐有关如何入门的书籍或文章吗?

自动文本摘要中是否有任何开源算法或制作项目,以便我能够获得这个想法?

另外,您想建议我在 Django/Python 中为我准备的新的具有挑战性的 FYP 吗?