问题标签 [summarization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
90 浏览

text - 如何在 vb6 中使用 OpenTextSummarizer

我想在 Visual Basic 6 中使用 OpenTextSummarizer.dll!但我找不到正确的声明!

DLL 页面: http: //ots.codeplex.com/

相关主题:如何使用 Open Text Summarizer API?

或者如果有替代方案。

谢谢 。

0 投票
2 回答
3171 浏览

sas - 在proc转置后使用名称的SAS总和变量

我有一张按类别(数字)排列的帖子的表格。我得到了一个表,每个列的名称为 _number,例如 _16、_881、_853 等(它们不按顺序排列)。

我需要在 proc sql 中对所有这些进行求和,但我不想在数据步骤中创建变量,也不想写所有列名。我试过这个但不起作用:

我尝试从第一个数字到最后一个数字,也从第一个数字对应的数字到最后一个数字。给我一个不正确的数字。

有任何想法吗?

谢谢!

0 投票
2 回答
242 浏览

java - 使用自动汇总器跨域汇总文本

是否有像THIS Site这样的开源文本摘要 api目前我正在使用规避跨域表单发布限制并且被卡住了如何在没有API 的情况下从我的页面访问上述网站功能

注意:- 通过发布到引用其地址和页面的表单操作找到临时解决方案

0 投票
1 回答
177 浏览

r - 聚合超过 2 组

我试图了解如何汇总我的输出。我创建了一些近似于我的实际数据的虚拟数据,即:数百个 group1、3 个级别的 group2 和几十个验证逻辑。抱歉,如果这看起来很简单,我已经狩猎和啄了很多,不得不说,作为 R 的新手,那里有各种各样的工具(应用系列、ddply、聚合、表格、重塑等)都很棒有点吓人:)

然后,我需要将这些逻辑转换为数字,以便将它们相加:

所以,最后两个让我很接近,但我认为我需要一些不同的东西?我试图对两组的行和列求和。我对tapply很熟悉,但这似乎不明白。

提前致谢!!

0 投票
1 回答
347 浏览

r - 概括我的 YoY 季度百分比增长代码以适应不同的数据

我已经编写了一个代码,该代码适用于同比季度百分比增长。但是,我的代码仅适用于我用来编写代码的数据。我希望能够使用不同长度的数据运行我的整个代码,而不必更改任何内容。

这是我的代码:

有什么方法可以缩短它有 percent1,percent2...#percent14 的代码?并且在名称(百分比增长1)中考虑到数据的长度可能会改变,因此名称会改变吗?

这是此代码中使用的数据,因此您可以看到我做了什么:

http://s21.postimg.org/t6nldfo13/datan.png (datan)

http://s14.postimg.org/vmn2kjatp/arimab2f.png(Arimab2f(使用 ARIMA 的预测数据))

水平=4

频率数据=4

您可以通过复制和粘贴所有这些(包括数据)来运行我的整个代码:

0 投票
2 回答
5145 浏览

r - 如何计算 R 中 data.table 中的出现组合

我有两个数据表。我想计算与另一个表中的表组合匹配的行数。我检查了 data.table 文档,但没有找到答案。我正在使用 data.table 1.9.2。

现在我想计算 DT2 中 (3, 8) 对和 (2, 3) 对的数量。

预期结果:

0 投票
2 回答
304 浏览

algorithm - 化简 log n/3i 之和

我有以下等式:

我想找到它的时间复杂度。主定理无法解决(任何人都可以确认)所以我必须通过“手”来解决

如果我把它想象成一棵树,那将只有一棵,W(1)因为它只是将自己分成一个部分,而不是几个部分。

对于所有其他n != 1,我可以把它们写成总和:

我现在对这个问题的回答是:

我现在的问题是我不知道如何简化这个总和!

谁能为我解释一下该怎么做?

0 投票
1 回答
1112 浏览

php - 在php中按给定间隔对测量值/时间序列求和的有效方法

我在 15 分钟的相同间隔内有一系列测量数据/时间序列。此外,我有一个给定的时间段(例如一天、当前周、月、年、(...),我需要按小时、天、月、(...)汇总值。

例如,按天汇总上个月的所有值。

我的方法是在第一步中生成一个具有每个周期所需间隔的临时数组。例如在 PHP 中(PHP 不是必需的,如果它提供更快的方法,我更喜欢 Python 或 Javascript)

在第二步中,我循环遍历每个日期/值对(在此示例中为 4*24*31,(每天 96 个))并将它们分配给我的临时数组。对于每个日期,我都会覆盖 datetime 对象中的一些值。在此示例中,小时和分钟与临时数组中的键匹配。

在最后一步,我循环遍历临时数组并汇总每个数组。结果,我收到了一个包含 31 个新日期/值对的数组,按每天汇总。这工作正常。但是,有没有更快或更有效的方法?使用这种方法一个月需要将近 0.5 秒。(如果有人对源代码感兴趣,我会添加一个要点)。数据存储在具有 15 个 mio 条目的 mysql 数据库中。

// 编辑:我认为最好的方法是将它与 mysql 分组。

我当前用于从一年中获取数据的 SQL 查询:

0 投票
1 回答
1198 浏览

python - 评论摘要的 NLP 项目

我计划完成关于自然语言处理(使用 NLTK)的最后一年项目,我感兴趣的领域是Facebook 等社交媒体网站的评论摘要。例如,我正在尝试做这样的事情:

图片中的随机 Facebook 评论:

  1. 哇!美丽的。
  2. 看起来真的很漂亮。
  3. 非常漂亮,好图。

现在,所有这些评论都将被映射(使用基于模板的评论摘要技术)成如下内容:

3个人觉得这张照片很“漂亮”。

输出将包含“美丽”这个词,因为它在评论中比“漂亮”这个词更常用(而且美丽和漂亮是同义词)。为了完成这项任务,我将使用跟踪关键字频率关键字得分等方法(在这种情况下,“美丽”“漂亮”的得分非常接近)。 这是最好的方法吗?

到目前为止,通过我的研究,我已经能够提出以下论文,但没有一篇论文涉及这种评论摘要:

该领域还有哪些其他论文解决了类似的问题?

除此之外,我还希望我的摘要器在每次摘要任务中都得到改进。在这方面我如何应用机器学习

0 投票
1 回答
52 浏览

sql - 在 SQL Server 2012 中对这些数据进行分组的 SQL 语法

我有一个看起来像这样的表(称为 StayDate):

我需要的 SQL 语法的输出如下所示:

任何人都可以帮助汇总上述数据所需的 SQL 语法吗?