问题标签 [trending]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
888 浏览

java - 在特定的推文集合中定义热门话题

我正在做一个 Java 应用程序,我必须从特定的推文集合中确定哪些是趋势主题,这些推文是通过 Twitter 搜索获得的。在网上搜索时,我发现该算法定义了一个主题是趋势,当它在特定时间有大量提及时,即在确切的时刻。所以必须有一个衰减计算,以便主题经常变化。不过,我还有一个疑问:

Twitter 如何确定推文中的哪些特定术语应该是 TT?例如,我观察到大多数 TT 是标签或专有名词。这有道理吗?还是他们分析所有单词并确定频率?

我希望有一个人可以帮助我!谢谢!

0 投票
3 回答
3176 浏览

php - 存储趋势数据的最佳方式是什么?

我目前正在构建一个应用程序,我正在为(当前)大约 15,000 种产品导入统计数据。目前,如果我要为来自一个来源的每天的统计信息维护一个数据库表,它将每天增加 15,000 行数据(假设每行 5-10 个字段,主要是浮点数,整数)。显然相当于每年将超过 500 万条记录放入一张表中。

我并不关心从其他来源引入数据的想法(从而为每个新来源将数据库的大小增加 500 万条记录)。

现在数据是基于统计/趋势的数据,每条记录基本上每天写入 1 次,读取次数也很多。但是,出于动态报告和绘图的目的,我需要根据规则(日期范围、值范围等)快速访问数据子集。

我的问题是,这是存储数据的最佳方式(MySQL InnoDb 表),还是有更好的方式来存储和处理统计/趋势数据?

我在这一点上折腾的其他选项: 1. 多个数据库(每个产品一个),其中每个数据源都有单独的表。(即数据库:ProductA,表:Source_A,Source_B,Source_C) 2. 一个数据库,多个表(每个产品/数据源一个)(即数据库:产品,表:ProductA_SourceA,ProductA_SourceB 等。 ) 3.factual数据库中的所有或特定产品信息以及statistical单独目录中的 csv、xml、json、(平面文件)中的所有数据。

到目前为止,这些选项都不是非常易于管理,每个都有其优点和缺点。在我进入开发的 alpha 阶段之前,我需要一个合理的解决方案。

0 投票
1 回答
862 浏览

php - 热门搜索帮助

我的网站就像一个搜索引擎,人们在主页上输入搜索查询。我想制作一个趋势/最近的功能,将每个查询记录到 mysql 数据库中,然后从该数据中计算出哪些搜索被搜索得最多,然后显示在标记为趋势搜索的页面上。此外,在此之下,我想要“最近的搜索”,它只显示最近 5 个左右的搜索。

老实说,我没有使用 mysql 的经验。我什至不知道如何将数据从我的站点移动到 mysql。任何帮助,将不胜感激。我搜索并搜索了这些问题和谷歌,但没有找到任何东西。谢谢!

0 投票
1 回答
2493 浏览

python - 如何在python中计算数值趋势线

我在 python 2.6 中有一个监控应用程序,它计算队列中的条目数(queue_len)。我想创建一个简单的函数,可以使用这些 queue_len 随时间变化的速率值并从中提取趋势。

目标是根据 +ive 或 -ive 随着时间的趋势而不是触发器来启动或关闭队列处理节点。

金融领域的 MACD 看起来是我需要的,还是需要的?在这里寻求任何帮助。

0 投票
1 回答
4200 浏览

mysql - 在 MySQL 中计算随时间增加或减少的趋势

我有一个store_visits具有以下结构的表:

我的目标是为每个商店和给定的日期范围创建一个查询,将计算:

  • 日期范围内的平均访问次数(当前使用AVG(visit_count)
  • 实体店访问量是增加还是减少
  • 增加/减少的相对比率(1 到 4 级,其中 1 = 低比率,4 = 高比率)

访问量的相对增加/减少率仅用于定向目的。它总是一个线性比例。

我花了一天时间尝试构建 MySQL 查询来执行此操作,但我无法理解它。

任何帮助将不胜感激。

谢谢,-斯科特

0 投票
0 回答
724 浏览

php - 带衰减的热门文章算法

使用文章和视频(帖子)构建现有站点顶部的功能,使人们可以查看站点上流行的内容。每个帖子我都有以下字段:

  • 自帖子发布以来的秒数
  • 对帖子发表的评论数
  • 帖子上的“喜欢”数

我想烘焙一个简单的算法来确定什么是流行的,但需要考虑衰减(从过去的时间开始)。

0 投票
1 回答
462 浏览

twitter - 多字推特热门话题

谁能告诉我 Twitter.com 使用什么算法对包含多个单词的趋势主题进行分类?当只处理只有单个词的趋势时,问题很容易,例如“#SoulTrainAwards”或“#DontYouWish”。但在处理多词趋势时,例如“Chrisette Michelle”或“万圣节快乐”或“圣诞快乐”,这是一个完全不同的问题,因为多词趋势上的一个词可能是另一种不同的趋势。例如说“快乐”这个词,或者单独说“圣诞节”这个词。

0 投票
2 回答
1341 浏览

ruby-on-rails - 是否有 MongoDB 热门话题宝石?

我在 MongoDB 中有一组文档,其“描述”值与推文的大小有关。我需要从中生成一个热门话题列表。显然这是一个已解决的问题,但如果不自己编写代码,我无法找到完成工作的明确答案/宝石。

我在我的应用程序中使用 ruby​​ 和 mongoid。

有没有红宝石可以帮助或处理这个问题?谢谢。

0 投票
1 回答
200 浏览

php - 使用它的键将数组值存储到新变量 - twitter api

我正在尝试编写代码来返回过去 100 条推文,其中包含推特上当前的热门话题标签。首先,我获取当前趋势的内容并仅隔离趋势主题标签:

但与其呼应趋势['name'],我想使用它来使用 twitter 搜索方法进行搜索。通过在 if 语句中添加类似这样的内容:

但是变量 $hashtag 没有正确定义,我不知道为什么。(当我尝试回显 $hashtags 以检查它是否存储了正确的值时,它不会打印任何内容。)那么,我应该更改什么以便可以在 URL 中使用 $trend['name'] 的值搜索方法以获取包含趋势标签的过去推文?

谢谢!

0 投票
4 回答
5414 浏览

python - 在 Django 中决定和实现一个趋势算法

我有一个 Django 应用程序,我需要在其中实现一个简单的趋势/排名算法。我很迷茫:

我有两个模型,BookReader。每天晚上,新书都会添加到我的数据库中。每本书的读者数量也在每晚更新,即一本书将有多个读者统计记录(每天一条记录)。

在给定的时间段内(过去一周、过去一个月或过去一年),我想列出最受欢迎的书籍,我应该使用什么算法?

流行度不需要以任何方式实时,因为每本书的读者人数仅每天更新。

我发现一篇文章在另一篇 SO帖子中被引用,该文章显示了他们如何计算热门 Wikipedia 文章,但该帖子仅显示了当前趋势是如何计算的。

正如有人在 SO 上指出的那样,这是一个非常简单的基线趋势算法,只计算两个数据点之间的斜率,所以我猜它显示了昨天和今天之间的趋势。

我不是在寻找像 Hacker News、Reddit 等上使用的超级复杂的趋势算法。

我只有两个数据轴,读者人数和日期。

关于我应该实施什么以及如何实施的任何想法。对于从未使用过任何与统计/算法相关的东西的人来说,这似乎是一项非常艰巨的任务。

提前谢谢大家。