问题标签 [analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
808 浏览

postgresql - PostgreSQL 数据分析/聚合

我在 PostgreSQL 中有一个具有以下结构和数据的表:

如何运行一个查询,该查询返回每个“问题”的最高“响应”的“答案”?对于上述数据,我希望看到如下内容:

对于每个“问题”,我没有任何问题,但提取相关的“答案”也被证明是一个问题。用于获得问题和最高响应的 SQL 是:

任何人都可以阐明我等式的最后一部分 - 显示相关答案吗?

我试过这个:

但是 Postgres 抱怨 Answer 没有在聚合或 GROUP BY 语句中使用。我是否只需要事先确定所有问题,然后对每个问题进行 SQL 查询以找到响应最多的答案?我宁愿不走这条凌乱的道路,但我想这是一个选择。

谢谢!

0 投票
10 回答
159479 浏览

java - 如何分析来自 Java 核心转储的信息?

如果一个进程崩溃并留下一个核心转储,或者我创建了一个核心转储,gcore那么我该如何分析它?

我希望能够使用jmap,jstackjstat,还希望查看所有变量的值。

通过这种方式,我可以找到崩溃或冻结 JVM 的原因。

0 投票
3 回答
2911 浏览

mysql - 分析 MySQL 数据库查询的执行时间?

我正在使用带有 phpMyAdmin 作为前端的 MySQL 数据库(我不确定我是否有远程/客户端访问权限)。我有一个查询数据库的脚本,想看看每个查询需要多长时间?最简单的方法是什么?我可以在服务器上安装另一个 PHP 应用程序吗?

0 投票
2 回答
2979 浏览

excel - 当源是 SSAS 多维数据集时,在 Excel 2007 数据透视表中使用“将值显示为”选项?

我有一个 Excel 2007 数据透视表,顶部显示“年份”,侧面显示“月份”。我想要做的是将值表示为与上一年同月的“百分比差异”。(例如,如果 Jan-07 是 $100,000,而 Jan-08 是 $120,000,我希望 Jan-08 显示“20%”)。但是,每次我尝试这样做(使用值字段设置的“显示值”选项卡)时,我的所有数字都会变为“#N/A”。有没有办法使用 Analysis Services 多维数据集作为数据源来做到这一点?当我使用不同工作表上的数据作为数据透视表的数据源来执行完全相同的操作时,它可以正常工作。

0 投票
1 回答
3076 浏览

analysis - 基本复杂性问题 - 卷积

我正在尝试评估一些基本图像过滤算法的复杂性。我想知道你是否可以验证这个理论;

对于像 Inverse 这样的基本逐像素过滤器,操作的数量随着输入的大小(以像素为单位)线性增长,并且

令 S = 图像边长令 M = # 像素输入

逆序为 O(M) 或 O(S^2)。

另一方面,卷积滤波器有一个参数 R,它决定了在为每个滤波器建立下一个像素值时要卷积的邻域的大小。

设 R = 卷积滤波器的半径

卷积顺序为 O(M*((R+R*2)^2) = O(M*(4R^2) = O(MR^2)

或者我应该让 N = 卷积滤波器(邻域)的大小(以像素为单位)?

O(M*(N)) = O(MN)

最终,卷积滤波器线性依赖于像素数和邻域中像素数的乘积。

如果您有任何指向已记录该文件的论文的链接,我们将不胜感激。

亲切的问候,

加文

0 投票
5 回答
3211 浏览

binary - 如何分析封闭格式(例如 doc 或 vce)?

我想研究 .vce 格式。它是一种二进制格式,看起来比简单的对象序列化更复杂。是否存在任何分析二进制格式的工具或技术?

0 投票
5 回答
16654 浏览

audio - 如何确定 WAV 文件的声音有多大?

我有一堆不同的 WAV 格式的录音(所有不同的乐器和音高),我想将它们“标准化”,以便它们在播放时听起来大致相同。

我试过测量平均样本幅度(所有绝对值的总和除以样本数),但通过这种测量进行归一化效果不佳。我认为这种方法不起作用,因为它没有考虑声音的频率,而且我知道高频录音听起来比相同幅度的低频声音更响亮。

有谁知道测量声音响度的好方法?

0 投票
3 回答
944 浏览

sharepoint - SharePoint 中的性能数据分析

市场上是否有任何工具可以有效分析 SharePoint 列表中的数据?我有一个客户希望分析和报告存储在 SharePoint 中的员工绩效数据。

0 投票
6 回答
9599 浏览

php - 命名实体识别算法

我想使用命名实体识别 (NER) 在数据库中为文本找到足够的标签。

我知道有一篇关于此的 Wikipedia 文章和许多描述 NER 的其他页面,我希望从您那里听到有关此主题的一些信息:

  • 您对各种算法有何经验?
  • 你会推荐哪种算法?
  • 哪种算法最容易实现(PHP/Python)?
  • 算法如何工作?是否需要手动培训?

例子:

“去年,我在伦敦见到了巴拉克奥巴马。” => 标签:伦敦,巴拉克奥巴马

我希望你能帮助我。非常感谢您!

0 投票
2 回答
9936 浏览

php - N-gram:解释 + 2 个应用

我想用 n-gram 实现一些应用程序(最好在 PHP 中)。


哪种类型的 n-gram 更适合大多数用途?单词级别还是字符级别 n-gram?如何在 PHP 中实现 n-gram-tokenizer?


首先,我想知道 N-gram 到底是什么。这个对吗?这就是我理解 n-gram 的方式:

句子:“我住在纽约。”

单词级别的二元组(n 为 2):“# I”、“I live”、“live in”、“in NY”、“NY #”

字符级二元组(n 为 2):“#I”、“I#”、“#l”、“li”、“iv”、“ve”、“e#”、“#i”、“in”、“ n#”、“#N”、“NY”、“Y#”

当你有这个 n-gram-parts 数组时,你删除重复的部分并为每个部分添加一个计数器,给出频率:

字级二元组:[1, 1, 1, 1, 1]

字符级二元组:[2, 1, 1, ...]

这个对吗?


此外,我想了解更多关于你可以用 n-gram 做什么的信息:

  • 如何使用 n-gram 识别文本的语言?
  • 即使您没有双语语料库,是否可以使用 n-gram 进行机器翻译?
  • 如何构建垃圾邮件过滤器(垃圾邮件、火腿)?将 n-gram 与贝叶斯滤波器结合起来?
  • 如何进行主题定位?例如:关于篮球或狗的文字?我的方法(对“狗”和“篮球”的维基百科文章执行以下操作):为两个文档构建 n-gram 向量,对其进行归一化,计算曼哈顿/欧几里得距离,结果越接近 1 越高相似

您如何看待我的应用方法,尤其是最后一种?


我希望你能帮助我。提前致谢!