问题标签 [data-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5874 浏览

sql-server - 将数据表保存到数据库

嗨,我正在从 web 服务生成一个 DataTable,我想将整个 DataTable 保存到一个数据库表中。

DataTable正在生成,但接下来要做什么。我卡住了。给我看一些语法。我也不需要 select 语句,我只想将DataTable 中的所有信息插入到空白的 db 表中。

0 投票
2 回答
1776 浏览

analysis - 例如,我应该采取什么流程来了解大型医院的现有系统?

我被要求研究和记录一家三级医院的现有系统。医院由行政部门(会计、行政、工程......)和诊所单位(药房、病人进出医院的过程......)组成。

我需要了解数据如何流入和流出以及业务流程。

这是一家大医院。我如何系统地分析和记录这个系统?

虽然我有这项任务,但我有一个可以为医院实施的通用系统,并希望根据我的发现根据他们的需求调整系统。

我需要一个计划来使这个过程成功。有人可以帮我指导吗?

编辑#1:

我发现这个有用的链接

如何定义和概述您的业务流程工作流

编辑#2:

我提出了一些我认为有必要开始的问题。请为他们做出贡献并挑战他们。

  • 您的部门执行什么职能?
  • 什么信息进入您的部门?
  • 你从你的部门发出什么信息?
  • 您如何使用传入的每个信息?
  • 你用它们做什么?
  • 它们是如何流动的?
  • 离开部门的信息是如何生成或获取的?
  • 这些信息是如何流动的?
  • 你生成什么信息?
  • 您如何处理这些生成的信息?
0 投票
1 回答
1619 浏览

excel - excel中的二值化

您将如何在 Excel 中对具有五个分类值的属性进行二值化?

0 投票
12 回答
73017 浏览

r - R和SPSS的区别

我将很快分析大量与网络流量相关的数据,并对数据进行预处理以进行分析。我发现 R 和 SPSS 是最流行的统计分析工具之一。我还将生成相当多的图形和图表。因此,我想知道这两个软件之间的基本区别是什么。

我不是在问哪个更好,而只是想知道两者在工作流程方面有什么区别(除了 SPSS 具有 GUI 的事实)。无论哪种情况,我都将主要使用脚本,所以我想了解其他差异。

0 投票
5 回答
154846 浏览

r - 将多项式模型拟合到 R 中的数据

我已经阅读了这个问题的答案,它们很有帮助,但我需要帮助。

我在 R 中有一个示例数据集,如下所示:

我想为这些数据拟合一个模型,以便y = f(x). 我希望它是一个三阶多项式模型。

我怎么能在 R 中做到这一点?

此外,R 可以帮助我找到最合适的模型吗?

0 投票
2 回答
817 浏览

parsing - 解析半结构化数据 - 我可以使用任何分类器吗?

我有一组具有半常规格式的文档。行通常用换行符分隔,每行的主要组成部分用空格分隔。一些示例是一组家具组装说明、一组目录、一组食谱和一组银行对账单。

问题在于,每组中的每个样本都与其对等成员不同,这使得 RegEx 解析不可行:项目的数量可能位于项目名称之前或之后,相同的项目可能在样本之间具有不同的名称、说明性文本或行之间可能存在注释等。

我使用分类器(神经网络、贝叶斯、GA 和 GP)来处理整个文档或数据集,但没有从文档中提取项目并在上下文中对其进行分类。这可以做到吗?有没有更可行的方法?

0 投票
8 回答
8676 浏览

perl - 在 Perl 中解析多行数据

我有一些数据需要分析。数据是多行的,每个块由换行符分隔。所以,它是这样的

我需要过滤掉那些存在某些特定属性的数据块。例如,只有那些具有属性 4 的块,只有那些同时具有属性 3 和 6 的块等等。我可能还需要根据这些属性的值进行选择,例如,只有那些具有属性 3 且其值为 '一个'。

我将如何在 Perl 中执行此操作。我尝试将其拆分为“\n”,但似乎无法正常工作。我错过了什么吗?

0 投票
3 回答
33210 浏览

r - 获取数据的概率密度

我需要分析一些有关 DSL 线路的 Internet 会话的数据。我想看看会话持续时间是如何分布的。我想一个简单的方法是从绘制所有会话持续时间的概率密度图开始。

我已经在 R 中加载了数据并使用了该density()函数。所以,它是这样的

我是 R 和这种分析的新手。这是我通过谷歌发现的。我得到了一个情节,但我还有一些问题。这是做我想做的事情的正确功能还是有别的什么?

在图中,我发现 Y 轴刻度为 0...1.5。我不明白它怎么可能是 1.5,不应该是从 0...1 吗?

另外,我想获得更平滑的曲线。因为,数据集真的很大,所以线条真的是锯齿状的。当我介绍这个时,让它们变得平滑会更好。我该怎么做呢?

0 投票
5 回答
4404 浏览

python - 使用 R/python 和 SSD 进行数据分析

有没有人有使用 r/python 和存储在固态驱动器中的数据的经验。如果您主要进行读取,理论上这应该会显着改善大型数据集的加载时间。我想知道这是否属实,是否值得投资 SSD 以提高数据密集型应用程序的 IO 速率。

0 投票
1 回答
3378 浏览

testing - 如何测试 k-means 的实现?

你如何测试你自己的多维数据集的 k-means 实现?

我正在考虑在数据上运行一个已经存在的实现(即 Matlab)并将结果与​​我的算法进行比较。但这需要两种算法的工作方式大致相同,并且两种结果之间的映射可能不是小菜一碟。

你有更好的主意吗?