问题标签 [sample-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
8094 浏览

matlab - MatLab:从采样数据创建 3D 直方图

我在一个数组中采样了区间 [0,1] 中的数据transitions=zeros(101,101),我想将其绘制为 3D 直方图。transitions填充了类似于此线程末尾提供的示例数据的数据。

第一列是指第一个观察变量X,第二列是第二个变量Y,第三列是归一化频率。即第一行:观察到的变量对的归一化频率(0,0)为 0.9459。因此的归一化频率之和(0,Y)1.

我尝试使用以下代码制作(某种)3D直方图:

但是,由于它是离散空间中A的采样数据,因此输出如下图所示。这在某种程度上具有误导性,因为图中存在“间隙”(对于没有采样数据的坐标,z 值 = 0)。我宁愿将采样数据分配给它们相应的图,从而产生一个“真实的”3d 直方图。

假直方图

顺便说一句,由于我创建Ax-、y- 和 z 比例的“hack”结果是不正确的。3D 直方图的轴(全部三个)应在 [0,1] 的区间内。

0 投票
5 回答
1803 浏览

r - 按组替换重采样

这是我的第一篇文章,所以请多多包涵。下面是我的数据的一个小样本。我的实际数据集有超过 4,000 个单独的 ID,每个 ID 可以分配从一到两百美元不等的单独金额。

使用示例可以最好地解释我本质上想要做的事情。我想为每个 ID 生成五个带有替换的随机样本。每个样本的大小为 5 或 5 个随机抽样的美元值。我的最终结果将有 20,000 个单独的样本(5 个样本,每 4000 个 ID,每个包含 5 个按 ID 随机选择的美元金额)。我这样做是为了将每个样本中的美元分布与具有相同 ID 的其他样本进行比较。

截至目前,我正在尝试使用下面引用的代码来获得这样的答案。我还应该指出,当我运行这个脚本时,我收到一个错误,我的“结果必须全部是原子的”。我不确定是否需要添加其他步骤或什么。

如果我提出的问题不清楚,我很抱歉;我很难阐明我遇到的问题。

在此先感谢您的帮助

0 投票
2 回答
1138 浏览

python - 如何比较熊猫的频率/采样率?

有没有办法说 '13Min' 是 > '59S' 和 <'2H' 使用熊猫中的频率符号?

0 投票
3 回答
9285 浏览

machine-learning - 我怎么知道训练数据足以用于机器学习

例如:如果我想训练一个分类器(可能是 SVM),我需要收集多少样本?有没有测量方法?

0 投票
1 回答
120 浏览

bigdata - 寻找大而复杂的样本数据

我想对一些(图形)数据库进行基准测试并寻找一些大而复杂的数据集。数据集的大小应介于 2 TB 和 5 TB 之间。你知道任何满足这些标准的样本数据集(可能是开放的政府数据或科学数据)吗?

0 投票
2 回答
128 浏览

mysql - mysql全文的示例数据库

我需要一个示例数据库转储来测试 mysql 全文搜索功能的性能。我需要大约 1-10 百万行。

这可以在任何地方使用吗?如果没有,生成此数据库的最简单方法是什么。

0 投票
1 回答
1687 浏览

r - 在 R 中创建一个样本矩阵

我有一个概率分布 X,我想创建 100 个观察的样本:我sample(X,size=100,replace=TRUE)想在 100,1000,10000 个样本上绘制样本均值 PDF,所以我尝试使用创建观察矩阵,matrix(sample(X,size=100,replace=TRUE),nrow=100,ncol=100)但它会生成相同的所有列中的样本。关于如何为每列创建新样本的任何想法?

0 投票
1 回答
1089 浏览

matlab - 如何在 MATLAB 中从样本集中查找 PDF

我有一些来自未知来源的观察。这组观察值是 x,例如:

如果 x 足够大,我应该可以说一下概率分布函数,对吧?

那么我怎样才能在 MATLAB 中做到这一点,这样我才能得到p(x = 101)or p(x = 5)?第一个可能会非常高。

任何类型的假设(正态分布等)都可以,我只想要一个简单的概率答案。也许我不必明确知道PDF,我只需要一种实现方式p(x = x_star),其中x_star不一定是x的成员。我怎样才能做到这一点?

谢谢你的帮助 !

我的尝试

最简单的尝试是length(find(x==x_star))/length(x),但是如果例如101观察中没有,则返回零。然而,从分布来看,它应该是一个很高的概率。

编辑 :

根据 Kamtal 的回答,我的功能:

p返回[]。我在哪里做错了?

0 投票
1 回答
1399 浏览

sql - 将 SQL 文件转换为 XML 以在 wordpress 中上传示例数据

我已经为我的 wordpress 博客下载了我的 SQL 文件。我需要将其打包为 .xml 格式,以便博客的新用户可以通过管理 > 工具 > 部分简单地上传示例内容。

我不希望他/她导入 SQL 文件。上传 .xml 文件更容易。我该怎么做才能将 sql t .xml 转换为 wordpress?

提前致谢。

0 投票
3 回答
88 浏览

r - 从这五个类别的总体中可以抽取多少两个类别的样本?

我想从 5 个不同的类中找到两个类的所有可能样本。我正在尝试这个:

但我认为它没有给我所有可能样本的数量是错误的