问题标签 [sample-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - MatLab:从采样数据创建 3D 直方图
我在一个数组中采样了区间 [0,1] 中的数据transitions=zeros(101,101)
,我想将其绘制为 3D 直方图。transitions
填充了类似于此线程末尾提供的示例数据的数据。
第一列是指第一个观察变量X
,第二列是第二个变量Y
,第三列是归一化频率。即第一行:观察到的变量对的归一化频率(0,0)
为 0.9459。因此的归一化频率之和(0,Y)
为1
.
我尝试使用以下代码制作(某种)3D直方图:
但是,由于它是离散空间中A
的采样数据,因此输出如下图所示。这在某种程度上具有误导性,因为图中存在“间隙”(对于没有采样数据的坐标,z 值 = 0)。我宁愿将采样数据分配给它们相应的图,从而产生一个“真实的”3d 直方图。
顺便说一句,由于我创建A
x-、y- 和 z 比例的“hack”结果是不正确的。3D 直方图的轴(全部三个)应在 [0,1] 的区间内。
r - 按组替换重采样
这是我的第一篇文章,所以请多多包涵。下面是我的数据的一个小样本。我的实际数据集有超过 4,000 个单独的 ID,每个 ID 可以分配从一到两百美元不等的单独金额。
使用示例可以最好地解释我本质上想要做的事情。我想为每个 ID 生成五个带有替换的随机样本。每个样本的大小为 5 或 5 个随机抽样的美元值。我的最终结果将有 20,000 个单独的样本(5 个样本,每 4000 个 ID,每个包含 5 个按 ID 随机选择的美元金额)。我这样做是为了将每个样本中的美元分布与具有相同 ID 的其他样本进行比较。
截至目前,我正在尝试使用下面引用的代码来获得这样的答案。我还应该指出,当我运行这个脚本时,我收到一个错误,我的“结果必须全部是原子的”。我不确定是否需要添加其他步骤或什么。
如果我提出的问题不清楚,我很抱歉;我很难阐明我遇到的问题。
在此先感谢您的帮助
python - 如何比较熊猫的频率/采样率?
有没有办法说 '13Min' 是 > '59S' 和 <'2H' 使用熊猫中的频率符号?
machine-learning - 我怎么知道训练数据足以用于机器学习
例如:如果我想训练一个分类器(可能是 SVM),我需要收集多少样本?有没有测量方法?
bigdata - 寻找大而复杂的样本数据
我想对一些(图形)数据库进行基准测试并寻找一些大而复杂的数据集。数据集的大小应介于 2 TB 和 5 TB 之间。你知道任何满足这些标准的样本数据集(可能是开放的政府数据或科学数据)吗?
mysql - mysql全文的示例数据库
我需要一个示例数据库转储来测试 mysql 全文搜索功能的性能。我需要大约 1-10 百万行。
这可以在任何地方使用吗?如果没有,生成此数据库的最简单方法是什么。
r - 在 R 中创建一个样本矩阵
我有一个概率分布 X,我想创建 100 个观察的样本:我sample(X,size=100,replace=TRUE)
想在 100,1000,10000 个样本上绘制样本均值 PDF,所以我尝试使用创建观察矩阵,matrix(sample(X,size=100,replace=TRUE),nrow=100,ncol=100)
但它会生成相同的所有列中的样本。关于如何为每列创建新样本的任何想法?
matlab - 如何在 MATLAB 中从样本集中查找 PDF
我有一些来自未知来源的观察。这组观察值是 x,例如:
如果 x 足够大,我应该可以说一下概率分布函数,对吧?
那么我怎样才能在 MATLAB 中做到这一点,这样我才能得到p(x = 101)
or p(x = 5)
?第一个可能会非常高。
任何类型的假设(正态分布等)都可以,我只想要一个简单的概率答案。也许我不必明确知道PDF,我只需要一种实现方式p(x = x_star)
,其中x_star不一定是x的成员。我怎样才能做到这一点?
谢谢你的帮助 !
我的尝试
最简单的尝试是length(find(x==x_star))/length(x)
,但是如果例如101
观察中没有,则返回零。然而,从分布来看,它应该是一个很高的概率。
编辑 :
根据 Kamtal 的回答,我的功能:
p
返回[]
。我在哪里做错了?
sql - 将 SQL 文件转换为 XML 以在 wordpress 中上传示例数据
我已经为我的 wordpress 博客下载了我的 SQL 文件。我需要将其打包为 .xml 格式,以便博客的新用户可以通过管理 > 工具 > 部分简单地上传示例内容。
我不希望他/她导入 SQL 文件。上传 .xml 文件更容易。我该怎么做才能将 sql t .xml 转换为 wordpress?
提前致谢。
r - 从这五个类别的总体中可以抽取多少两个类别的样本?
我想从 5 个不同的类中找到两个类的所有可能样本。我正在尝试这个:
但我认为它没有给我所有可能样本的数量是错误的