问题标签 [frequency-distribution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R识别频率分布的类型
我对非正态分布的频率分布感兴趣。如果我有一个非正态分布的频率分布表。是否有可以为我识别分发类型的功能或包?
frequency-distribution - WinBUGS - 定义离散逐步分布
我想在我的模型中定义一个分布形式:P(x=10)=0.10, P(x=15)=0.20, P(x=20)=0.70
WinBUGS FAQ 说可以将我自己的离散均匀分布构造为具有统一先验的分类变量,并且可以采用必要的整数值。请参阅手册第一部分中的 blockerht 示例。
我查了这个例子,我认为是这个:“具有未知自由度的分层 t 分布”
在模型规范中,他们执行以下操作:
它确实定义了一个离散的制服。但我不知道如何获得我需要的表格。谁能帮我?
r - R中名义变量的排序频率分布
我已经搜索了该网站,但无法找到解决我的问题的方法。我有一个示例数据集,如下所示:
id 是一个名义变量,代表一个唯一用户,另一个是计数变量。
我想要的是按用户找出 l1 的分布。因此,查看我给定的数据集,id=1 的总数为 l1 = 8;id = 2 的总数为 l1 = 9,id=3 的总数为 l1 = 12。
我试图根据 id 找出 l1 的分布,但我被卡住了。我无法弄清楚如何将相关列组合在一起,然后找到分布或至少构建直方图。我可以用一个变量构造一个直方图,但我不能用一个名义变量构造一个排序的频率分布。
statistics - SAS: relating variables
I'm very new to both SAS and statistical analysis in general. I have a degree in computer science and I'm taking an online course in statistics and am confused on how to achieve what I want in SAS. I have searched online to no avail but am probably not even using the right terminology since I don't really know SAS or stats very well.
Basically, I have a few variables in a dataset and I want to display them conditionally in frequency tables.
For example, let's say I have the variables Gender, Age and Alcohol_use. What I want to do is have a frequency table or tables that basically relate gender and age to alcohol use. So, I want to break it down by gender and age at the same time, if that makes sense. One example would be:
Male, 21-25 -> Moderate Use
Female, 21-25 -> Low Use
Male, 26-30 -> Heavy Use
etc...
So, I guess I want to have frequency tables for the third variable on certain conditions of the first two variables, if that makes sense.
Normally, when displaying frequency tables, I just write PROC FREQ; TABLES Gender Age Alcohol_use;
Would I be changing anything there, since it is the frequency table that is affected? Or do I need to add some conditions in the data section of the program?
Any help would be great. Please let me know if you need any clarification on my question. Thanks!
r - R中的频率分布
我有五列数字。我想在 R 中用不同颜色绘制一张图中五列的频率分布。有人可以通过一个例子帮助我如何做到这一点。我对 R 很陌生。
r - R:频率/密度图中奇怪的 y 轴(ggplot2)
我有来自两个样本的数据,我想在 R 中绘制频率分布图。我在 Excel 中完成了参考:
我在 R 中上传了数据(HistSerp)。是136 obs. of 2 variables
。
如果我HistSerp.m <- melt(HistSerp)
和ggplot(HistSerp.m) + geom_freqpoly(aes(x = value,
y = ..density.., colour = variable))
情节看起来:
我不知道为什么 y 轴跨越该值,并且我不确定这是否只是 y 轴标签问题,情节本身似乎不同。我也尝试过geom_density()
,hist(HistSerp$V1, freq=FALSE)
等,但我无法达到我的预期,我得到的和以前一样。我想我的数据有问题,但我不知道是什么。任何帮助将不胜感激。
谢谢
附言。我应该复制数据(136x2)吗?
更新:数据。对不起,如果有更好的方法来复制它...
r - 计算大型数据集 R 的托管索引
我有一个复杂的多部分问题。如果我没有说清楚,我很抱歉。我也是一个相当新手的 R 用户,如果这看起来很简陋,请原谅我。我想计算鲸鱼潜水数据和猎物分布数据的托管指数。这需要:
- 通过从猎物(鱼和动物)数据中潜水到深度箱中计算鲸鱼潜水深度数据的频率分布。
- 对于每次潜水,计算重心 (CG) 和惯性 (I)。
- 对于每次潜水,计算一个全球托管指数 (GIC) 与每种猎物类型。
我希望能够编写一个函数(或一系列函数),这样我就不必通过潜水来分离我的数据并手动为每次潜水重新运行函数。
鲸鱼数据示例,如果潜水次数(有时 40 次以上潜水),潜水等于深度,分类与潜水类型有关。[IMG] http://i41.tinypic.com/33vc5rs.jpg[/IMG]
深度箱来自包含猎物信息的单独数据集:
我有以下代码可用于整个潜水数据,但需要编写一个循环或包含一个应用函数,以便我可以为单个文件中包含的每次潜水的数据运行此代码。所以,对于 40 次潜水的鲸鱼,我需要 40 次鲸鱼频率、40 次鲸鱼 CG、40 次鲸鱼 Is 等。每次潜水的猎物分布都是相同的!最终,我想要一个包含增量 GIC 值列表的表。
更新我已经粘贴了猎物和鲸鱼潜水的示例数据。
猎物数据
鲸鱼数据:
sql - 在 SQL 中计算相对频率
我正在开发一个标签推荐系统,该系统采用对象的元数据字符串(例如文本描述),并将其拆分为 1-、2-和 3-gram。
该系统的数据保存在 3 个表中:
- “对象”表(例如正在描述的内容),
- “token”表,填充了所有找到的 1-、2-和 3-grams(下面的示例),以及
- “映射”表,它维护 (1) 和 (2) 之间的关联,以及这些出现的频率计数。
因此,我能够通过 LEFT JOIN 构造一个表,看起来有点像这样:
现在我希望能够在单个对象 ID 的上下文中获得每个术语的相对概率,以便我可以按概率对它们进行排序,并查看哪些术语最有可能(例如ORDER BY rel_prob DESC LIMIT 25
)
对于每一行,我设想添加一列,其结果为freq/sum of all freqs for that given token_size
. 例如,在“大”的情况下,那将是1/(1+3) = 0.25
. 对于“a”,就是1/3 = 0.333
等。
对于我的一生,我无法弄清楚如何做到这一点。任何帮助是极大的赞赏!
r - R:如何按每个日期和小时获取频率计数
我有一个包含四个变量的数据框:“Period”、“cell_id”、“daterank”和“timerank”。我想按各个时期获得每个日期和每个小时的单元格 id 的频率(有 115 个唯一级别(或 cell_id 的))。“Period”是个人(5 个人)的数字标识符 “daterank” 具有值 0-29 “timerank” 具有值 1-24 “cell_id”是空间网格(在地图上)内的单元格的数字标识符。示例值为 101,102,103,104,105,201..205,2401..2405。
到目前为止,我能想到的唯一方法是:
有没有办法我可以通过“Period”获取每个“daterank”和每个“timerank”的“cell_id”频率,而无需手动更改 daterank 和 timerank 值输入?
excel - 当名字和姓氏在excel的差异列中时如何获取频率计数
我有一个 Excel 2010 工作簿,其中一行用于姓氏,一行用于名字。大约有 1800 个条目。
同一个人(名字和姓氏)可以出现多次——jim simith 出现 5 次。我想计算 jim simth 在列表中出现的次数。
我用过=COUNTIF($B$2:$B$1800,B2)
,B
姓氏在哪里。问题是列表中还有其他史密斯被计算在内,因为名字在单独的列中。有谁知道我如何对每个姓氏相同的人进行频率计数?