问题标签 [r]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 R 的条形图中对 X 轴进行排序?
我已经合并了如下所示的数据:
如何绘制这些数据,以便将 bin 从左侧的最负值排序到右侧的最正值?目前我的图表看起来像这样。请注意,它根本没有排序。特别是第二个栏 ( value = 76
) 放置在第一个栏的右侧:
这是我用来绘图的命令:
math - 以 R 为重点学习应用统计学
我知道麻省理工学院和斯坦福大学已经在网上发布了许多关于他们课程的视频。有人知道应用统计学的课程(有在线视频)吗?
我一直在使用 R 并且该工具(从技术方面)非常简单。但是,在统计方面(回归、递归分区等),我一无所知。我已经阅读了一些应用统计学的课程描述,它似乎正是我正在寻找的课程类型。但是,如果有我可以在线观看的视频,我会更喜欢它(而不是试图找到当地的社区大学)。
有没有学习统计学的好视频?最好关注 R?
r - 在 R 中处理时间的最佳做法是什么?
我正在使用调查数据集。它有两个字符串vectors
,start
和finish
,分别表示采访开始和结束的时间。
它们是character
看起来像:"9:24 am"
、、"12:35 pm"
等等的字符串。我正在尝试根据这两个计算面试的持续时间。这样做的最佳方法是什么?
我知道,对于日期,有很多classe
s 或function
s,如as.date()
、as.Date()
、chron()
或as.POSIXct()
。所以我一直在寻找类似的东西as.time()
,但找不到。我是否应该只附加一个虚构的日期并将整个内容转换为POSIX()
date-time class
,然后使用difftime()
?
处理时间的最佳做法是R
什么?
r - 避免传递数据框的最佳方法是什么?
我有 12 data.frame
s 可以使用。它们是相似的,我必须对每一个都做同样的处理,所以我写了一个函数,它接受 a data.frame
,处理它,然后返回 a data.frame
。这行得通。但我担心我正在绕过一个非常大的结构。我可能正在制作临时副本(是吗?)这效率不高。避免绕过的最佳方法是什么data.frame
?
r - Y函数是什么?
我的一个朋友问我是否理解这个Y
功能。我什至不知道那是什么。? Y
没有让我到任何地方。
它是什么?
r - 如何从列表中删除元素?
我有一个列表,我想从中删除一个元素。我怎样才能做到这一点?
我已经尝试在参考手册中查找我认为该函数的明显名称,但我没有找到任何合适的名称。
r - 给定 X 轴的累积图
我有看起来像这样的数据。我想在其中绘制 dat1 相对于 x 轴的累积值。还将它与 dat2 一起绘制。
在 R 中的常用方法是什么?
我从 Hmisc 查看了 ECDF,它似乎没有做我想要的。特别是它不允许我们给出 x 轴值。
database - 列存储:比较基于列的数据库
我一直在努力将 SQL Server 变成某种东西,坦率地说,它永远不会。我的分析工作需要一个数据库引擎。DB 需要快速,并且不需要典型数据库(SQL Server、Oracle、DB2 等)中的所有日志记录和其他开销
昨天我在 Money:Tech 会议上听了Michael Stonebraker 的演讲,我一直在想,“我并不是真的疯了。有更好的方法!” 他谈到使用列存储而不是面向行的数据库。我访问了列商店的 Wikipedia 页面,看到了一些开源项目(我喜欢)和一些商业/开源项目(我不完全理解)。
我的问题是:在应用分析环境中,基于列的不同数据库有何不同?我应该怎么想他们?有人对基于多列的系统有实际经验吗?我可以利用我对这些数据库的 SQL 经验还是我必须学习一门新语言?
我最终会将数据提取到 R 中进行分析。
编辑:我被要求澄清我到底想要做什么。所以,这是我想做的一个例子:创建一个有 400 万行和 20 列的表(5 个维度,15 个事实)。创建 5 个聚合表,计算每个事实的最大值、最小值和平均值。将这 5 个聚合加入到起始表中。现在计算每行与平均值的百分比偏差、最小值的百分比偏差和最大值的百分比偏差,并将其添加到原始表中。此表数据不会每天都有新行,它会被完全替换并重复该过程。如果必须停止该过程,上天禁止。还有原木……哦,原木!:)
r - 计算矩阵的特征值有多昂贵?
计算矩阵的特征值有多昂贵?
最佳算法的复杂度是多少?
如果我有一个 1000 x 1000 的矩阵,实际需要多长时间?我认为如果矩阵稀疏会有帮助吗?
是否存在特征值计算不会终止的情况?
在R
中,我可以计算特征值,如下面的玩具示例所示:
有谁知道它使用什么算法?
是否有任何其他(开源)包可以计算特征值?