问题标签 [data-management]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 根据一个因素改变变量的值
我有一个如下所示的数据集:
头
尾巴:
我想根据 A 更改数据中 T 的值。数据的范围为 0.1-181,间隔为 0.1 对于每个 A,T 并不总是从 0.1 开始,这就是我想要做的。(所以每当 A 改变时,T 总是从 0.1 开始)。我先尝试使 T=0 :
然后我尝试使用 sapply 但惨遭失败。任何帮助都会很棒。
谢谢
r - 如何创建变量得分最低的一位患者观察的数据框子集
您好,我有一个包含多个患者的数据集,每个患者都有多个观察结果。
我想为每位患者选择最早的观察结果。
pt_visit 变量是观察时患者在研究中的月数。我需要的是根据 pt_visit 列中的最低月数从每个患者那里进行的第一次观察。但是,我需要对每个患者 ID 进行最早的观察。
我想要的结果:
r - R 数据帧操作
我有一个包含约 1 百万行和 8 个列(变量)的大型数据集。其中一个变量 ORDER 的类别从 1 到 90。我想创建一个新的 data.frame,减少变量 ORDER (4) 1、2、3+ 和 ALL 的类别,其中 ALL 是总和所有类别 (1-90) 和 3+ 的频率是类别 >=3 的频率之和(所以 3 到 90)。
我对 R 的数据管理非常陌生,因此非常感谢您对这个问题的任何帮助!
这是data.frame的示例
r - 在 R 中将列联表(.csv 格式)导入为“表”而不是“data.frame”
我正在使用(我认为)公开可用的非常酷的泰坦尼克号数据。
将其导入 R 有两种主要方法:
(1) 您可以使用内置数据集 Titanic
( library(datasets)
) 或
(2) 您可以将其下载为.csv 文件,例如此处。
现在,数据是聚合频率数据。我想将多维列联表转换为单个级别的数据框。
问题:如果我使用内置数据集,这没问题;但是,如果我使用导入的 .csv 文件,它就不起作用。这是我收到的错误消息:
rep(1:nrow(tablevars), counts) 中的错误:无效的“次”参数此外:警告消息:在 expand.table(Titanic.table) 中:强制引入的 NA
为什么?我做错了什么?非常感谢。
代码
r - R中特定时间点序列的子集,我可以使用seq吗?
我有一个看起来像这样的数据框:
我想以 30 秒的间隔对 R 中的特定时间点进行子集化。我可以通过手动设置我想要的每个时间点来做到这一点:
我尝试使用sapply
和seq
函数进行子集化,但结果令人困惑。我还想计算每个数据子集中的唯一 A 。我也知道我可以使用 package.json 中的count
函数来做到这一点plyr
。
但是 count 将使用一个数据框而不是多个数据框(如果我错了,请纠正我)。我还想为每个子集采用 thetadeg 的方法(这应该很容易在一个数据帧中应用)。因此,我需要有关如何编写具有特定 seq 点的函数的帮助。
我知道这个问题是微不足道的,但我们将不胜感激。
谢谢
linux - 不同文件类型的部分文件重命名
很抱歉,如果这与通常的问题相比非常简单,但我才刚刚开始。我有一些文件都具有相同的起始名称但文件类型不同,例如:
我想重命名这些的第一部分,同时保留任何结尾和文件类型,例如:
我试过使用
和
但没有运气!我还阅读了所有其他 SO 文章,虽然我可以使用循环,但大多数取决于文件类型是否相同。
提前致谢
python - 在同一个数据库表中管理多个用户群
我的团队正在开发一个 Django 项目。它将有一个管理小组来控制其下的几家公司。要将新公司添加到系统中,管理员将使用面板添加公司的域。这些域实际上将指向我们的系统。我们将通过 url 检测公司并根据该公司的域管理视图。例如:我们将展示该公司下的用户,进行该公司下的交易等等。公司的所有信息,如用户信息、公司详细信息和成员都将存储在我们项目的主数据库中。用户将使用他们的电子邮件登录。因此,我们无法使用 Django 的身份验证模型使数据库中的电子邮件字段(或用户名)唯一,因为电子邮件用户可以在不知情的情况下注册到多个不同的公司。
我们正在寻找答案的问题:
为用户设置一个随机用户名,但是我们在 syncdb 之后在命令行上创建超级用户时遇到了一个问题,因为第一个参数将是使用 USERNAME_FIELD 定义的参数。如何处理这个独特的用户名字段问题?
为每个公司创建不同的用户表。如果是这样,如何自动执行此操作?
android - Android - 将字符串写入文件
我从Android 开发者页面获取了这段代码,但代码不起作用。我环顾四周,但似乎没有人给出明确的答案。
“openFileOutput”显然是未定义的。我如何编写代码以使其写入文件并且不会编译失败?
这是我的完整代码(如果有帮助的话)
}
r - 按变量(不同长度的因子)拆分数据框
我有一个数据框(st1),我按一个因子拆分。然后,我通过另一个因素对拆分数据(即均值)执行了函数,因此,我不能再执行 unsplit 了,因为我的原始数据帧现在的长度不同。
至于引导你完成我所做的,这里有一个代码:
st1的负责人:
结构(列表(A = c(25L, 25L, 25L, 25L, 25L, 25L), T = 56:61, X = c(481.07, 487.04, 490.03, 499, 504.97, 507.96), Y = c(256.97, 256.97, 256.97, 256.97, 256.97, 256.97), V = c(4.482, 5.976, 7.47, 4.482, 5.976, 7.47), thetarad = c(0.164031585831919, 0.169139558949956, 0.171661200692621, 0.179083242584008, 0.183907246800473, 0.186289411097781), thetadeg = c(9.39831757286096 , 9.69098287432395, 9.83546230358968, 10.2607139792383, 10.537109061132, 10.6735970214433), bin = structure(c(1L, 1L, 1L, 1L, 1L(", 1L), bin.Label", "", bin.Label "), class = "factor")), .Names = c("A", "T", "X", "Y", "V", "thetarad", "thetadeg", "bin"), 行.names = c(NA, 6L),类=“data.frame”)
我没有为我的 NT3 放置一个 dput(head),因为它太长了。
我尝试了 unsplit,unlist 但没有成功。我想要做的是再次拥有一个数据框,并将 bin 作为一个因素。
任何帮助都会很棒。
编辑:我希望我的数据框有 A、ang、len、Vm 和 bin 作为标题。
r - 从时间相关面板数据创建数字序列
所以我有一个数据集,其中有学生在课堂上的年份,以及他们在一年中的哪个季度,所以 2002 年是 4 次,它有季度 1、2、3、4,如下所示:
这给了我这个
我想生成一个序列,在该序列中创建一个累积季度数的新变量,如果必须合并年份和季度并不难,但是我如何告诉它执行类似的序列
给我这个
我已经尝试过代表命令和序列等,但我不知道如何告诉它在每个参与者之后重新开始编号。季度数因学生而异,我不需要知道他们从哪个季度开始,这是大学数据,所以我想他们可以从第 2 季度开始(我还没有查看所有关于起始值的整个数据集6K 左右的参与者)但我只需要它来累积。我希望这个问题是适当的,并且我正确地格式化了我的问题。