“data-management”的相关标签问题

0 投票

2 回答

733 浏览

r - 根据一个因素改变变量的值

我有一个如下所示的数据集：

头

尾巴：

我想根据 A 更改数据中 T 的值。数据的范围为 0.1-181，间隔为 0.1 对于每个 A，T 并不总是从 0.1 开始，这就是我想要做的。（所以每当 A 改变时，T 总是从 0.1 开始）。我先尝试使 T=0 ：

然后我尝试使用 sapply 但惨遭失败。任何帮助都会很棒。

谢谢

r data-management

2013-06-19T16:04:07.273

0 投票

4 回答

255 浏览

r - 如何创建变量得分最低的一位患者观察的数据框子集

您好，我有一个包含多个患者的数据集，每个患者都有多个观察结果。
我想为每位患者选择最早的观察结果。

pt_visit 变量是观察时患者在研究中的月数。我需要的是根据 pt_visit 列中的最低月数从每个患者那里进行的第一次观察。但是，我需要对每个患者 ID 进行最早的观察。

我想要的结果：

r dataframe data-management subset

2013-06-27T20:18:06.830

0 投票

1 回答

96 浏览

r - R 数据帧操作

我有一个包含约 1 百万行和 8 个列（变量）的大型数据集。其中一个变量 ORDER 的类别从 1 到 90。我想创建一个新的 data.frame，减少变量 ORDER (4) 1、2、3+ 和 ALL 的类别，其中 ALL 是总和所有类别 (1-90) 和 3+ 的频率是类别 >=3 的频率之和（所以 3 到 90）。

我对 R 的数据管理非常陌生，因此非常感谢您对这个问题的任何帮助！

这是data.frame的示例

r dataframe data-management

2013-10-09T14:50:07.660

0 投票

1 回答

2389 浏览

r - 在 R 中将列联表（.csv 格式）导入为“表”而不是“data.frame”

我正在使用（我认为）公开可用的非常酷的泰坦尼克号数据。

将其导入 R 有两种主要方法：

(1) 您可以使用内置数据集 Titanic( library(datasets)) 或

(2) 您可以将其下载为.csv 文件，例如此处。

现在，数据是聚合频率数据。我想将多维列联表转换为单个级别的数据框。

问题：如果我使用内置数据集，这没问题；但是，如果我使用导入的 .csv 文件，它就不起作用。这是我收到的错误消息：

rep(1:nrow(tablevars), counts) 中的错误：无效的“次”参数此外：警告消息：在 expand.table(Titanic.table) 中：强制引入的 NA

为什么？我做错了什么？非常感谢。

代码

r csv data-management

2013-10-09T23:19:55.697

0 投票

4 回答

1053 浏览

r - R中特定时间点序列的子集，我可以使用seq吗？

我有一个看起来像这样的数据框：

我想以 30 秒的间隔对 R 中的特定时间点进行子集化。我可以通过手动设置我想要的每个时间点来做到这一点：

我尝试使用sapply和seq函数进行子集化，但结果令人困惑。我还想计算每个数据子集中的唯一 A 。我也知道我可以使用 package.json 中的count函数来做到这一点plyr。

但是 count 将使用一个数据框而不是多个数据框（如果我错了，请纠正我）。我还想为每个子集采用 thetadeg 的方法（这应该很容易在一个数据帧中应用）。因此，我需要有关如何编写具有特定 seq 点的函数的帮助。

我知道这个问题是微不足道的，但我们将不胜感激。

谢谢

r subset data-management

2013-11-14T16:30:06.217

0 投票

4 回答

347 浏览

linux - 不同文件类型的部分文件重命名

很抱歉，如果这与通常的问题相比非常简单，但我才刚刚开始。我有一些文件都具有相同的起始名称但文件类型不同，例如：

我想重命名这些的第一部分，同时保留任何结尾和文件类型，例如：

我试过使用

和

但没有运气！我还阅读了所有其他 SO 文章，虽然我可以使用循环，但大多数取决于文件类型是否相同。

提前致谢

linux bash rename mv data-management

2013-11-29T10:04:55.737

0 投票

1 回答

279 浏览

我的团队正在开发一个 Django 项目。它将有一个管理小组来控制其下的几家公司。要将新公司添加到系统中，管理员将使用面板添加公司的域。这些域实际上将指向我们的系统。我们将通过 url 检测公司并根据该公司的域管理视图。例如：我们将展示该公司下的用户，进行该公司下的交易等等。公司的所有信息，如用户信息、公司详细信息和成员都将存储在我们项目的主数据库中。用户将使用他们的电子邮件登录。因此，我们无法使用 Django 的身份验证模型使数据库中的电子邮件字段（或用户名）唯一，因为电子邮件用户可以在不知情的情况下注册到多个不同的公司。

我们正在寻找答案的问题：

为用户设置一个随机用户名，但是我们在 syncdb 之后在命令行上创建超级用户时遇到了一个问题，因为第一个参数将是使用 USERNAME_FIELD 定义的参数。如何处理这个独特的用户名字段问题？
为每个公司创建不同的用户表。如果是这样，如何自动执行此操作？

python database django administration data-management

2013-12-17T15:24:04.540

0 投票

1 回答

531 浏览

android - Android - 将字符串写入文件

我从Android 开发者页面获取了这段代码，但代码不起作用。我环顾四周，但似乎没有人给出明确的答案。

“openFileOutput”显然是未定义的。我如何编写代码以使其写入文件并且不会编译失败？

这是我的完整代码（如果有帮助的话）

}

android storage fileoutputstream data-management

2014-01-12T17:29:24.067

0 投票

2 回答

107 浏览

r - 按变量（不同长度的因子）拆分数据框

我有一个数据框（st1），我按一个因子拆分。然后，我通过另一个因素对拆分数据（即均值）执行了函数，因此，我不能再执行 unsplit 了，因为我的原始数据帧现在的长度不同。

至于引导你完成我所做的，这里有一个代码：

st1的负责人：

结构(列表(A = c(25L, 25L, 25L, 25L, 25L, 25L), T = 56:61, X = c(481.07, 487.04, 490.03, 499, 504.97, 507.96), Y = c(256.97, 256.97, 256.97, 256.97, 256.97, 256.97), V = c(4.482, 5.976, 7.47, 4.482, 5.976, 7.47), thetarad = c(0.164031585831919, 0.169139558949956, 0.171661200692621, 0.179083242584008, 0.183907246800473, 0.186289411097781), thetadeg = c(9.39831757286096 , 9.69098287432395, 9.83546230358968, 10.2607139792383, 10.537109061132, 10.6735970214433), bin = structure(c(1L, 1L, 1L, 1L, 1L(", 1L), bin.Label", "", bin.Label "), class = "factor")), .Names = c("A", "T", "X", "Y", "V", "thetarad", "thetadeg", "bin"), 行.names = c(NA, 6L),类=“data.frame”）

我没有为我的 NT3 放置一个 dput(head)，因为它太长了。

我尝试了 unsplit，unlist 但没有成功。我想要做的是再次拥有一个数据框，并将 bin 作为一个因素。

任何帮助都会很棒。

编辑：我希望我的数据框有 A、ang、len、Vm 和 bin 作为标题。

r matrix dataframe data-management

2014-01-30T22:10:07.293

0 投票

1 回答

122 浏览

r - 从时间相关面板数据创建数字序列

所以我有一个数据集，其中有学生在课堂上的年份，以及他们在一年中的哪个季度，所以 2002 年是 4 次，它有季度 1、2、3、4，如下所示：

这给了我这个

我想生成一个序列，在该序列中创建一个累积季度数的新变量，如果必须合并年份和季度并不难，但是我如何告诉它执行类似的序列

给我这个

我已经尝试过代表命令和序列等，但我不知道如何告诉它在每个参与者之后重新开始编号。季度数因学生而异，我不需要知道他们从哪个季度开始，这是大学数据，所以我想他们可以从第 2 季度开始（我还没有查看所有关于起始值的整个数据集6K 左右的参与者）但我只需要它来累积。我希望这个问题是适当的，并且我正确地格式化了我的问题。

r data-management panel-data

2014-02-08T10:27:38.223

问题标签 [data-management]

r - 根据一个因素改变变量的值

r - 如何创建变量得分最低的一位患者观察的数据框子集

r - R 数据帧操作

r - 在 R 中将列联表（.csv 格式）导入为“表”而不是“data.frame”

r - R中特定时间点序列的子集，我可以使用seq吗？

linux - 不同文件类型的部分文件重命名

python - 在同一个数据库表中管理多个用户群

android - Android - 将字符串写入文件

r - 按变量（不同长度的因子）拆分数据框

r - 从时间相关面板数据创建数字序列

问题标签 [data-management]

Reference