问题标签 [data-management]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
143 浏览

ios - UITableView setter 方法函数未被调用

像这样的功能:

没有被调用,因为日志没有出现在控制台上。我尝试使用

但它仍然不起作用

0 投票
2 回答
96 浏览

ios - 我应该使用数组还是数据库 - 以及在哪里初始化它?

我目前正在使用适用于 iOS 的 Mapbox SDK,并遇到了有关一般数据管理的问题。

我得到了一个带有坐标和其他一些属性的表格,表格大约有 600 到 700 行。现在我想知道在我的应用程序中存储和初始化这些数据的最佳方式是什么?第二个问题,我应该在哪里初始化这些数据?

问题 #1:我应该将所有数据放入代码中并用它初始化一个数组吗?还是创建一个本地数据库并从那里查询数据会更好?还是其他文件格式?问题 #2:我应该在 appDelegate 中初始化数据/连接到数据库吗?或者在哪里做这个最好的地方?

0 投票
0 回答
734 浏览

database - HDF5 与数据库最佳实践

我正在尝试建立一个系统来组织包含在大量 HDF5 文件中的数据。从我所读到的,似乎满足我需要的最简单的方法是创建一个 SQLite 数据库,其中包含文件的路径及其顶级元数据。

由于我对数据库没有太多经验,所以我想知道维护这样一个数据库(将由大约五个其他人使用)的最佳实践是什么。我是否应该简单地编写一个每次将文件添加到数据库时都会运行的脚本,将 HDF5 元数据复制到 SQLite 表中?任何建议将不胜感激。

我还想知道这是否通常是如何使用 HDF5 文件的,或者将所有数据放在单个 HDF5 文件中代替数据库是否很常见。

0 投票
1 回答
79 浏览

r - R coding for selecting subset with criterion "if any of the following condition is true, then select row x"

I'm choosing observations to be included in a subset of a larger data set

R code:

How could I select the subset of the data that contains only observations having one "1" in any given column (in this case I should end up selecting rows 2 and 5)?

0 投票
1 回答
67 浏览

sed - 将第二个实例替换为一个字符

我有一个包含几千行的文件,看起来像这样:

我需要在整个文档中用空格替换第二个“:”。通常我会用一些简单的东西来做到这一点:

但这当然会替换两个冒号。我不确定如何仅指定替换第二个冒号。有什么建议么?

0 投票
1 回答
606 浏览

makefile - 制作检查现有文件年龄的虚拟目标?

我正在使用 make 来控制统计分析中的数据流。如果将我的原始数据放在一个目录./data/raw_data_files中,并且我有一个数据操作脚本,可以在./cache/clean_data. make 规则类似于:

我不想./data/使用 make 或我的任何数据修改脚本来触摸 中的数据。make 有什么方法可以为 cache/clean_data 创建一个依赖项,它只检查特定文件是否./data/比上次 make 运行时更新?

0 投票
2 回答
26 浏览

java - 内存中的数据操作

我知道在内存而不是文件中操作数据总是更好。目前,我将所有传入数据放在一个静态 ArrayList 中,当该 ArrayList 有超过 80 个条目时,我的程序会将这个 ArrayList 的内容保存到一个文件中,并为下一波传入数据清理这个数组。

我想知道使用 Vector 而不是 ArrayList 是否更好(或更糟)。如果有区别,哪个更好/更差?在什么情况下?

这是我的相关代码:

PS这种方法目前效果很好,我只是想知道在这种情况下使用向量是否会更好。此外,如果您发现任何不良设计,请随时指出。谢谢!

0 投票
3 回答
4032 浏览

r - r - 如何在每组中选择不同数量的观察值

我对 r(来自 sas)比较陌生,我需要在每个组中选择不同数量的观察值。组由两个变量的值标识

我试过(来自问题“为 R 中的每个级别选择前 80 个观察值”)

这使

错误:长度(n)== 1L 不是 TRUE

这对专家来说可能是一个明显的错误(na scalar, NumObs a vector?)

从同一个问题,我试过:

这使

错误:长度(n)== 1L 不正确。另外:警告消息:在 split.default(x = seq_len(nrow(x)), f = f, drop = drop, ...) 中:数据长度不是拆分变量的倍数

所以,和以前一样的错误,加上多个东西,如果组的长度不同,我不能使用拆分?

然后我发现了“按组观察编号”的问题,我无法使 rle/sequence 答案在我的情况下起作用,但调整了 ddply 答案:

哪个有效。

显然我的真实数据要大得多,那么有没有更好的替代方法?谢谢!

0 投票
2 回答
48 浏览

objective-c - UITableView 删除和添加行

我有一个 NSMutableArray 包含序列号 1,2...,n 并有一个 UITableView 显示单元格垂直升序并按顺序显示。我将如何在视觉上和数据中以及在 NSMutableArray 中删除 1 和 n 之间的 m 行,然后将数据中已删除单元格之后的所有单元格的值减 1,并且在视觉上如此firstResponder 不会像 reloadData 方法调用那样放弃控制权?

我将如何删除第 3 行,然后将第 4 行和第 5 行分别变为 3 和 4?

0 投票
2 回答
362 浏览

r - 选择具有唯一对的多行,并为所有可能的对导出随机选择

我正在处理一个非常大的数据集,并且遇到了一个我以前从未遇到过的独特问题。这是与 GPS 点配对的雷达数据。通过雷达处理,我在数据点之间进行插值以平滑雷达图像以选择视野。导出后,我现在每个实际点都有多个点(注意重复的经纬度条目)。这是该插值的产物,而不是真实数据。我想做的是为每对唯一的经纬度选择一个条目,然后将其粘贴到一个新的数据框中。我还没有决定是要平均时间还是随机选择,但是我在尝试配对独特的配对时还没有成功。我的困境是每列中有大约 4000 个唯一值,所以一个简单的 for 循环似乎不适合我的需要。下面是我的数据顶部的示例。

我精通 Matlab 和 R。所以无论哪种提供更简单的解决方案,我都可以。

TL;DR:选择每个分组的纬度和经度对,并将该组的单个条目导出到新文件