我即将开始一个简短的项目,该项目将涉及合理数量的数据,我希望以合理的方式存储这些数据 - 最好是 postgressql 数据库。
我将简要介绍一下这项任务。我将处理和分析一系列图像的数据,每个图像都有一个唯一的 ID。对于每张图像,我自己和其他操作员将完成一些简单的图像处理任务,包括调整角度和放置区域,最终结果是许多定量参数 - 例如均值、方差等。我们预计这些措施将存在操作员内部和操作员之间的可变性这是我想分析的。
我最初的计划是按以下方式存储数据
ID Operator Attempt Date Result1 Result2 Reconstruction Method Iterations
1 AB 1 01/01/13 x x FBP
1 AB 2 01/01/13 x x FBP
1 CD 1 01/01/13 x x FBP
1 CD 2 01/01/13 x x FBP
2 AB 1 01/01/13 x x FBP
2 AB 2 01/01/13 x x FBP
2 CD 1 01/01/13 x x FBP
2 CD 2 01/01/13 x x FBP
1 AB 1 11/01/13 x x FBP
1 AB 2 01/01/13 x x MLEM
现在我想比较(使用相关性和 Bland Altman 图)是同一操作员处理相同图像(图像必须具有相同的 ID、日期、重建技术)的所有操作员的结果差异。即对于所有相同的图像和操作员,尝试 1 和 2 有何不同。我想对互操作者的可变性进行相同的分析,即对于使用 FBP 重建的所有图像,AB 与 ID 1 的 CD 相比如何,或者对于使用 MLEM 重建的所有图像,与 AB 相比如何。不应比较具有相同唯一 ID 但在不同日期或重建技术获取的图像,因为它们将包含差异而不是操作员的可变性。
我有各种 R 脚本来进行分析,但我不确定如何访问我的数据并以合理的格式排列数据以进行分析,或者我计划的存储方法是否最适合这样做。过去我使用 perl 访问数据库并提取数字,但我最近发现 Rpostgressql 可能更合适。
我想我的问题是,对于这样的数据库,我该如何挑选:
(a) 所有唯一图像(ID,在同一日期使用相同的重建方法获取)并比较操作员 AB(CD 等)在尝试 1 和 2 的所有结果 1 中的差异
(b) 同样的事情比较 AB 和 CD、CD 和 EF 等之间的所有 Result1 尝试 1
这是我想要的输出示例(a)
ID Operator Date Result1 (Attempt 1) Result1(Attempt 2)
1 AB 01/01/13 10 12
2 AB 01/01/13 22 21
3 AB 03/01/13 15 17
4 AB 04/01/13 27 25
5 AB 06/01/13 14 12
1 AB 11/01/13 3 6
然后我会分析最后两列
(b) 比较 AB 和 CD 的示例输出
ID Date Result1 (Op: AB, Att: 1) Result1(Op: CD: Att 1)
1 01/01/13 10 12
2 01/01/13 22 21
3 05/01/13 12 14
1 11/01/13 19 24