1

背景

我有一个非常好的关于 ALS 的数据集,我需要访问它,这样我就可以测试一些非常有趣的机器学习方法。问题是数据集的支持很差,我在处理复杂的数据结构或 R 中的 JSON 时缺乏经验

我需要的

如果有人可以通过实际的 R 代码示例(最好使用 RJSON 或 rjsonio)帮助我了解我应该如何访问代码,那就太好了。任何关于如何在 R 中使用 JSON 的基本教程/描述也将不胜感激,因为 JSON.org 更适合有编程经验的人使用它来编写 AJAX/SQL 应用程序。

显示我的具体问题的数据(字典文件和文本文件中的数据) 我无法从字典文件中发布文本,所以这里是 Flrickr http://flic.kr/p/cSNbpm上发布的屏幕截图

实际数据有几千行,但看起来像这样:

649|144|Demographics|5AC60165-78AA-4E1D-8CCF-F1A21B944A8B|1203|Demographics Delta|0
649|144|Demographics|5AC60165-78AA-4E1D-8CCF-F1A21B944A8B|1204|Ethnicity| 
649|144|Demographics|5AC60165-78AA-4E1D-8CCF-F1A21B944A8B|1207|Race - Asian|
649|144|Demographics|5AC60165-78AA-4E1D-8CCF-F1A21B944A8B|1208|Race - Black/African American|
649|144|Demographics|5AC60165-78AA-4E1D-8CCF-F1A21B944A8B|1211|Race - Caucasian|1
649|144|Demographics|5AC60165-78AA-4E1D-8CCF-F1A21B944A8B|1257|Age|48
649|144|Demographics|5AC60165-78AA-4E1D-8CCF-F1A21B944A8B|1393|Race - Other|
649|145|ALSFRS(R)|B2F1F8AC-6BEA-483C-9BC8-F13C51ED6FFB|1213|1. Speech|3
649|145|ALSFRS(R)|B2F1F8AC-6BEA-483C-9BC8-F13C51ED6FFB|1214|10. Respiratory|4
649|145|ALSFRS(R)|B2F1F8AC-6BEA-483C-9BC8-F13C51ED6FFB|1215|2. Salivation|3
649|145|ALSFRS(R)|B2F1F8AC-6BEA-483C-9BC8-F13C51ED6FFB|1216|3. Swallowing|2
649|145|ALSFRS(R)|B2F1F8AC-6BEA-483C-9BC8-F13C51ED6FFB|1217|4. Handwriting|4
649|145|ALSFRS(R)|B2F1F8AC-6BEA-483C-9BC8-F13C51ED6FFB|1218|5a. Cutting without Gastrostomy|4

它似乎被分成几个不同的部分,所以进一步向下,一般结构被改变了几次

727029|146|Laboratory Data|67962337-62FA-42E3-9E22-1C36965088D6|1234|Laboratory Delta|448
727029|146|Laboratory Data|67962337-62FA-42E3-9E22-1C36965088D6|1250|Test Name|Urea
727029|146|Laboratory Data|67962337-62FA-42E3-9E22-1C36965088D6|1251|Test Result|4.50
727029|146|Laboratory Data|67962337-62FA-42E3-9E22-1C36965088D6|1252|Test Unit|mmol/L
727029|146|Laboratory Data|C2F387B2-00B5-4645-9B2A-03F43117C44B|1234|Laboratory Delta|448
4

1 回答 1

0

我建议在 CRAN 中使用rjson 包。

于 2013-02-20T20:57:14.867 回答