我有一个由单个整数标识的单个向量 itemlist 文件中的项目列表。我也有每个项目的元数据。在这种情况下,该项目是 Amazon.com 上的一本书,元数据位于下面列出的各种属性中。对于我的项目列表中的每本书,我想获得它的标题、组、销售排名和其他一些。元数据包含其他组的数据,例如 DVD,但我不需要这些数据并想跳过它们。在元数据文件中,每个项目及其属性都以“ID:”开头,并以空行结束。我在 R 中尝试了一堆工具,但没有取得多大成功。并希望有人可以提供帮助。
这是元数据文件的摘录,适用于 2 本书(ID:9 和 ID:10)。
Id: 9
ASIN: 1859677800
title: Making Bread: The Taste of Traditional Home-Baking
group: Book
salesrank: 949166
similar: 0
categories: 1
|Books[283155]|Subjects[1000]|Cooking, Food & Wine[6]|Baking[4196]|Bread[4197]
reviews: total: 0 downloaded: 0 avg rating: 0
Id: 10
ASIN: 0375709363
title: The Edward Said Reader
group: Book
salesrank: 220379
similar: 5 039474067X 0679730672 0679750541 1400030668 0896086704
categories: 3
|Books[283155]|Subjects[1000]|Literature & Fiction[17]|History & Criticism[10204]|Criticism & Theory[10207]|General[10213]
|Books[283155]|Subjects[1000]|Nonfiction[53]|Politics[11079]|History & Theory[11086]
|Books[283155]|Subjects[1000]|Nonfiction[53]|Social Sciences[11232]|Anthropology[11233]|Cultural[11235]
reviews: total: 6 downloaded: 6 avg rating: 4
2000-10-8 cutomer: A2RI73IFW2GWU1 rating: 4 votes: 12 helpful: 7
2001-5-4 cutomer: A1GE54WF2WUZ2X rating: 5 votes: 11 helpful: 8
2001-8-27 cutomer: A36S399V1VC4DR rating: 4 votes: 5 helpful: 3
2002-1-26 cutomer: A280GY5UVUS2QH rating: 3 votes: 12 helpful: 7
2004-4-7 cutomer: A2YHZJIU4L4IOI rating: 4 votes: 10 helpful: 2
2004-4-27 cutomer: A1MB83EO48TRSC rating: 4 votes: 5 helpful: 3