我有一个入藏号列表,我需要从中系统地提取相关信息。我发现该rentrez
软件包至少可以使用 R 和该rentrez
软件包获取此信息。问题是我似乎无法以一种易于提取信息的格式获取数据。entrez_fetch
使用以下代码时,该函数应该检索信息并将其解析为 R 数据帧:
data <- entrez_fetch(db = "nucleotide", id = "AB022765.1", rettype="native", parsed = TRUE)
但我收到以下错误:Error: XML content does not seem to be XML:
我还尝试使用XML
包将数据转换为数据帧:
data <- entrez_fetch(db = "nucleotide", id = "AB022765.1", rettype="native")
doc <- xmlToDataFrame(test)
但我仍然得到同样的错误。有没有人对我如何解决这个问题有任何建议。例如,我想从核苷酸数据库上的特定登录号中提取“菌株”名称。
谢谢!