我正在尝试使用rentrez
包中的不同功能从 NCBI 中提取数据。但是,我有一个问题,因为extract_from_esummary()
rentrez 中的函数导致矩阵,其中列的文本在保存在.csv 文件中时被拆分为相邻的列(如图所示),因为“,”被识别为分隔符。
library (rentrez)
PM.ID <- c("25979833", "25667274","23792568","22435913")
p.data <- entrez_summary(db = "pubmed", id = PM.ID )
pubrecord.table <- extract_from_esummary(esummaries = p.data ,
elements = c("uid","title","fulljournalname",
"pubtype"))
从上面的图像示例中,在 Column PMID: 25979833 中,期刊名称拆分为延伸到下一列。European journal of cancer (Oxford
在第 1 列中,然后England : 1990)
在下一列中。当我做了一个dput(pubrecord.table)时,我明白分裂是因为单词是用逗号“,”分隔的。如何让 R 理解European journal of cancer (Oxford, England : 1990)
属于同一列的内容?Title 和 Pubtype 字段的类似问题......其中长文本之间有一个逗号,而 R 将其打破为 csv 格式。如何清理数据以使数据位于适当的列中?