我正在寻找 R 中的正则表达式来提取 .sdf 化学数据文件中给出的字段。在这种情况下,字段由 < > 分隔,并在行首跟在“>”之后。例如,在
string="> <FIELD1>\nfield text1\n\n> <FIELD2>\nfield text2\n\n> <FIELD3>field text3"
它必须返回
fields=c("FIELD1","FIELD2","FIELD3")
(它们可能会出现多次,所以我只需要unique()
那些)有什么想法吗?
干杯,汤姆