也许是一个经常被问到的问题,我被皇室困在这里。
从 XML 文件中,我试图搜索所有出现、它们的行以及每个仅包含字母和数字(字面意思是字母数字)的 12 个字符串的出现总数。
例如:如果我的文件是xmlInput
,我正在尝试搜索并提取 12 个字符的 alpha-num 字符串的所有出现、位置和总数。
示例输出:
String Total Count Line-Num
CPXY180D2324 2 132,846
CPXY180D2131 1 372
CPCY180D2139 1 133
我知道,我可以用来regmatches
按模式获取所有出现的字符串。我一直在使用以下内容:(感谢您对此的帮助)。
ProNum12<-regmatches(xmlInput, regexpr("([A-Z0-9]{12})", xmlInput))
ProNum12
regmatches
给我所有遵循模式的匹配项。但它没有给我模式出现的行号。grep
给我所有出现的行号。
我以为我可以使用textcnt
库包,Tau
但无法正常运行。也许它不是正确的包?
R中是否有一个包/库将搜索与模式匹配的所有单词并返回每次出现的出现总数和行数?如果不存在这样的包装,知道如何使用上述任何一种或更好的方法来做到这一点吗?