r - 如何根据字符串的第一个和第三个字符过滤一列字符串？

Question

我有一个 ICD 代码数据集，5 位代码描述了医院患者的诊断，看起来像这样（但有 16000 名患者）：

df <- c('S48.10', 'H38.13', 'R40.12')

我需要根据第一个字符是 S 和第三个字符是 8 来过滤它们，以过滤掉截肢患者。关于如何做到这一点的任何建议？

score 0 · Accepted Answer

grepl这是ICD 列上的一个选项。使用的模式是“S”后跟任何字符 ( .)，后跟从字符串的开头 ( ^) 开始的 8，以过滤数据集的行

subset(df1, grepl('^S.8', ICD))

1 回答 1