Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个 ICD 代码数据集,5 位代码描述了医院患者的诊断,看起来像这样(但有 16000 名患者):
df <- c('S48.10', 'H38.13', 'R40.12')
我需要根据第一个字符是 S 和第三个字符是 8 来过滤它们,以过滤掉截肢患者。关于如何做到这一点的任何建议?
grepl这是ICD 列上的一个选项。使用的模式是“S”后跟任何字符 ( .),后跟从字符串的开头 ( ^) 开始的 8,以过滤数据集的行
grepl
.
^
subset(df1, grepl('^S.8', ICD))