我正在尝试编写用于从标签的字符向量到正则表达式子组的字符向量的机器转换的函数,就像在下面的示例中一样,其中 lab 是标签的向量,而 pat 如上所述的明显结果是通过正则表达式组表征实验室内容。
我首先使用 adist 功能比较具有相同长度的字符串,但我认为我正在重新发明轮子。
是否有任何现有的包或功能处理?或者任何足够接近开始的东西?
在现实生活中,我的实验室对象的长度可能为 1k - 5k,并且特定标签可以包含任何描述。下面的一个被创建为一个展示。
lab <- c(
"Speed - unit 1",
"Speed - unit 2",
"Speed - unit 3",
"Speed - unit 4",
"Speed - unit 5",
"Layer A",
"Layer B",
"Layer Cx",
"Colour Left",
"Colour Right",
"Colour Up",
"Colour Down"
)
pat <- c(
"^Speed - unit .$",
"^Layer [ABCx]*$",
"^Colour .*"
)