我需要从一段文本中提取 3 个字段。我有一个正则表达式,可以提取其中的 2 个字段 - 文件和扩展名。我不知道如何提取内容文本,也没有匹配除“非模式”之外的所有字符的策略。
模式是:var regex_file = /<!--<\|(.*)\.(.*)\|>-->/g,
另外,我不确定正则表达式是最好的方法。我考虑了字符串方法拆分:split(regex_file)
但我认为没有办法让分隔符保持分裂。它只是返回分隔符之间的内容。另外,我认为没有办法split()
像我在exec()
下面那样循环。
从以下结构中的文本中提取这 3 个字段的最佳方法是什么。下面是我到目前为止所拥有的。
文本结构
<!--<|file.extension|>-->
// 1-10k of content text
<!--<|file.extension|>-->
// 1-10k of content text
<!--<|file.extension|>-->
// 1-10k of content text
第一次尝试
/*addNodes
**
**
**
*/
function addNodes(text) {
var regex_file = /<!--<\|(.*)\.(.*)\|>-->/g,
arr_file;
while ((arr_file = regex_file.exec(text)) !== null) {
arr_file[1] // holds file
arr_file[2] // holds extension
arr_file[3] // need content here
}
}
附加标准:
IE10+、FF10+、Safari5+、Chrome20+...主要的现代浏览器。