我有点不知道该怎么做。
基本上使用java我试图:
- 从网站读取 html
在这种情况下,我想在某个字符串之后找到内容
title="
- 将其存储在字符串中。
第一步和最后一步对我来说很简单,但我没有运气(而且从来没有使用过正则表达式)。
我相信这是我需要的开始:
String regex = "(?<=title=\")\\S+";
Pattern name = Pattern.compile(regex);
之后我就没有头绪了。有什么帮助吗?
import java.util.regex.Matcher;
import java.util.regex.Pattern;
String EXAMPLE_TEST = "......";
Pattern pattern = Pattern.compile("(?<=title=\")(\\S+)")
Matcher matcher = pattern.matcher(EXAMPLE_TEST);
while (matcher.find()) {
System.out.println(matcher.group());
}
注意:您可能会考虑使用正则表达式模式(?<=title=\")([^\"]*)
List<String> result_list = new ArrayList<String>();
Pattern p = Pattern.compile("title=\"(.*)\"");
Matcher m = p.matcher("title=\"test\"");
boolean result = m.find();
while(result)
{
result_list.add(m.group(0));
result = m.find();
}