我想从放置在 parapraph(p) 和 link(a href) 标记之间的 html 文件中提取文本。我想在没有java regex 和 html解析器的情况下做到这一点。我想
while ((word = reader.readLine()) !=null) { //iterate to the end of the file
if(word.contains("<p>")) { //catching p tag
while(!word.contains("</p>") { //iterate to the end of that tag
try { //start writing
out.write(word);
} catch (IOException e) {
}
}
}
}
但不起作用。代码对我来说似乎很有效。读者如何捕捉“p”和“a href”标签。