我有一个大的 HTML 字符串,其中包含实际 HTML 代码之前的一些行,这些行是空的 HTML,实际上并不需要。
messageContent 将包含以下内容:
<td width="35"><br /> </td>
<td width="1"><br /> </td>
<td width="18"><br /> </td>
<td width="101"><br /> </td>
<td width="7"><br /> </td>
<td rowspan="21" colspan="16" width="689">Geachte heer/mevrouw,<br /> <br /> Wij hebben uw inzending ontvangen en gecontroleerd. Hierbij het verslag van de controle.<br /> <br />
我想删除/替换包含“Geachte”、“heer”和“mevrouw”的行之前的所有内容。
作为输出,我只想保留:
<td rowspan="21" colspan="16" width="689">Geachte heer/mevrouw,<br /> <br /> Wij hebben uw inzending ontvangen en gecontroleerd. Hierbij het verslag van de controle.<br /> <br />
我想我会使用 BufferedReader 逐行遍历文本:
try {
reader = new BufferedReader(
new StringReader(messageContent));
} catch (Exception failed) { }
try {
while ((string = reader.readLine()) != null) {
if ((string.length() > 0) && (string.contains("Geachte"))) {
//remove all lines before this string
}
}
} catch (IOException e) { }
我如何实现这一目标?