我有带有 HTML 表格的文档。有些单元格只有数字。其他单元格有数字和单词。
有没有办法只保留有单词的单元格的内容而不保留只有数字的单元格的内容?
是否有任何人都知道我可以用来执行此操作的模块?或者,无论如何我可以使用正则表达式吗?
<table>
<tr>
<td>WORDS WORDS WORDS WORDS WORDS WORDS 123</td>
<td> 789</td>
</tr>
<tr>
<td> 123 </td>
<td>WORDS WORDS</td>
</tr>
</table>
我对 perl 还是很陌生,所以如果它很简单,请原谅我的问题。此外,我已经被警告过使用正则表达式解析 HTML 文本的潜在问题。
非常感谢!
最后,顺便说一句,我将使用一个模块来杀死所有的 HTML 代码。