2

我有一长串用分号分隔的文本,所以我有一个正则表达式来捕获[^\;]+. 但是,由于内容包含 HTML 撇号 (' ),因此存在问题。

我如何编写一个正则表达式来捕获除分号之外的所有内容,除非分号是 HTML 撇号的一部分?

4

1 回答 1

4
(&\S+?;|[^;])+

匹配 HTML 实体,就像它们是单个字符一样。

于 2013-04-18T18:32:57.530 回答