我正在将 HTML 中的可读文本提取到一个字符串中,我需要删除<!--
和-->
标签之间的现有文本。实现这一目标的最有效方法是什么?
现在我正在这样做:
function RemoveIEScripts(const s: string): string;
var
i: Integer;
InTag: Boolean;
begin
Result := '';
InTag := False;
for i := 1 to Length(s)-3 do
begin
if (s[i] = '<') and (s[i+1] = '!') and (s[i+2] = '-') then
inTag := True
else if (s[i] = '-') and (s[i+1] = '-') and (s[i+2] = '>') then
inTag := False
else if not InTag then
Result := Result + s[i];
end;
end;
有一个更好的方法吗?