我正在构建一个表格,内容从页面中的其他元素中提取(页面抓取)。
我正在使用 innerText 或 textContent 来提取文本,然后使用正则表达式来修剪它:
string.replace(/^\s+|\s+$/g,"");
这在 IE 9 和 Chrome 中运行良好,但在 IE 8 中我得到一个我无法识别的垃圾字符。我能够通过 jsfiddle 中的警报重现该行为:
这个额外的字符是什么,我怎样才能摆脱它?
更新:感谢有用的回复!似乎有问题的字符是u200E(从左到右标记)。所以我的问题的第二部分仍然存在,我怎样才能用正则表达式摆脱这些字符,而只保留常规文本?