我正在解析一个 HTML 页面,并且我正在比较不同的字符以查看某个页面元素是否是我想要的。我正在获取每个元素的文本,我想确定最后一个字符是否是“-”长破折号字符。这是我到目前为止所拥有的:
$currentiterator
是我正在使用的文本。
if((substr $currentiterator, -1, 1) eq "–") {
print "long dash found"; ## obviously I will do something different
}
但是,这个 if 语句永远不会返回 true。当我打印出最后一个字符并且它是一个包含长破折号的实例时,我得到了问号菱形的东西(�),我感觉我会遇到一些编码问题。我遇到的麻烦是弄清楚我应该将哪个组件转换为什么。我需要什么编码来转换我得到的字符substring
?我假设我需要将“–”转换为相同的编码——但我将如何转换它们呢?