我被困住了!我想知道是否有人对这个问题有想法。基本上在这种格式的巨大网页上有“键” *.*.*
(没有其他文本具有这种格式)
我的测试套件是检查上述格式的所有键是否都在我的字典列表中(已经存在 - 但可能存在键可能不在字典中的情况)。如果有不在列表中的键,那么它应该输出一个不在列表中的键列表以及它是在哪个页面中找到的。是否有类似的方法来“grep”所有文本都包含这个正则表达式*.*.*
?
同样,这是一个巨大的站点,因此很难遍历所有页面。但是,如果没有其他方法,有没有办法只抓取这种格式的字符串*.*.*
谢谢大家任何帮助表示赞赏!