如何将 url 添加到 SgmlLinkExtractor?也就是说,如何添加任意 url 来运行回调?
详细说明,以dirbot为例:https ://github.com/scrapy/dirbot/blob/master/dirbot/spiders/googledir.py
parse_category仅访问与 SgmlLinkExtractor 匹配的所有内容 SgmlLinkExtractor(allow='directory.google.com/[AZ][a-zA-Z_/]+$')