我正在尝试使用 rel="nofollow" 参数关闭所有外部网址:
我写了这个简单的中间件:
import re
NOFOLLOW_RE = re.compile(u'<a (?![^>]*rel=["\']nofollow[\'"])'\
u'(?![^>]*href=["\']mysite\.com[\'"])',
re.UNICODE|re.IGNORECASE)
class NofollowLinkMiddleware(object):
def process_response(self, request, response):
if ("text" in response['Content-Type']):
response.content = re.sub(NOFOLLOW_RE, u'<a rel="nofollow" ', response.content.decode('UTF8') )
return response
else:
return response
它可以工作,但会关闭所有内部和外部链接。而且我不知道如何添加 <noindex></noindex> 标记来链接。