我正在抓取页面并使用 appengine search api(西班牙语和加泰罗尼亚语页面,带有重音字符)对它们进行索引。我能够执行搜索并制作一页结果。
当我尝试使用带有 snippetd_fields 的查询对象时会出现问题,因为它总是会生成 UnicodeEncodeError:
File "/home/otger/python/jobs-gae/src/apps/search/handlers/results.py", line 82, in find_documents
return index.search(query_obj)
File "/opt/google_appengine_1.7.6/google/appengine/api/search/search.py", line 2707, in search
apiproxy_stub_map.MakeSyncCall('search', 'Search', request, response)
File "/opt/google_appengine_1.7.6/google/appengine/api/apiproxy_stub_map.py", line 94, in MakeSyncCall
return stubmap.MakeSyncCall(service, call, request, response)
File "/opt/google_appengine_1.7.6/google/appengine/api/apiproxy_stub_map.py", line 320, in MakeSyncCall
rpc.CheckSuccess()
File "/opt/google_appengine_1.7.6/google/appengine/api/apiproxy_rpc.py", line 156, in _WaitImpl
self.request, self.response)
File "/opt/google_appengine_1.7.6/google/appengine/ext/remote_api/remote_api_stub.py", line 200, in MakeSyncCall
self._MakeRealSyncCall(service, call, request, response)
File "/opt/google_appengine_1.7.6/google/appengine/ext/remote_api/remote_api_stub.py", line 234, in _MakeRealSyncCall
raise pickle.loads(response_pb.exception())
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf3' in position 52: ordinal not in range(128)
我在 stackoverflow 上发现了一个类似的问题:GAE Full Text Search development console UnicodeEncodeError但它说这是在 1.7.0 上修复的错误。使用版本 1.7.5 和 1.7.6 时,我得到同样的错误。
在索引页面时,我添加了两个字段:description 和 description_ascii。如果我尝试为 description_ascii 生成片段,它会完美运行。
这是否可以在 dev_appserver 上生成非 ascii 内容的片段?