我使用锅炉管道编写烧瓶应用程序来提取内容。最初我将锅炉管道提取物编写为脚本来提取网站内容,但是当我尝试与我的 api 集成时,执行锅炉管道提取器时 JVM 崩溃。这是我得到的错误https://github.com/misja/python-boilerpipe/issues/17 我也在 github 中提出了一个问题
from boilerpipe.extract import Extractor
import unicodedata
class ExtractingContent:
@classmethod
def processingContent(self,sourceUrl,extractorType="DefaultExtractor"):
extractor = Extractor(extractor=extractorType, url=sourceUrl)
extractedText = extractor.getText()
if extractedText:
toNormalString = unicodedata.normalize('NFKD',extractedText).encode('ascii','ignore')
json_data = json.loads({"content": toNormalString, "url": sourceUrl , "status": "success", "publisher_id": "XXXXX", "content_count": str(len(toNormalString)) })
return json_data
else:
json_data = json.dumps({"response": {"message": "No data found", "url": sourceUrl , "status": "success", "content_count": "empty" }})
return json.loads(json_data)
这是我试图集成到使用 flask-restful,sqlachemy,psql 的 Flask api 中的上述脚本。我也更新了我的java,但这并没有解决问题。Java 版本
java version "1.7.0_45"
javac 1.7.0_45
任何帮助,将不胜感激
谢谢