我将开始我的文章提取工作。
我将要做的任务是提取发布在不同网页上的酒店评论(例如1. http://www.tripadvisor.ca/Hotel_Review-g32643-d1097955-Reviews-San_Mateo_County_Memorial_Park_Campground-Loma_Mar_California.html,2 . http://www.travelpod.com/hotel/Comfort_Suites_Sfo_Airport-San_Mateo.html )
我需要在 Java 中完成这项任务,而在过去的几个月里,我只是在使用 Java。
这是我关于这些的问题。
是否有可能以通用方式从不同的网页中单独提取评论。
请让我知道是否有任何 API 支持 Java 中的任务。
另外,请告诉我您的想法/来源,这将更有利于我完成上述任务。
更新
如果网上有任何相关示例,请发布相同的示例,因为这可能很有用。