我很难过,需要一些关于如何做到这一点甚至是否可以做到的想法。
我有一个客户想为特定国家(在本例中为泰国)的说英语的旅行者量身定制一个网站。不同的交通方式(公共汽车和火车)都有很好的网站来提供各自的信息。就它们呈现的数据而言,两者都是非常静态的(时间表很少改变)。这是我需要从中获取信息的站点之一:火车时刻表客户希望为用户提供搜索起点和终点位置的能力,并使用外部网站的信息确定他们如何最好地到达那里,提供路线与选择的不同运输方式的时间表时间。
现在,以我有限的经验,我认为这样做的方法是从外部站点的服务器(通过 API 或其他方式)检索原始日程信息并将信息保留在数据库中,可以根据需要查询. 我们的第一个想法是联系相关当局以确定如何/是否可以这样做,但这已被证明是有问题的,主要是由于语言障碍。
我的客户建议基本上是“屏幕抓取”,但这听起来充其量是复杂的,下载网页并通过 HTML 过滤相关/必要的数据以放入数据库。我担心这些主要是静态网站上的信息是如此静态,以至于数据甚至没有保存在数据库中来构建页面,并且当某些事情发生变化时,网页本身会更新(硬编码)。
我真的可以在这里使用一些帮助和建议。谢谢!