1

我想开发一个应用程序来显示其网站上特定频道的节目时间表。我确实没有他们的网站,但是,是否有其他一些技术可以从页面中检索某些特定数据,在我的情况下是程序的名称及其传播时间。该网站也没有 RSS 提要。请问有什么想法吗?非常感谢。

4

2 回答 2

3

您拥有该网站吗?如果不是,您需要从网站上抓取它的数据以及您对数据的处理方式,那么您可能会遇到法律问题。

抓取数据基本上只是摄取 HTML 并解析页面中包含所需信息的字段。如果网站结构良好,它可以相当简单。也许你可以使用JSOUP

有关更多详细信息,请参阅线程

于 2012-06-14T19:23:03.123 回答
2

您可以检查该页面是否提供 API。如果是这样,您通常可以连接到 REST 服务,然后您可以通过 POST 或 GET 请求访问该服务。你通常会得到一个 xml 或 json 数组。

或者,如果他们不提供 API,您可以手动解析 (HTML) 数据。尽管我不建议这样做,因为大多数网站都禁止这样做,并且一旦更改元素就不会起作用。

于 2012-06-14T19:24:54.627 回答