我从事一项从博客中抓取特定链接的服务。该服务调用不同的站点,这些站点提取并存储数据。
我在指定用于更新服务器上数据的 url 时遇到了麻烦,我现在使用动词 update 来拉入最新的链接。
我目前使用以下端点:
GET /user/{ID}/links - gets all previously scraped links (few milliseconds)
GET /user/{ID}/links/update - starts scraping and returned the scraped data (few seconds)
第二个网址有什么好的选择?我自己想出了一些例子。
GET /user/{ID}/links?collection=(all|cached|latest)
GET /user/{ID}/links?update=1
GET /user/{ID}/links/latest
GET /user/{ID}/links/new