3

我的网络应用程序需要访问任意电子商务商店并确定它是否具有产品数据提要(即 Google Base 提要;商店中所有产品的 RSS/ATOM 提要)。另外,我需要提取此提要的位置。

到目前为止,我能想到的最佳解决方案是为给定的电子商务平台维护这些提要的已知位置的完整列表,并为站点逐一检查它们,当它们返回 404 时将它们从列表中删除。

两个问题:

  1. 你能想出更好的方法吗?
  2. 我将如何生成此已知产品数据馈送位置列表?根据我的经验,它们通常不会公开(与博客 RSS 提要不同)。

非常感谢!:)

-富有的

4

1 回答 1

1

你能想出更好的方法吗?

用于发现提要的用户搜索引擎 API。 您可以尝试使用 Google、Bing 和 Yahoo Search API 来发现您感兴趣的域上的产品提要。这可以按如下方式完成:

  1. 列出您感兴趣的公共提要格式(例如 Google Base、Shopzilla 等)
  2. 检查每个提要规范以查找您可以搜索的唯一字符串。
  3. 制作返回相关结果的搜索 API 查询(限制域、文件类型等)。
  4. 测试您为产品提要返回的链接。

显然,这是假设搜索引擎已经找到并索引了提要。

我将如何生成此已知产品数据馈送位置列表?

我不相信产品数据馈送存在“已知位置”之类的东西。但是,您可以尝试在算法中包含以下模式:

  • 您已经知道的任何供稿的 URL 模式。
  • 您已经猜到的 URL 模式(设身处地为网站管理员着想,想一想他/她会给它们起什么名字)。
  • 查看常用电子商务软件和产品数据馈送插件的文档,以确定它们的默认馈送位置。包括他们的 URL 模式。
于 2011-03-15T13:23:34.850 回答