0

您可以在他们的类别链接上看到,很明显,他们的 URL 中唯一重要的部分是 URL 本身末尾附近的小散列。

例如,在加热/冷却下找到的热水器类别是: http ://www.lowes.com/Heating-Cooling/Water-Heaters/_/N-1z11ong/pl?Ns=p_product_avg_rating|1

和热水器类别在管道下找到: http ://www.lowes.com/Plumbing/Water-Heaters/_/N-1z11qhp/pl?Ns=p_product_avg_rating|1

话虽这么说,显然它们的结构可能是许多不同的东西......但我唯一能想到的是它是一个十六进制字符串,它被解码为一个数字和分母,但我无法弄清楚......

显然,出于某种原因混淆这一点对他们很重要?

有任何想法吗?

更新
起初我以为这是标准数字/ denom的某种base16 / hex转换?还是节点的 ID 和它的邻接关系?

有没有人有足够的经验来提供帮助?

4

1 回答 1

0

他们建立在IBM WebSphere Commerce之上。不过,这里没有什么好玩的。字母数字标识符N-xxxxxxx是简单的节点标识符,它们本身不捕获层次结构;结构(父节点和直接子节点)在节点数据本身内编码,并且有迹象表明这种效果(见下文。)它们不需要嵌套间隔(集合),它们的用户界面不会暴露在正常导航期间一次不止一个级别。

以劳氏为例。

如果您查看 cookie ( WC_xxx) 内部并查看它们从 ( ) 中提供某些内容的位置,.../wcsstore/B2BDirectStorefrontAssetStore/...您就会知道它们在 WebSphere Commerce 上运行。在他们的列表页面上,所有导致搜索引擎优化/_/的东西都在那里。字母数字标识符是固定长度的,base-36(尽管应用过滤器时会添加额外的组——但大写字母后面的所有内容都只是记录过滤状态。)ZxxxxZ

假设您随后编写了一个小脚本来清点 Lowe's 目前在其网站上拥有的所有 3600 多个类别。你会得到这样的东西:

N-1z0y28t /Closet-Organization/Wood-Closet-Systems/Wood-Closet-Kits
N-1z0y28u /Closet-Organization/Wood-Closet-Systems/Wood-Closet-Towers
N-1z0y28v /Closet-Organization/Wood-Closet-Systems/Wood-Closet-Shelves
N-1z0y28w /Closet-Organization/Wood-Closet-Systems/Wood-Closet-Hardware
N-1z0y28x /Closet-Organization/Wood-Closet-Systems/Wood-Closet-Accessories
N-1z0y28y /Closet-Organization/Wood-Closet-Systems/Wood-Closet-Pedestal-Bases
N-1z0y28z /Cleaning-Organization/Closet-Organization/Wood-Closet-Systems
N-1z0y294 /Lighting-Ceiling-Fans/Chandeliers-Pendant-Lighting/Mix-Match-Mini-Pendant-Shades
N-1z0y295 /Lighting-Ceiling-Fans/Chandeliers-Pendant-Lighting/Mix-Match-Mini-Pendant-Light-Fixtures
N-1z0y296 /Lighting-Ceiling-Fans/Chandeliers-Pendant-Lighting/Chandeliers
...
N-1z13dp5 /Plumbing/Plumbing-Supply-Repair
N-1z13dr7 /Plumbing
N-1z13dsg /Lawn-Care-Landscaping/Drainage
N-1z13dw5 /Lawn-Care-Landscaping
N-1z13e72 /Tools
N-1z13e9g /Cleaning-Organization/Hooks-Racks
N-1z13eab /Cleaning-Organization/Shelves-Shelving/Laminate-Closet-Shelves-Organizers
N-1z13eag /Cleaning-Organization/Shelves-Shelving/Shelves
N-1z13eak /Cleaning-Organization/Shelves-Shelving/Shelving-Hardware
N-1z13eam /Cleaning-Organization/Shelves-Shelving/Wall-Mounted-Shelving
N-1z13eao /Cleaning-Organization/Shelves-Shelving
N-1z13eb3 /Cleaning-Organization/Baskets-Storage-Containers
N-1z13eb4 /Cleaning-Organization
N-1z13eb9 /Outdoor-Living-Recreation/Bird-Care
N-1z13ehd /Outdoor-Living
N-1z13ehn /Appliances/Air-Purifiers-Accessories/Air-Purifiers
N-1z13eho /Appliances/Air-Purifiers-Accessories/Air-Purifier-Filters
N-1z13ehp /Appliances/Air-Purifiers-Accessories
N-1z13ejb /Appliances/Humidifiers-Dehumidifiers/Humidifier-Filters
N-1z13ejc /Appliances/Humidifiers-Dehumidifiers/Dehumidifiers
N-1z13ejd /Appliances/Humidifiers-Dehumidifiers/Humidifiers
N-1z13eje /Appliances/Humidifiers-Dehumidifiers
N-1z13elr /Appliances
N-1z13eny /Windows-Doors

请注意条目在大多数情况下是如何顺序的(它是顺序标识符,而不是散列),尽管并不总是组合在一起(标识符反映的是时间顺序而不是结构,它捕获插入序列,这在单个或多个批次中发生,有时是几年和数以千计的标识符分开,在数据库的另一端),并注意“父”节点总是他们的孩子之后,有时在洞之后。这些都是迹象表明,随着类别的添加和/或删除,其相应父节点的新版本被重写,而旧的、被取代或删除的版本最终被删除。

如果您认为还有更多需要了解的信息,您可能需要进一步咨询 WebSphere Commerce 专家,了解 Lowe's 可能专门用于其N-xxxxxxx目录的具体内容(尽管我怀疑它是 90%+ 定制的。)FWIW 我相信今年早些时候,Depot(似乎也在使用 WebSphere)升级到版本 7 。


更新Joshua 提到了 Endeca,在这种情况下,确实是 Endeca(那些N-xxxxxxx标识符)在 Websphere 后面使用(尽管我相信自从收购 Endeca 以来,Oracle 正在推动 SUN^H^H^H 他们自己的 Java EE “Endeca Server”平台.) 因此,尽管有外观(演示文稿和他们的 javascripts 是高度定制的,但这只是冰山一角),但实际上并不是 90% 的定制工作。)您应该能够使用 Solr 作为替代品

于 2012-11-10T06:02:19.637 回答