0

我正在尝试解析 RSS 提要以查找对国家/地区的引用。目前我正在使用 Python,但我认为这个问题与语言无关(理论上)。

假设我有三个列表(所有相关)

  • 国家 - 名词(即英格兰、挪威、法国)
  • 国家 - 形容词(即英语、挪威语、法语)
  • 城市(即伦敦、纽卡斯尔、伯明翰)

我的目标是首先解析这些字符串的提要。

因此,例如,如果找到“London”,则国家将是“England”,如果找到“Norwegian”,则将是“Norway”等。

处理这些数据的最佳方法是什么?会是 jason 并全力以赴创建嵌套字典吗?套?或某种类型的数据库?

目前,这只打算在本地机器上使用。

4

2 回答 2

0

这是一个非常值得商榷的问题。可以有多种解决方案。如果我是你,我会在 Mongodb 中创建一个小型数据库,其中包含三个这样的表

  1. 国家:列:id、name
  2. Country-adj:列:id、name、country_id
  3. 城市:列:id、name、country_id

那么简单的查询会给出你想要的结果。

于 2012-11-11T14:04:40.810 回答
0

我建议将 3 个数据列表合并到一个字典中,将名称映射到国家名称,例如,它映射 "England" -> "England", "English" -> "England", "London" -> "England"。它可以很容易地存储在数据库或文件中并被检索。

然后我会在字典中搜索键,并用字典中的值标记项目。

于 2012-11-18T14:21:34.507 回答