1

我试图想象某些短语在某些国家/地区的重要性。我收集的数据是不同国家/地区不同术语在 Google 中的结果数量。例如,英国的“小红帽”与埃及相比,或类似的东西。由于我只会使用英语作为搜索词(十几个国家,即时搜索,没有免费使用谷歌翻译),我需要根据当地英语网站的数量对结果进行规范化。

例如,如果在埃及我得到 10000 个结果为“American Pie”,而在美国我得到 100 万个结果,但埃及有大约 100000 个英文网站,我会得出结论,“American Pie”在埃及比在埃及更受欢迎美国。

我只需要一些好的方法来估计每个国家有多少个英文网站。有任何想法吗?
到目前为止,我尝试使用“the”作为归一化术语进行归一化,但结果似乎失真了。

4

0 回答 0