问题标签 [amazon-cloudsearch]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
203 浏览

amazon-web-services - 是否可以使用 CloudSearch *only* 进行存储?

阅读文档,还不是很清楚。

我想要的是能够存储和检索简单的 json 文档。使用 CloudSearch,似乎可以以 SDF 格式存储文档,然后搜索它们,但它只返回文档 ID 和指定字段的一小部分(我认为是 200 个字符)。

有没有办法仅使用 CloudSearch 按 ID 检索完整文档?或者它是否旨在用作搜索然后使用您的主存储服务的附加工具?

0 投票
2 回答
641 浏览

boto - boto 2.8.0 和 cloudeach

嗨,我正在尝试按照以下方式将文档添加到 cloudsearch 域

http://docs.pythonboto.org/en/latest/cloudsearch_tut.html#adding-documents-to-the-index

我的代码 snppet 是:

首先,我 在 GAE 上遇到了相同的请求问题 Boto CloudSearch:TypeError: request() got an unexpected keyword argument 'config'

所以我删除了 config kwarg (也不确定后果)然后我得到了

我的数据是这样的

非常感谢任何帮助

0 投票
1 回答
442 浏览

amazon-web-services - CloudSearch 批量更新需要 > 60 秒

我们遇到了批量更新请求超过 60 秒的问题。我们正在更新几 kb 的数据,远远低于 5MB 的限制。

令我惊讶的不是索引数据所花费的时间,而是更新请求本身所花费的时间。仅上传约 65kb 的数据可能需要一分钟多的时间。

我们使用少量数据进行频繁更新。会不会是我们被扼杀了?

0 投票
2 回答
901 浏览

amazon-cloudsearch - 您如何在开发中替换 Amazon CloudSearch?

在生产中,我的应用程序运行 MySQL + Amazon CloudSearch。在开发中,它只运行 MySQL,我对只为开发运行搜索域不感兴趣。

目前,在开发中,我在 MySQL 中运行文本搜索,这并不理想,因为我必须编写特定的环境代码。

我找到了 Groonga CloudSearch,它看起来很棒,但仍然非常年轻且不完整。

那么,在开发中替换 Amazon CloudSearch 的最佳方法是什么?

0 投票
4 回答
2288 浏览

amazon-web-services - 是否可以模拟亚马逊云搜索和 dynamoDB 进行开发?

我希望在 Amazon 云搜索和 Dynamo DB 之外构建一个应用程序,我不想在应用程序开发过程中浪费金钱或免费套餐。所以,我想知道在开发期间是否可以在您的本地计算机上以某种方式模拟 Amazon Dynamo DB 和云搜索?如果没有,创建存根的最佳选择是什么?我正在考虑使用 Apache Cassandra 和 Solr。还有其他低成本开发的替代方案吗?

另外,我正在 Windows 上开发,所以我想知道是否有一个好的 Windows 替代 Cassandra,这将节省我在 VM 上运行 Cassandra 的复杂性。一个可以嵌入到 Java 中的开源数据库将是理想的。

0 投票
1 回答
1622 浏览

amazon-web-services - AWS CloudSearch:1 个域中的不同文档?

我有兴趣将 AWS Cloud Search 用于我的 Web 应用程序。我有 3 种不同的文档类型要使其可搜索(用户 - 文章 - 图像)。

使用 Cloud Search 执行此操作的最佳方法是什么?我是否需要创建 3 个不同的 AWS 搜索域?这是否意味着我需要为至少 3 个搜索实例付费?

或者我可以将它们全部放在 1 个域/实例中并使用索引或类型之类的东西(使用弹性搜索术语)?

谢谢!

0 投票
1 回答
844 浏览

django - Jquery Autocomplete x Amazon CloudSearch 编码

我使用Amazon CloudSearch作为JQuery Autocomplete select的源。它工作得很好,但是由于我无法识别的原因,当只返回一个结果时,编码变得一团糟。

该解决方案的工作原理如下:

人们输入给定城市的社区或街道的文本输入:

JQuery 自动完成配置:

它成功运行,调用我的名为textSearch的 python 视图,它执行以下操作:

例如,在 Cerqueira César 附近搜索名为 Oscar Freire 的街道时,当我在自动完成中键入Oscar Fr时,Amazon CloudSearch 会返回两个结果:

但是,用搜索关键字Oscar Fre再输入一个字母,它只返回一个结果:

正如我们在输出中看到的,返回的对象是相同的(两个结果的 id_address 相同)。此条目的亚马逊对象(从 CloudSearch 中提取的原始 JSON)是:

对我来说很清楚,响应来自我的 python 视图的错误编码。但我无法意识到这个问题从哪里开始。如果这是 JQuery 自动完成的不良行为或亚马逊响应的问题。有任何想法吗?

此致

0 投票
1 回答
430 浏览

amazon-cloudsearch - 如何在同一个 cloudsearch 查询中使用“or”和“and”?

如何在同一个查询中使用“”和“和”?

我有两个工作正常的查询:

field_1 是文字类型。

第一个我使用“或”,第二个“和”有条件。我怎样才能把这两个查询放在一个?我尝试了几种方法,但总是从 Amazon CloudSearch 中得到一些错误。

0 投票
3 回答
10985 浏览

amazon-web-services - ElasticSearch 的扩展

我正在搜索有关 ElasticSearch 如何随其索引中的数据量进行扩展的信息,并且很惊讶我在该主题上找不到多少。也许这里人群的一些经验可以帮助我。

我们目前正在使用 CloudSearch 索引 ≈ 700 万份文档;在 CloudSearch 中,这会产生 2 个类型为 m2.xlarge 的实例。我们正在考虑改用 ElasticSearch 以降低成本。但我在 ElasticSearch 的扩展上发现的只是它的扩展性很好,可以分布在多个实例上等。

但是我需要什么样的机器(内存、磁盘)来存储这种数据?

如果我将数据量增加 12 倍(≈ 8000 万份文档),情况会如何变化?

0 投票
1 回答
557 浏览

amazon-cloudsearch - 根据输入中术语的频率提升云搜索结果

我正在将一个项目从 solr 转换为 cloudsearch,并且在对文档和网络进行了相当长的搜索后,我找不到解决方法。我希望其他人可以提供帮助。

我无法描述真实的细节,但我能找到的最接近我的问题的例子是抄袭检测之一。想象一下,将一堆已发布的文档加载到 cloudsearch 中,然后将一个业余文档作为查询来查看是否有匹配项。

给定一个索引文档——比如维基百科的霸王龙页面:

与其他暴龙科动物一样,暴龙是一种双足食肉动物,有一个巨大的头骨和一条又长又重的尾巴。

然后是业余文件:

我是肉食动物,我喜欢霸王龙,因为它也是双足肉食动物。

出于对项目很重要的原因,我正在创建有趣单词的分布,而不是使用全文查询,例如:

而且我更倾向于在维基百科文章中找到“食肉动物”这个词,而不是“暴龙”。

在 solr 中,我正在使用“^”运算符增强查询,例如“carnivore^2”。

据我所知,cloudsearch 确实提升为“排名表达式”,但我没有发现任何与我的问题类似的东西。

有任何想法吗?