问题标签 [amazon-cloudsearch]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1952 浏览

php - 非法的 unicode 字符

我正在尝试将 document.sdf (json) 发送到 Amazon Cloud Search。一切正常,直到有一些特殊字符

错误来自这段文字:

这些来自由 PHP 脚本生成的 document.sdf 和json_encoded

以上原文:

;颜色:G%k>? X_?p>

0 投票
1 回答
273 浏览

php - 使用 AWS CloudSearch 查找相似词

是否可以使用 AWS CloudSearch 找到相似的词?类似的意思是……假设我有一列包含几个不同的信息,例如:full_name、first_name、age、last_name 等,例如,搜索是查找 f_name。它应该返回 full_name 和 first_name。这可能吗?

如果这是不可能的,那么如何以非常快的响应速度做到这一点?

先感谢您。

0 投票
1 回答
365 浏览

amazon - 亚马逊云搜索与位置的问题

我的问题是带有位置的亚马逊 cloudSearch ..

当我对具有位置的搜索产品使用排名表达式时发现此错误

p>

而我的搜索请求网址是

htp://www.search_endpoint."/search?bq=".urlencode($term)."&rank=geo&rank-geo=Math.sqrt(Math.pow(Math.abs(22345345 - 534534),2)+Math .pow(Math.abs(934593495 - 34534534),2))&size=$size&start=$start&return-fields=".implode(',',$return_fields

我在哪里做错了?没有等级表达它工作正常。我认为错误出现在位置的定义表达式中,但找不到任何其他解决方案请帮助我。

谢谢

0 投票
8 回答
12488 浏览

amazon-web-services - 如何清除 AWS CloudSearch 中的所有数据?

我有一个仍在开发的 AWS CloudSearch 实例。

有时,例如当我对字段的格式进行一些修改时,我发现自己想要清除所有数据并重新生成它。

有什么方法可以使用控制台清除所有数据,还是我必须通过编程方式进行?

如果我必须使用编程方式(即生成并发布一堆“删除”SDF 文件),是否有任何好方法可以查询CloudSearch 实例中的所有文档?

我想我可以删除并重新创建实例,但这需要一段时间,并且会丢失所有索引/排名表达式/文本选项/等

0 投票
0 回答
626 浏览

amazon-web-services - CloudSearch 中的一致性读取

CloudSearch 的结果只是最终一致的。

在我 95% 的应用程序中,对于它提供的性能和冗余来说,这是一个可以接受的折衷方案。

不过,在最后 5% 中,我发现自己正在发布一个新的 SDF 文档,然后立即运行一个查询,我需要反映我刚刚所做的 POST。

目前,我有一个拼凑的解决方案,其中涉及轮询 CloudSearch,直到结果符合我的预期,直接在 POST 之后。不幸的是,这有很多问题,从与额外读取相关的成本增加 ($) 到当我有多个用户时的竞争条件。

有没有处理这种情况的最佳实践?

来自 AWS 论坛的 xpost:https ://forums.aws.amazon.com/thread.jspa?messageID=470636⹬

编辑:关于我的特定用例的附加信息。

我正在获取带有许多布尔查询的搜索结果,并且我希望能够更新一个或多个文档,以便它们可能不再出现在查询中,然后刷新视图以显示结果.

具体来说,我有一堆带有布尔值的文档,将它们标记为“已归档”

当我在未归档视图中查看它们,然后将它们标记为已归档时,我希望能够在不显示这些项目的情况下刷新视图。

我还在使用 CloudSearch 进行排序/过滤/分页,这使得插入或修改本地副本变得困难

0 投票
2 回答
559 浏览

search - 用于非文本搜索的 Mysql 搜索与搜索工具(CloudSearch、Sphinx、Solr..)

我们有一个包含 100 万行的分类数据库,我们在其中进行了大量过滤搜索。我们不做任何关键字搜索(没有喜欢或任何东西),我们所做的只是根据条件(价格、房间数量、位置等)过滤行

由于我们没有进行任何关键字搜索,我在质疑我们是否应该使用搜索服务器?

有什么想法吗?

0 投票
1 回答
161 浏览

amazon-cloudsearch - 使用 cs-post-sdf 批量上传 SDF 时出错:SSLException: Server Key

我的 Cloudsearch Upload Batch 服务器之一正在抛出此错误消息。我检查了所有配置,但无法解决。请帮忙。

0 投票
1 回答
174 浏览

search - 经常向 CloudSearch 发送 SDF 批次

我正在尝试决定将我的数据库中的更改发送到 CloudSearch 的频率。我可以每分钟发送一次更改,使搜索几乎是实时的,但是我应该考虑一个问题吗?

除了成本,还有其他不经常发送 sdf 的理由吗?

0 投票
1 回答
531 浏览

search - Amazon Cloud Search - 按时间和日期获取地点

我正在使用 Amazon CloudSearch 来存储大量地点。对于一周中的每一天,每个地方都有开放时间和关闭时间。

我需要按当前时间检索地点。你建议如何为索引建模?我正在考虑通过创建 7 个文本索引来解决该问题,在这些索引中我为一周中的每一天指定有效时间。

例如,如果一个地方从上午 9 点到 13 点开放,在索引“星期一”中,我将写入字符串“9-10-11-12”。然后,通过 bq=monday:'10' 或 bq=monday:'16' 过滤,我将只有在指定时间打开的地方。

还有什么想法吗?我的解决方案似乎有效,但会建议我另一种方法吗?

0 投票
1 回答
728 浏览

search - 对多方面搜索软件堆栈的建议

作为客户新项目的一部分,我需要创建一个搜索工具。记录将是在一个或多个特定日期发生的事情。很高兴获得 SO 关于哪些工具最适合以下要求的建议:

  1. 需要(多方面)搜索数万条记录(基于类别、日期、价格等字段)
  2. 需要搜索多值字段(即标签)
  3. 需要能够通过静态因素(如价格、距离等)订购
  4. 需要能够通过动态/频繁变化的因素(例如用户参与度/流量等)进行排序
  5. 需要能够只返回在用户自己的社交网络中有活动的记录(即“只显示我的朋友参与的结果”)。
  6. 将部署在 EC2 中

我目前的想法是:

  1. 混合使用 Amazon CloudSearch 和 Redis
  2. 成千上万的记录实际上并没有那么多。也许在 RDBMS 中完成大部分工作,使用 CloudSearch 进行全文搜索?
  3. 使用 Redis 为每个用户维护一组最近交互的记录,然后将它们合并以获取用户网络中的记录。

我主要担心的是从各种服务(Redis/CloudSearch)中提取可能数千个 ID,然后必须将它们合并到客户端代码中的延迟。然而,这或许是没有根据的。

我希望可能有一个我错过的技术堆栈可以为我解决很多问题。我不想去重新发明轮子。

欢迎任何建议!