问题标签 [datastax-startup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - DSE Graph 空间索引——用 km 搜索?
我正在尝试根据距离过滤具有点属性的顶点,类似于文档的使用搜索索引部分底部的示例:
查询可以找到满足在所描述的多边形内距离要求的所有传感器,该距离被指定为圆心在 (-110, 30) 和半径为 20 个单位的圆,使用方法 Geo.inside()。
用于半径的“单位”实际上是度数。我想要的是找到以公里为单位的一定半径内的点。
这显然得到了 Solr 的支持(参见distanceUnits
此处),甚至是上游发行版中的默认设置。我试图更改为 RPT 的配置中的schema.xml
设置distanceUnits=kilometers
,但随后 solr 核心在重新加载时抛出了以下异常:
org.apache.solr.common.SolrException: Must specify units="degrees" on field types with class SpatialRecursivePrefixTreeFieldType
cassandra - 在 Cassandra 中查询集合以按标签搜索和计数项目的有效方法
假设我在 Cassandra 中有一个这样的项目表:
所以我基本上都有带有标签的物品,标签的数量是未知的,最多可以达到几百个,不同的物品可能会共享一些标签。我有两个要求:
我想查询包含特定标签集的项目数,例如我想知道标签列中带有 tag1 或 tag2 或 tag200 的项目数。
我想更新所有包含一组特定标签(在要求 1 中找到)的项目,例如,我想
available = true
在标签列中为所有带有 tag1 或 tag2 或 tag200 的项目设置。
这些可以使用 Spark 或二级索引来完成,但我不想使用它,并且想探索这些是否可以有效地使用纯 CQL 来完成。所以也许我必须从这样的表开始:
但是这个表可以给我相同的项目两次或更多(假设 item1 有 tag1 和 tag2 和 tag200 那么当我通过标签查询上一个表时我会得到 item1 三次)另外,如何为 Cassandra 计数器构建一个合适的表表满足要求 1?
在 RDBMS 中,这是使用此处提到的三个表完成的,问题是如何在 Cassandra 中有效地对其进行非规范化。
datastax - Dse Graph loader 重复边
我有以下 csv 文件:
一个与人员有关,另一个与地址有关,另一个与人员地址连接(每个文件加标题一行)。出于第一次运行的测试目的,我有:
配置 create_schema: true, load_new: true, load_threads: 3
顶点和边的导入是成功的。(两个顶点和它们之间的一条边)
现在,当我运行相同的脚本(相同的数据,相同的输入脚本)但使用不同的配置时
配置 create_schema: false, load_new: false, load_threads: 3
似乎节点没有改变,但我有一个重复的节点边缘。(相同节点之间的两个顶点和两条边)
这是我运行的代码:
有没有办法避免这种情况?
谢谢
datastax-enterprise - 创建 DSE 图形时出现 Gettng 错误 -“主机未及时响应”
我们正在使用 DataStax Enterprise 5.0.1 版,并且在从 Gremlin 控制台创建图表时遇到问题。
以下是我收到的错误的详细信息:
我将Remote.yaml文件设置从 [locahost] 更改为主机:[13.82.30.252]。
我运行 nodetool 命令来检查服务器是否正常运行:
cassandra.yaml 有以下与主机相关的条目:
您能否让我知道我在这里缺少什么配置?
datastax-enterprise - 尝试在 DSE Cassandra 中插入记录时出现错误“无法达到一致性级别 ONE”
我正在使用 DSE Cassandra 并想使用 solr_query 所以创建了 Keyspace,如下所示:
创建了下表:
但是,当我尝试在此表中插入记录时,出现如下错误:
错误:
我需要验证哪些配置设置才能使用“NetworkTopologyStrategy”和“Solr”设置在密钥空间中插入记录?
我还可以在键空间如下时插入记录(但是这不是使用我想使用的 Solr。):
cassandra - 无法记录 n 分钟的 QUEUE 延迟 - DSE
我们的 3 节点集群中的一个节点已关闭,在检查日志文件时,它显示以下消息
节点配置为 8 CPU、32 GB RAM、500 GB 磁盘空间。只有一个特定节点出现故障的原因可能是什么?
datastax - 在 datastax 图中从同一个 csv 文件创建边和顶点
我正在从 datastax 图中的 dataloader 加载 csv 文件。
我的 csv 文件结构如下
第一个文件(Year_2015.txt)
年号
第二个文件(BaseVehicle_2005.txt)
BaseVehicleID|YearID|MakeID|ModelID
对于第一个文件,我将顶点级别创建为年份,将键创建为 YearID,第二个我将顶点级别创建为 BaseVehicle,而键创建为 BaseVehicleID,并忽略 YearID、MakeID、ModelID。现在我想使用边缘级别年份和属性 YearID 在第二(BaseVehicle)和第一(年份)之间创建边缘,但没有什么对我有用。请让我知道我需要改变什么?
datastax-enterprise - DSE Graph:同时使用二级索引和搜索索引的遍历,为什么会挂起?
似乎在同一遍历中同时使用二级索引和搜索索引的 gremlin 遍历挂起。这是为什么?
我从 DSE Graph文档中对索引的理解是,最适合低基数属性的索引是二级索引。我有一个具有“类型”属性的模型,因此可能的类型数量有限;所以当我需要索引时,我使用了二级索引。
但似乎不可能在同一遍历中同时使用二级索引和搜索索引,如下例所示:
在最后一次遍历中,服务器将以下语句记录在/var/log/cassandra/system.log
:
控制台完全冻结,甚至不响应 SIGTERM。
datastax - Datastax 图遍历需要比预期更多的时间?
嗨,我正在使用 gremlin 遍历图表,我的查询如下
它采取aprox。20 秒执行。为什么要花这么多时间?
架构如下