问题标签 [crate]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
multithreading - 并行执行大量查询时如何增加队列容量?
我正在用 crate 做一个基准测试并同时插入很多记录。似乎我达到了一些限制(队列容量 50),但我没有找到如何更改配置。
线程 Thread-1 中的异常:
数据=数据)文件“/Users/jodok/sandbox/crate-demo/amsterdam/pyenv/lib/python2.7/site-packages/crate/client/http.py”,第345行,在_json_request self._raise_for_status(响应) 文件“/Users/jodok/sandbox/crate-demo/amsterdam/pyenv/lib/python2.7/site-packages/crate/client/http.py”,第 331 行,在 _raise_for_status raise ProgrammingError(error.get(' message', '')) ProgrammingError: SQLActionException[RemoteTransportException[[nuc2][inet[/192.168.42.72:4300]][bulk/shard]]; 嵌套:EsRejectedExecutionException[在 org.elasticsearch.action.support.replication.TransportShardReplicationOperationAction$AsyncShardOperationAction$1@23c7247f 上拒绝执行(队列容量 50)];] 在 _raise_for_status raise ProgrammingError(error.get('message', '')) ProgrammingError: SQLActionException[RemoteTransportException[[nuc2][inet[/192.168.42.72:4300]][bulk/shard]]; 嵌套:EsRejectedExecutionException[在 org.elasticsearch.action.support.replication.TransportShardReplicationOperationAction$AsyncShardOperationAction$1@23c7247f 上拒绝执行(队列容量 50)];] 在 _raise_for_status raise ProgrammingError(error.get('message', '')) ProgrammingError: SQLActionException[RemoteTransportException[[nuc2][inet[/192.168.42.72:4300]][bulk/shard]]; 嵌套:EsRejectedExecutionException[在 org.elasticsearch.action.support.replication.TransportShardReplicationOperationAction$AsyncShardOperationAction$1@23c7247f 上拒绝执行(队列容量 50)];]
csv - 将数据从 csv 文件导入 Cratedb
我在 Crate 0.38.x 中创建了一个表,其中的列具有整数、字符串和时间戳数据类型。我想从分隔的文本文件中将数据加载到此表中。是否有实用程序进行批量导入?抱歉,我在文档或 Github 上找不到
crate - 板条箱数据库异常,输入“VARCHAR”没有可行的替代方案
我正在使用弹性搜索来存储大量数据以使其可搜索,但对于配置项,我仍在使用 HSQL DB。
是否可以完全消除 HSQL DB 并将我现有的 Elastic 搜索与 Crate DB 结合使用?
我尝试过的事情:
尝试使用 Crate 驱动程序和 Crate 客户端连接到我现有的 Elastic 搜索,但出现异常
No handler found for action "crate_sql"
。这是否意味着我不能使用我现有的 ES 并且必须在 crateDB 中使用内置的 ES?在连接到 crateDB 弹性搜索(而不是我现有的 ES)之后。我能够使用 CrateDriver 获得连接并运行 SQL 查询。但是在其中一个模块中,我正在使用以下命令创建表:
创建表 some_table_name ( id VARCHAR(256), userName VARCHAR(256), fieldName VARCHAR(256),
主键(id),唯一(用户名,字段名));
...但后来我遇到了一个例外:
io.crate.action.sql.SQLActionException:第 1:28 行:输入“VARCHAR”没有可行的替代方案
这是否意味着我不能使用 SQL 语法和 SQL 数据类型编写创建表查询?
我知道如果我使用字符串数据类型而不是 ,它会起作用varchar
,但我现在不想更改所有这些查询。
crate - 碎片仍然无法复制
我遇到了一个大表的少量分片仍然处于“Underreplicated”状态的问题。我的小集群有 5 个点头来容纳这张单张桌子。该表有 200M 条记录,5 个分片,2 个副本(划分为 200 个分区)。没关系。经过一些测试(即关闭一个节点并将其带回)。有少量 3 个分片,复制不足。
如果我查看表“sys.shards”,我发现三个分片的状态保持在“初始化”状态。
请指教,可能是什么问题?顺便说一句,每个节点都有 100 GB(已使用 20%)存储空间和 4GB(已使用 50%)堆。
谢谢!
networking - 有人在虚拟化环境中运行多个 crate.io 节点有运气吗?
我正在使用 crate.io 来测试节点之间的复制。我有两个实例在同一本地网络上的 VirtualBox 上运行的两台单独的 Ubuntu 机器上运行。该实例无法识别其他节点 - 似乎每个节点都在单独运行。有没有人有配置多个节点的经验?
upgrade - 升级多节点 Crate 集群的正确程序是什么?
我有一个由多个节点组成的板条箱集群。该集群当前使用 Ubuntu 稳定存储库运行 0.39.1。我想升级到 0.40.2,集群没有停机时间。
简单地使用此处引用的 ES 滚动升级过程(假设我们启用了 ES API)是否明智:http ://www.elasticsearch.org/guide/en/elasticsearch/reference/current/setup-upgrade.html#滚动升级
crate - 关于综合指数
定义复合索引时,例如
id 和 id2 在 elasticsearch 中使用整数进行索引,但我从 ES 的 _mapping 中看到的是:
其中 id 和 id2 都被复制到类型为“string”的 ci 中。
您能否对此进行更多解释(例如保留的顺序),并且可能对 crate 数据中的整个复合索引进行更多解释?
crate - 使用 Crate.io 作为主数据存储有什么问题?
如果我是正确的,crate (crate.io) 由 Elasticsearch (Lucene) 支持。一个月前不是有几篇文章说ES在重负载下丢了一些写吗?还有其他顾虑吗?
java - 在 crate.yml 中启动具有特定 HEAP 数量的节点
我正在编辑Crate.yml
文件以启动一个新节点,我的文件是:
当使用 4g 的 RAM 设置Crate
堆时,它在创建默认的第一个节点(启动时)时不起作用,Crate
它会创建 1gb 的节点。
我应该如何在配置文件中定义堆大小?
非常感谢
crate - CrateData 中更新查询的效率
执行更新查询时会触发大量(例如一百万)条记录进行更新。据我了解,底层索引系统需要重新摄取文档。那么对于这种“繁重”的工作,有没有办法控制它的工作负载,即以修复率更新直到完成?