问题标签 [clickhouse]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
clickhouse - Clickhouse Kafka 引擎抛出异常
我正在尝试使用 Clickhouse Kafka Engine 来摄取数据。数据为 CSV 格式。在数据摄取期间,有时我会遇到异常
下面是表格
CSV 数据
Clickhouse 服务器版本 1.1.54318。
buffer - 当 Clickhouse 表连续填充 INSERT INTO 时,SELECT 查询性能影响
Clickhouse 表 MergeTree 引擎不断填充“INSERT INTO ... FORMAT CSV”查询,从空开始。平均输入速率为每秒 7000 行。插入以几千行为单位进行。当同时执行 SELECT 查询时,这会对性能产生严重影响。如 Clickhouse 文档中所述,系统最多需要 10 分钟来合并特定表的数据(重新索引)。但这并没有发生,因为表格是不断填充的。
这在文件系统中也很明显。表文件夹有数千个子文件夹,索引被过度分割。如果数据摄取停止,几分钟后表格完全合并,子文件夹的数量变为十几个。
为了遇到上面的弱点,使用了 Buffer Engine 来缓冲表数据摄取 10 分钟。因此,缓冲区的最大行数平均为 4200000。
初始表最多延迟 10 分钟,因为缓冲区保留了最近摄取的行。该表最终被合并,其行为与表已停止填充几分钟的情况相同。但是对应于缓冲区和初始表的组合的缓冲区表正在变得严重变慢。
从上面可以看出,如果表是连续填充的,则它不会合并,并且索引会受到影响。有没有办法避免这个弱点?
apache-zookeeper - 在 Zookeeper 集群中重新添加丢失的 Clickhouse 副本
我们之前在 Zookeeper 中完美同步了三个 Clickhouse 节点,直到其中一个丢失。
Clickhouse 节点完全按照以前的方式重建(使用 Ansible),并且create table
运行了相同的命令,导致以下错误。
命令:
错误是:
我们目前使用的是 Zookeeper 版本 3.4.10,我想知道是否有办法在 Zookeeper 中删除现有副本,或者简单地让 Zookeeper 知道这是现有副本的新版本。
先感谢您!
jdbc - 错误:无法初始化类 ru.yandex.clickhouse.ClickHouseUtil
我clickhouse-jdbc
在我的java应用程序中使用。我将它添加到pom.xml
这样的:
当我运行我的 java 应用程序时java -jar myapp.jar
。它在抛出:
java.lang.NoClassDefFoundError:无法初始化类 ru.yandex.clickhouse.ClickHouseUtil
在我打包的 jar 文件中,还有ClickHouseUtil.class
. 我正在使用Intellij Idea
包装罐。我该如何解决这个问题?
mysql - 如果我重新启动 clickhouse 服务器,则无法看到 clickhouse 中加载的数据
我正在使用 clickhouse 数据库来加载一些实时指标..所以我用引擎 kafka 创建了一个表,并在其中加载了大约 100 万个指标...但问题是如果我重新启动我的 clickhouse 客户端并且如果我选择 *从表名我无法看到其中加载的数据..我怎样才能看到这些数据?
上表我创建并开始收集数据如下
如果我重新启动我的 clickhouse 客户端,然后执行相同的命令,select * from cpuinfo
我将无法看到加载的数据......我怎样才能看到数据?
grafana - 在 clickhouse 中创建表的 Grafana 查询
当我试图将 clickhouse 中的数据作为 grafana 中的图表查看时……我尝试了很多查询处理,但我无法在 grafana 上获得积分……我的表格看起来像
这些是我在 clickhouse 中创建的表......我在 grafana 中的查询应该是什么以获取数据作为图表?
我使用 tabix 但想要在 grafana
mysql - 如何在数据库 docker 容器中创建数据库?
我是 docker 新手,所以无法理解 - 如果我想构建 mysql/postgresql/clickhouse 等容器 - 如何创建数据库和数据库/表的架构?也许在 Dockerfile 中,或者我可以从 docker-compose.yml 中完成?
我的意思是,我不知道何时何地使用 CREATE DATABASE;创建表...; 查询我是否使用流行数据库的 docker 容器
clickhouse - 并发计数请求优化
我有一张表格,列出了建筑物中人员的所有签到和结帐。我的目标是计算在特定时间(比如每小时)有多少人在大楼里。
这是我的桌子:
示例数据
我目前正在以这种方式计算建筑物中的人数:
按预期返回
然而,这个请求似乎不可扩展:数组中有很多点,表中有很多行,这真的很慢。我认为这是因为连接数据的大小。是否有一种机制可以更有效地计算这些数据?
第二个问题:如果我现在想在每个点之间设置最大人数,我该怎么办?
例如,在 10:00 到 12:00 之间,我最多有 3 人(10:15 时)
clickhouse - 点击屋 | 其中 IN 条件具有单个值
Clickhouse 客户端版本:1.1.54318 这是我的查询
在执行此查询时,我收到以下错误:
但我将超过 1 个值放入“处于”状态,它工作得很好。请建议,是clickhouse bug还是我错过的东西......