问题标签 [clickhouse]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database - Clickhouse system.parts 表列定义
我目前正在从 Clickhouse 的系统表中收集指标,当从 system.parts 表中获取信息时,列出了一堆未记录的列,任何人都可以帮助解释以下列代表什么:
- 等级
- primary_key_bytes_in_memory
- primary_key_bytes_in_memory_allocated
我对了解主键的索引大小特别感兴趣,但是在确定上面两个主键列之间的差异时遇到了麻烦。
scala - ClickHouse Spark 连接器 - Scala 依赖
我正在使用https://github.com/DmitryBe/clickhouse-spark-connector
在我克隆了 repo 之后,我用 sbt 程序集创建了我的 jar,然后我添加了我的 import 语句。
对象 clickhouse 不是 spark.jobserver.io 包的成员
我可以看到这些路径存在并且它们被添加为依赖项,就像我添加所有其他路径一样。我已经清理和重建等,但没有任何区别。我正在使用 scala-ide(eclipse)。
clickhouse - 如果匹配为零,如何使 ClickHouse count() 函数返回 0?
我们的任务是在 ClickHouse 中运行一批约 20000 个查询,并将结果存储到 CSV 文件中。每个查询都是返回单个数字的 count() 聚合。
我们这样做:
(是的,尾随逗号,我们会解决这个问题。)
查询示例:
问题在于,如果查询匹配零条记录,ClickHouse 将不返回任何内容,并且生成的 CSV 文件中的记录数与查询数不同。
这可能是 SQL 的标准行为,但我们如何解决这个问题并让 ClickHouse count() 在零匹配的情况下返回 0?
sql - ClickHouse 分布式表慢
我在 ClickHouse 中创建了一个分布式表,总共有两个分片和一个数据副本。
我有表 exit 和 exit_all 这是分布式表。我插入到表 exit_all 中,它将数据均匀地分布在我的两台服务器上。当我从本地出口表查询一半的记录时,它需要 0.15 秒,但在 exit_all 上执行时需要 0.45 秒。我希望它花费大约相同的时间,因为处理是分开的。
当我计算我的查询时,我可以看到数据被完美地分割为这个查询,或者在 100k 的 100 条记录中,所以它不像所有数据都位于一台服务器上。
编辑:每 2-3 个查询的查询时间也会有很大差异,对于某些查询,对于同一查询,查询时间将从 1.3 秒下降到 750 毫秒。
clickhouse - ClickHouse 中的合并功能替换
我是 ClickHouse 的初学者,并试图用于处理我们项目的统计信息。一些桌面软件将信息发送到我们的服务器,我们需要将操作系统分组到候选名单中。此示例查询:
需要聚合到清理列表:
等等。我没有找到 COALESCE 函数,并尝试使用 extract 按版本号识别操作系统:
但!因为 Windows 2008 和 Windows 2008 R2 在版本字符串中有“2008”,所以我收到了这个结果:
在我的情况下我需要使用什么功能?谢谢。
java - Clickhouse JDBC 驱动程序类名
有没有人在 Clickhouse 中使用过 Spring JDBC?驱动程序类名是什么?
ubuntu - 安装 ClickHouse DB Ubuntu 16.04(64 位)时出错
我按照此链接安装 ClickHouse DB:https ://clickhouse.yandex/#quick-start
运行此命令时出现错误:sudo apt-get install clickhouse-server-common clickhouse-client -y
错误:
某些软件包无法安装。这可能意味着您请求了一种不可能的情况,或者如果您使用的是不稳定的发行版,一些必需的软件包尚未创建或已从 Incoming 中移出。以下信息可能有助于解决这种情况:
以下软件包具有未满足的依赖关系: clickhouse-client :取决于:clickhouse-server-base (= 1.1.54236) 但不会安装 clickhouse-server-common :取决于:clickhouse-server-base (= 1.1.54236 ) 但它不会被安装 E: 无法纠正问题,您持有损坏的软件包。
clickhouse - 是在 Clickhouse 中记录压缩表引擎吗
我有一张Log
桌子,也有一张MergeTree
桌子。在system.columns
表中,它有一列 ,data_compressed_bytes
显示为每个表的每一列压缩的字节。我可以看到MergeTree
表格在列下显示值,但对于Log
表格,列显示全零。
Log
MergeTree
所以,我想知道这是否意味着引擎类型Log
中的列实际上被压缩了。
ClickHouse 文档指出TinyLog
已压缩但不确定,我在表Log
中没有看到。system.columns
clickhouse - 如何让 clickhouse 获取新的 users.xml 文件?
我是否必须重新启动 clickhouse 才能读取 users.xml 的任何更新?有没有办法判断“重新加载”clickhouse?