问题标签 [streamsets]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 字段类型转换-转换选项卡-StreamSets
当我尝试进行类型转换时,“按字段名”转换方法。当我单击时,field to convert
会出现一个自动下拉列表,其中显示来自源(CSV 文件)的数据内容列表。显示两者的列表/0 [0] ,/1 [1]
。为什么它同时显示,这是什么意思?StreamSets 的屏幕截图在这里:StreamSets-Field Conversion-Cassandra
shell - 在 emr 中安装流集数据收集器时出错。收到以下错误
在启动 sdc 后在 emr 中安装流集时面临以下问题,我们给出以下命令
给出的错误是:
由于这个错误,我无法访问本地主机上的 stremsets UI
oracle - 如何从 oracle 到 Elasticsearch 实时摄取数据
我在 scala 中使用循环每 10 秒查询一次 Oracle 表,因为 Oracle 表不断插入。我创建一个选择请求,然后创建 n json 字符串,其中包含来自 oracle 的 n 行,并将其推送到 Elasticsearch 中。之后,我创建了一个删除请求以删除我插入到 ES 中的 Oracle 表中的 n 行。我开发了一种完全初学者的方法。那么您能否建议我一种更好的方法来将实时或微批量数据从 Oracle 加载到 ES 并从 Oracle 中删除。我听说过logstach 或SreamSets。你有什么主意吗?谢谢
streamsets - 我无法执行 sudo streamets dc 来启动流集
当我尝试运行时:
我收到以下错误
你有什么主意吗?
oracle - 如何从 oracle 源与流集连接
我想从 oracle 创建一个原始源。所以我选择作为origin oracle cdc。然后我配置了每个参数:
架构名称
桌子
用户名
密码
JDBC 连接字符串
但是当我运行该过程时,我发现我的日志:
你有什么主意吗?
java - 在另一个类中访问一个类的实例的问题
我正在尝试使用另一个类中的一个类的方法访问实例并尝试修改它们。但它给我的错误是“不能引用封闭范围内定义的非最终局部变量 nextSourceOffset。它给了我一个修复,将变量修改为 final ”。但如果我将它更改为 final,我不能增加它们。
我正在使用以下代码:
它在以下位置引发错误:
jdbc - StreamSets 预览来自 MySQL 错误的数据
我试图使用 StreamSets 查询 MySQL 数据库并将数据发布到 Elasticsearch (localhost)。
我在我的 Mac 上下载了 StreamSets 的压缩包并将其解压缩到我的主目录中。我第一次尝试运行 StreamSets dc,然后我按照此处的说明添加 jdbc 驱动程序,然后按照此处的说明配置我的 StreamSets 作业。但是,我收到一个错误:
JDBC_00 - 无法连接到指定的数据库:com.streamsets.pipeline.api.StageException:JDBC_06 - 无法初始化连接池:com.zaxxer.hikari.pool.PoolInitializationException:池初始化期间出现异常:不支持 Connection.isValid(),配置连接测试查询。
mysql - 流集中的 jdbc 生产者问题
我正在尝试使用 Streamsets 管道将数据从本地目录迁移到 mysql db。虽然预览数据在控制台上但未写入 mysql db。管道显示没有错误但仍然数据未写入 db。如果有人在 Streamsets 上工作,请提供帮助我来解决这个?
hbase - 我的 mapr-db json 表中只有行键
我不知道这是否是 mapr-db json 的常见问题。我使用一个 Streamsets 目标,它是一个 Mapr-DB json 表来推送包含 10 列的记录。我将第一列精确到成为行键。当我去
我只看到 json 中的行键,没有其他列
你有什么主意吗?
streamsets - 流集阶段中的记录数
我使用 Streamsets 将记录从 oracle 提取到 ElasticSearch。我想在 maprDB 目标中注册我在 oracle 查询中处理每个步骤的记录计数。如何获取某个流集阶段的记录数?