问题标签 [streamsets]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
37553 浏览

apache-nifi - Apache NiFi 和 StreamSet 之间的区别

我打算做一个课堂项目,并且正在研究一些可以自动化或设置系统之间数据流的技术,发现其中有几个,即 Apache NiFi 和 StreamSets(据我所知)。我无法理解的是它们与可以使用它们的用例之间的区别?我是新手,如果有人能解释一下我将不胜感激。谢谢

0 投票
1 回答
371 浏览

hadoop - CDH 5.7 上的 Streamsets solrcloud 无法连接到 Solr

我在 CDH 版本 5.7.0 上使用流集

从 HDFS(源)加载文件并在 Solr(目标)上创建记录的示例工作流。验证失败 - SOLR_03 - 无法连接到 Solr 实例:org.apache.solr.common.cloud.ZooKeeperException: : ZooKeeper 连接字符串。

但是,从日志中,我看到它能够连接到 zookeeper,但是在调用 /live_nodes zookeeper api 后以某种方式关闭了会话。

因此,为了验证,我连接到 zookeeper 并查询 live_nodes:

不确定,为什么当流集调用 API 时响应是空的,为什么当它能够连接时它会抱怨“Zookeeper 连接字符串”......有什么帮助吗?

0 投票
1 回答
751 浏览

streaming - 将 Spark 流连接到流集输入

我想知道是否可以为 StreamSets 的火花流提供输入。我注意到 StreamSets 连接器目标https://streamsets.com/connectors/中不支持 Spark 流。

我探索是否有其他方法可以将它们连接起来以获得示例 POC。

0 投票
0 回答
67 浏览

streamsets - 通过 StreamSet 工具从本地 fs 获取输出的问题

我正在Exploring StreamSet Tool,我有一个日志文件n,我需要将日志文件解析到StreamSet工具,我将日志文件从Directory传递给日志解析器,日志解析器的格式是Common log format, n 目标是本地 fs ..当我开始执行时它正在运行但我没有得到输出。任何人都可以帮助我..

0 投票
1 回答
358 浏览

streamsets - StreamSets 的 Logstash Origin 连接器

是否可以使用 Logstash 作为起点和 Cassandra 作为终点直接构建管道。如果不是,那怎么可能是最好的方法呢?

0 投票
2 回答
867 浏览

java - 流集错误 - 错误的文件描述符

我试图使用 Streamsets 查询 Oracle 数据库并将数据发布到 Kafka。我在我的 Mac 上下载了 Streamsets 的压缩包并将其解压缩到我的主目录中。在我第一次尝试时开始运行$HOME/streamsets-datacollector-2.1.0.2/bin/streamsets dc,然后我按照此处的说明添加 jdbc 驱动程序,然后按照此处的说明配置我的流集作业。但是,我收到一个错误:JDBC_00 - Cannot connect to specified database: com.streamsets.pipeline.api.StageException: JDBC_06 - Failed to initialize connection pool: java.sql.SQLRecoverableException: IO Error: Bad file descriptor.

0 投票
2 回答
1252 浏览

apache-kafka - 如何手动下载和安装流集数据收集器目标包

有谁知道为 Streamsets Data Collector 下载和安装目标包的方法。我的 SDC 无法访问互联网,因此我不能以标准面板方式进行操作。

我特别想下载 kafka 包并在 Streamsets Data Collector 中手动安装它。

0 投票
2 回答
1019 浏览

conditional-statements - Streamsets 流选择器

我在 RabbitMQ 中有一个 JSON 格式的队列,我想获取一些数据来修复 StreamSets 中的某些条件(使用流选择器),然后将某个值保存在新数据库(JDBC Producer)中。如何在条件后写入特定值并发送到数据库?

StreamSets 管道

0 投票
1 回答
442 浏览

cors - 从 JavaScript 将数据发布到 SDC HTTP 服务器 url 显示 CORS 问题

我正在使用 Streamsets 管道从浏览器流式传输数据。因此,为此,我创建了一个具有 HTTP 服务器源的管道,以从浏览器 Javascript 发布数据,并尝试使用 REST 客户端写入该 URL,并成功写入。响应标头已在 SDC.properties 文件中设置。

但是当我尝试使用XMLHTTPRequest从 JavaScript 写入一些数据时,它会为飞行前请求引发错误。下面是 JavaScript 代码:

上述代码执行引发的错误:

XMLHttpRequest 无法加载http://13.68.93.97:8100/。对预检请求的响应未通过访问控制检查:请求的资源上不存在“Access-Control-Allow-Origin”标头。因此,不允许访问源“ http://localhost ”。

任何帮助都会非常有帮助。谢谢..!!

0 投票
1 回答
155 浏览

streamsets - 流集代码背后

我有兴趣在 Streamsets 上工作。但是,我想集成到我的代码中,而不是在 UI 上工作。它们是如何编写的,我可以访问 Directory 和 file tail 后面的代码吗?如果他们在背后使用 Spark 流式传输或其他技术?