问题标签 [flume]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1126 问题

0 投票

0 回答

4362 浏览

logging - Scribe、Flume 和 Chukwa - 有哪些替代方案？

我想了解这些项目的替代方案，特别是设计用于从多个节点 (>500) 的日志中聚合数据，并设计用于低内存/cpu 使用率。
我熟悉 scribe、flume 和 chukwa，我认为它们使用了太多资源（JRE、许多库）。

欢迎所有关于以低使用方式聚合来自多个节点的数据的评论和建议。

2010-08-30T14:42:04.950

0 投票

1 回答

309 浏览

logging - 命令行水槽抛出错误

我想用flume从控制台收集日志，我用以下命令启动flume：

但它说：

10/09/22 13:59:21 INFO agent.FlumeNode：从命令行加载规范：'节点：控制台 | 代理BESink（“本地主机”，12345）'

22 年 10 月 9 日 13:59:21 WARN agent.FlumeNode：捕获异常加载节点：解析器错误：位置 -1 第 0 行的意外“null”：“节点：控制台 | 代理BESink（“本地主机”，12345）'

我错过了什么？我按照cloudera的howto。预计会起作用，不是吗？

logging flume cloudera

2010-09-22T12:01:49.637

0 投票

1 回答

1741 浏览

java - 编写自定义 Flume 装饰器，但出现错误。我错过了什么？

我正在为 Cloudera 的分布式日志聚合系统 Flume 编写自定义装饰器插件。我的Java代码如下：

这可以很好地用 ant 编译成 JAR 文件，我可以在运行时将它加载到 Flume 并成功配置节点以使用它。但是，当在加载了此插件的节点上实际发生事件时，我的日志中会出现如下错误：

（这[logicalNode xxxxx]是 EC2 内部 DNS 名称的占位符）。我没有很多 Java 经验，所以我不确定我在这里做错了什么，或者这是一个 Flume 错误。我应该提一下，我是使用 Flume 源代码中的 HelloWorld 插件示例编写的，并且还借鉴了一些内置的 Flume 装饰器。

java flume

2010-10-19T21:33:07.500

0 投票

2 回答

4197 浏览

php - 使用 Flume 进行分布式日志记录

我有一个分布在 7 台服务器上的移动服务，每台服务器都执行特定的任务。我想从他们那里记录信息，然后从他们那里获得商业智能。我已经将它四舍五入到 Flume。我如何使用它来收集信息？我的系统是用 PHP 编写的。水槽是否适用于 PHP？

php mysql logging flume

2010-11-13T07:20:21.453

0 投票

3 回答

2148 浏览

hadoop - 哪个是组合小型 HDFS 块的最简单方法？

我正在使用 Flume 将日志收集到 HDFS。对于测试用例，我有小文件（~300kB），因为日志收集过程已针对实际使用进行了扩展。

有没有什么简单的方法可以将这些小文件组合成更接近 HDFS 块大小（64MB）的大文件？

hadoop hdfs flume

2010-12-13T14:08:45.260

0 投票

1 回答

976 浏览

hadoop - Flume 代理 - 我可以指定 gzip 或 bz2 之类的压缩吗？

是否可以在 Flume 代理上指定压缩选项，以便以压缩格式将数据传输到收集器？我知道收集器级别有压缩选项，但是能够从代理传输压缩数据也非常有用。

谢谢！

hadoop agent cloudera flume

2011-02-26T01:40:03.080

0 投票

1 回答

439 浏览

windows - 在 Windows 上运行 Flume master

我可以在 Windows 上运行 Cloudera Flume 节点，但无法运行 Flume 主节点。这是可能的，你怎么能做到？

windows service cloudera flume

2011-05-20T04:05:01.800

0 投票

1 回答

293 浏览

ubuntu - 控制flume自身生成的日志文件的大小

Flume 在 /var/log/flume 文件夹中生成日志。那里的文件以 GB 为单位增长。如何限制这些日志的文件大小？

ubuntu hadoop cloudera flume

2011-06-27T10:26:34.447

0 投票

1 回答

4246 浏览

rabbitmq - 如何编写自定义水槽 OG 水槽

我们正在使用水槽，我需要将一些日志消息收集到 rabbitmq 中。我找到了一个从rabbitmq读取消息的源实现，但是我找不到可以将消息写入rabbit的接收器。所以我想自己写一个。查看像logsandra这样的示例实现让我觉得应该不会太难。

但是我找不到任何关于如何编写自定义接收器的文档。我没有找到用于水槽罐的 maven 存储库，也没有找到有关如何部署自定义接收器的设置说明。

任何人都可以分享他的经验，或者更好的是，将我指向现有的教程。

rabbitmq flume

2011-07-06T19:32:19.460

0 投票

2 回答

1465 浏览

c# - 如何将命名管道尾随到 Flume Windows 节点（Flume 节点服务）

不确定这是一个 SO、SuperUser 还是 ServerFault 问题，但我刚刚在我的 Windows 机器上安装了 FlumeNode 服务，我想通过命名管道将日志信息发送到 FlumeNode。

Flume Cookbook指出我们可以将命名管道尾随到 Flume，但这似乎需要 cygwin，而且我们不太可能在所有 Flume 节点上安装 cygwin。以下是食谱中的说明：

控制台源很有用，因为我们可以直接将数据通过管道传输到 Flume。下一个示例将程序中的数据通过管道传输到 Flume，然后由 Flume 传递数据。

理想情况下，您可以将数据写入命名管道，然后让 Flume 使用 text 或 tail 从命名管道读取数据。不幸的是，这个版本的 Flume 的 text 和 tail 目前不兼容 Linux 环境中的命名管道。但是，您可以将数据通过管道传输到在标准输入控制台上侦听的 Flume 节点：

或者您可以使用 exec 源来获取其输出数据：

我还找到了关于这个想法的关于谷歌群组的讨论，似乎 Claudera 人说这是可能的，但没有具体解释 Flume 如何连接到管道以及在这种情况下它是否充当服务器或客户端。

理想情况下，我应该能够在我的应用程序中创建 aNamedPipeClientSteram或 a NamedPipeServerStream。客户端需要一个命名管道服务器来运行，并且客户端寻找连接到它的客户端。我假设 Flume 将充当服务器，但我无法确认这一点。例如

在 Windows 中启动 Flume 服务时，是否可以将某些内容添加到命令行参数中，以拖尾管道？

c#.net named-pipes tail flume

2011-07-19T20:39:25.610

1 2 3 4 5 6 7 8 9 10

问题标签 [flume]

Reference