hadoop - Elasticsearch 拯救了 ES-HADOOP PLUGIN

问问题

问问题 2018-02-24T09:34:41.247

279 次

我们正在使用 ES-HADOOP 插件将数据从 Hadoop HBASE 表推送到 Elasticsearch 集群。以下是集群详细信息。

弹性搜索版本：2.3.5
数据节点：3
主节点：3
客户端节点：1

数据节点也是主节点。

数据/主节点堆：20GB
客户端节点堆：3GB
每个索引的主分片数：5
每个索引的副本分片数：1

当我们在 Spark 上执行作业以及在一段时间后将数据从 Hadoop 推送到 Elasticsearch 的阶段时，我们开始获取ElasticSearch Bailing Out.

我们怀疑 Elasticsearch 可以为 Bulk API 处理的并发连接数超过了 Spark 执行器，因为发布的最大连接数 Elasticsearch 开始拒绝写入请求。

我们如何确定 ElasticSearch 客户端节点可以处理多少并发批量 API 连接并成功写入数据，以及每个批量 API 请求的最大文档数应该是多少？

对于需要在一小时内索引 80-90 GB 数据的写入操作，我们应该研究哪些参数来优化 ElasticSearch 集群？

0 回答 0

java - Stax 未检测到结束元素

objective-c - 如何设计这样的 UI 控件？

email - 如何更改从我的应用程序发送的电子邮件中显示的名称？

android - 如何在“摇动”动作期间禁用方向传感器

c - struct node *head 和 struct node ** head 有什么区别？

c# - 使用 If Else-If 语句声明不同类型的变量

ruby-on-rails - 验证 JSON 是否在 rails 中返回 ["message", "Not Found"]

php - 将项目添加到数组

jquery - 在图像上淡入文本

php - 使用和生成链接

在 codeigniter 中使用锚嵌入

我正在使用 CodeIgniter 的锚标记来生成链接

这是我在视图中使用的代码：

<?=anchor('blog/post/'.$row->id,$row->title);?>

上面的代码正在渲染 url

<a h


	
	Reference
	
		php × 1429865 
	
	
		c/c++ × 756500 
	
	
		nginx × 49975 
	
	
		mongodb × 159057 
	
	
		mybatis × 3233 
	
	
		anaconda × 13410 
	
		
		pycharm × 14671 
	
	
		python × 1902243 
	
	
		vscode × 56040 
	
		
		docker × 110988 
	
	
		github × 49000 
	
	
		flask × 49129 
	
	
		ffmpeg × 24037 
	
	
	
		jmeter × 16910 
	
	
		matplotlib × 63493 
	
	
		bootstrap × 54641

hadoop - Elasticsearch 拯救了 ES-HADOOP PLUGIN

0 回答 0

Related

在 codeigniter 中使用锚嵌入

Reference