云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > Spark on YARN环境搭建

Spark on YARN环境搭建

  • 62 次阅读
  • 3 次下载
  • 2025/12/10 17:19:57

dfs.permissions.enabled false

HA模式下该参数为streamcluster中namenode1节点对外服务的RPC地址

dfs.namenode.rpc-address.streamcluster.nn1 master:8033

HA模式下该参数为streamcluster中namenode1节点对外服务的RPC地址

dfs.namenode.rpc-address.streamcluster.nn2 slave1:8033

HA模式下该参数为streamcluster中namenode1节点对外服务的HTTP地址

dfs.namenode.http-address.streamcluster.nn1 master:50083

HA模式下该参数为streamcluster中namenode1节点对外服务的HTTP地址

dfs.namenode.http-address.streamcluster.nn2 slave1:50083

设置的为journalNode的地址,Activity状态中的Namenode会将edits的Log写入JournalNode,而standby状态中的Namenode会读取这些edits log.

dfs.namenode.shared.edits.dir

qjournal://master:8489;slave1:8489;slave2:8489/streamcluster

JournalNode 所在节点上的一个目录,用于存放 editlog 和其他状态信息。

dfs.journalnode.edits.dir

/home/hadoop/hadoop-2.6.4/data/jn

journalNode RPC服务地址和端口

dfs.journalnode.rpc-address

0.0.0.0:8489

journalNode HTTP服务地址和端口

dfs.journalnode.http-address 0.0.0.0:8484

此参数为客户端与activity状态下的Namenode进行交互的java实现类,DFS客户端通过该类寻找当前activity的Namenode

dfs.client.failover.proxy.provider.streamcluster

org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider

使HA模式下不会同时出现两个master,不允许出现两个activity状态下的Namenode

dfs.ha.fencing.methods shell(/bin/true)

SSH的超时时间设置,倘若超过此时间,则认为执行失败.

dfs.ha.fencing.ssh.connect-timeout 10000

指定streamcluster的两个NameNode共享edits文件目录时,使用的JournalNode集群信息

dfs.ha.automatic-failover.enabled true

每个datanode任一时刻可以打开的文件数量上限。

dfs.datanode.max.xcievers 4096

DataNode传送数据出入的最大线程数,等同于dfs.datanode.max.xcievers。

dfs.datanode.max.transfer.threads 4096

块的字节大小

dfs.blocksize 67108864

一般原则是将其设置为集群大小的自然对数乘以20,即20logN, NameNode有一个工作线程池用来处理客户端的远程过程调用及集群守护进程的调用。处理程序数量越多意味着要更大的池来处理来自不同DataNode的并发心跳以及客户端并发的元数据操作。

dfs.namenode.handler.count 20

ha.zookeeper.quorum

master:2183,slave1:2183,slave2:2183

(3)yarn-site.xml

NodeManager的心跳间隔

yarn.resourcemanager.connect.retry-interval.ms 2000

是否启用RM HA,默认为false(不启用)。这里设置为启用。

yarn.resourcemanager.ha.enabled true

是否启用自动故障转移。默认情况下,在启用HA时,启用自动故障转移。

yarn.resourcemanager.ha.automatic-failover.enabled true

启用内置的自动故障转移。默认情况下,在启用HA时,启用内置的自动故障转移。

yarn.resourcemanager.ha.automatic-failover.embedded true

集群的ID,确保ResourceManager不会为成为其他集群的Activity活跃状态。

yarn.resourcemanager.cluster-id yarn-rm-cluster

HA下两个ResourceManager的逻辑名称

yarn.resourcemanager.ha.rm-ids rm1,rm2

用于标识ResourceManager,这里要注意一点,HA备用的RM的服务器需要修改为rm2

yarn.resourcemanager.ha.id rm1

启用重启ResourceManager的功能,默认为false

yarn.resourcemanager.recovery.enabled true

用于状态存储的类,可以设置为

org.apache.hadoop.yarn.server.resourcemanager.recovery.FileSystemRMStateStore,基于Hadoop文件系统的实现,这里的设置是基于ZooKeeper的实现

yarn.resourcemanager.store.class

org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore

存储RM状态的ZooKeeper Znode全路径。

搜索更多关于: Spark on YARN环境搭建 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

dfs.permissions.enabled false HA模式下该参数为streamcluster中namenode1节点对外服务的RPC地址 dfs.namenode.rpc-address.streamcluster.nn1 master:8033 HA模式下该参数为streamcluster中namenode1节点对外服务的RPC地址 dfs.namenode.rpc-address.streamcluster.nn2 slave1:8033

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com