学习笔记Spark(二)—— Spark集群的安装配置

本文档详细介绍了如何在Linux环境下配置和启动一个小型的Spark集群,包括集群规模、安装模式、配置文件解读及修改、分发安装包、设置环境变量、启动与关闭流程。此外,还展示了运行第一个Spark程序的步骤,以及如何通过Web界面进行监控。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、我的软件环境


二、Spark集群拓扑

2.1、集群规模

192.168.128.10     master	 1.5G ~2G内存、20G硬盘、NAT、1~2核 ;
192.168.128.11     node1	1G内存、20G硬盘、NAT、1192.168.128.12     node2	1G内存、20G硬盘、NAT、1192.168.128.13     node3	1G内存、20G硬盘、NAT、1

2.2、Spark的安装模式

1、本地模式
在一个节点上安装Spark,利用本地线程运行程序,非分布式环境

2、伪分布式
Spark单机伪分布式是在一台机器上既有Master,又有Worker进程

3、完全分布式
全分布模式用于生产,至少需要3~4台机器,其中一台为为主节点,部署Master,其他节点部署Worker

4、HA高可用模式
在完全分布式基础上利用Zookeeper实现Master主从备份


三、Spark安装配置

3.1、Spark配置文件

Data: spark mllib里面用到的数据;
Ec2: 部署在亚马逊云平台上的脚本
Examples

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

别呀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值