一口气完成 Hadoop 全分布式集群 | 运维工程师的速通笔记_其他

首页
软件测试
- 批量生成测试数据，再次迎来升级，支持API调用，开发者的好帮手
- 软件测试-测试原则与方法
- 1个脚本跑1000组数据！美团测试总监亲授数据驱动实战
- 需求评审时，如何让开发主动说“这个用例写得好”？
- HPCG基准测试的几种执行方式
- 软件性能测试工具的发展以及不同性能测试工具之间的使用对比总结
- 自动化测试工程师的核心技能栈：你需要掌握哪些硬技能和软技能
- Selenium Web自动化：如何稳定地定位动态元素？8种方法汇总
- Postman接口测试全攻略：从入门到精通，看这一篇就够了
- 性能测试入门到精通：一文讲透JMeter核心元件与实战场景
- 软件测试人员必学的SQL查询语句大全
- UI自动化框架appium工作原理
- APP专项测试指南：网络、兼容、耗电量、内存泄漏一个都不能
- IOS、安卓机：批量导入-通讯录信息-教程：
- 初识JMeter 元件（一）
- Charles实战秘籍：弱网模拟、Map Local/Remote、HTTPS抓包详解
- 软件测试工程师的职业天花板在哪里？如何突破？
- 新人必看：入职第一个月，如何快速熟悉业务并开始测试？
- 测试工程师的核心竞争力是什么？绝不是点点点
- 金九银十：软件测试工程师高频面试题及答案解析
Shell
- HTML 教程
- PowerShell 实际应用
- PowerShell 脚本编写
- PowerShell 控制结构
- PowerShell 变量和作用域
- PowerShell 管道和过滤
- Cmdlet 网络与系统管理
- Cmdlet 进程和服务管理
- Cmdlet 文件系统操作
- PowerShell 基本语法
- PowerShell Cmdlet 基础
- PowerShell 面向对象的命令行
- PowerShell 入门
- PowerShell 核心概念
- PowerShell 安装
- PowerShell 简介
- PowerShell 教程
java
- 条码控件Aspose.BarCode教程：使用 Java 自动生成 DotCode 条形码
- 借助Aspose.ZIP SDK，Java 中提取CAB 文件的分步指南
- 剑指offer-29、最⼩的k个数
- 技术面：Java并发（线程同步、死锁、多线程编排）
- SSE技术总结
- 剑指offer-28、数组中出现次数超过⼀半的数字
- springboot~SpringData自定义Repository的正确方式
- 敏感词性能提升14倍优化全过程
- 写了一个java桌面版pdf转图片程序
- Java 8 终于要被淘汰了！带你速通 Java 8~24 新特性
- 国产化PDF处理控件Spire.PDF教程：如何在 Java 中通过模板生成 PDF
- 重写/多态/类型转换/其他
- 处理用户隐私数据，AES对称加密工具类，Crypto库及其使用
- 突破层级壁垒：Java通过递归实现目录结构的扁平化解析
- 把事件处理的思想应用到spring框架
- 简洁美观！一款值得 Star 的 Java 博客项目！
- Java并发编程（4）
- Java并发编程（3）
- Java并发编程（1）
- Spring篇知识点
Linux
- CentOS 根分区爆红？10 分钟无损“回血”全攻略（ext4 & XFS 双方案）
- Linux 命令大全（收藏级）
- grep 命令速查卡（收藏版）
- Linux Shell 脚本从 0 到 1：一篇就能写生产代码
- 掌握 Linux 路由跟踪：traceroute vs tracepath 超全指南
- Linux性能快速诊断：60秒搞定！
- 如何在Linux上清理内存缓存、缓冲与交换空间
- vi和vim的区别？
- 麒麟操作系统 Kylin V10 SP3 安装流程指南
- 麒麟V10系统，两台服务器配置redis集群
- 鸟哥Linux基础笔记
- 高效查日志进阶指南：掌握grep命令的完整技巧
- 银河麒麟v10 sysctl内核参数加载顺序的思考
- 部署自己的Docker镜像加速仓库
- 通过文件IO进行文件复制
- 通过MobaXterm操作远程服务器电脑的方法
- 递归中Return实例分析
- 进程间通讯代码实例以及相关函数释义
- 进程
- 运维神器！Docker 可视化管理面板！
- 运维排查 | SaltStack 远程命令执行中文乱码问题
- 运算符、分支语句
- 软件管理，磁盘存储，文件系统以及网络协议
- 转行嵌入式，需要自学多久？
- 超聚变服务器2288H V6使用 iBMC 安装 Ubuntu Server 24.04 LTS及后续系统配置
- 赞美Syscall
- 设置Linux快捷命令
- 记录一次Armbian安装宝塔面板遇到ModuleNotFoundError: No module named '_sqlite3'的问题
- 虚拟机的搭建
- 自行为一加6编译Postmarket os内核
- 自学stm32，需要会到什么程度能找到一份工作？
- 能详细地讲讲stm32该怎么学吗？
- 老奶奶看了都会的WSL2连接USB设备教程！
- 网络配置及进程-系统性能和计划任务
- 网络的系统配置+zabbix的安装配置
- 网站域名监控python脚本
- 统信UOS 1040版本系统无法安装软件
- 简单的linux Oops定位到bug代码行操作实践
- 第65篇 Linux命令放置目录
- 程序员界有哪些经典的笑话?
- 程序员是不是都要两个显示器？两个键盘？
- 程序员从幼稚到成熟的标志是什么？
- 神解释：为什么程序员怕改需求？
- 用dokcer搭建EFK（7.5.2）
- 游戏的程序员会不会偷偷改自己账号的数据？
- 深入解析Java启动参数：从基础配置到高级调优
- 深入掌握iostat：运维必备的I/O性能分析利器
- 海康工业相机的应用部署不是简简单单！？
- 正点原子新品首款Linux最小系统板RK3506B发布！超高性价比！超低功耗，满载功耗低发热小，实现性能与能效双突破！
- 树莓派无显示器进行ssh连接
- 条件锁存在的意义：用生活中的例子秒懂线程间的"暗号系统"
- 服务器Linux的一些常用命令，收藏备用！
- 普通用户修改repo文件下载rpm包
- 明察秋毫--用ss工具统计网络栈内存使用
- 新人如何入门学习 STM32？
- 文件操作
- 文件共享服务之实时备份（inotify+rsync）
- 文件上传漏洞
- 数据结构的概念、堆栈
- 推荐Linux命令行运维工具: WowKey--实现自动化批量化标准化Linux设备运维
- 掌握Linux磁盘管理：理解fdisk, lsblk, mount及resize2fs命令
- 掌握Linux命令行模式翻页，8个技巧助你游刃有余
- 手工设置透明网关代理_openwrt-22.03_xray_tproxy_fw4_nftables
- 思科（Cisco）和华三（H3C）交换机的Python巡检脚本
- 开箱即用！一个轻量易用的服务器监控！
- 开发者必备！这款终端工具轻松搞定 SSH、RDP、VNC 远程连接！
- 小米平板5（nabu）安装 HyperOS + Arch Linux 双系统
- 容器面试题
- 容器设置日志驱动程序 - docker --log-driver
- 安装坦克PWA3教程
- 如何通过云服务器搭建一个内网穿透服务器
- 如何在LInux上安装并运行Jenkins
- 如何修改 Docker 和 Docker Compose 默认占用的网段
- 如何0基础学stm32？
- 夜莺监控V6版本如何升级到V7
- 基本linux命令行
- 基于CentOS Stream 8的物联网数据采集与展示方案
- 在shell脚本中为日志添加颜色
- 在Ubuntu Server上安装Checkmk监控系统
- 在OERV也可以玩MC（上）
- 在 debian/ubuntu 下使用 libvirt 启动虚拟机报文件没有权限的问题
- 在 Linux 系统中开放端口
- 在 Debian 中使用 APT 包管理工具通过 Ubuntu PPA 安装最新软件包
- 国庆快乐！附ssh实战
- 命令行解释器（CLI）概念辨析
- 命令行命令纠错神器 The Fuck
- 告别虚拟机！WSL2安装配置教程！！！
- 变量的基本使用
- 双系统，使用archinstall安装系统后，启动选项里面没有Arch Linux的解决方法
- 单片机、嵌入式的大神都平时浏览什么网站？
- 华为悦盒EC6108V9刷机刷ubuntu以及安装cups驱动惠普1020plus打印机
- 利用坦克PWA3快速为应用配置域名：以Gogs为例
- 初学嵌入式是弄linux还是单片机？
- 关于服务器挖矿处理思路
- 关于实体机安装Ubuntu 22.04.3-desktop-amd64遇见的一些问题
- 全球首位 AI 程序员 Devin 诞生了，对于程序员的影响到底多大？
- 做stm32嵌入式的上限是做什么？薪资天花板是多少？
- 保姆教程系列：生成 SSH Key 并配置连接远程仓库
- 使用systemd 监控服务并实现故障自动重启
- 使用nmcli 和 route 命令行连接wifi, 调整路由权重
Apache
- Apache Shiro反序列化复现
Redis
- 几个查看Redis内存信息的命令
其他
- 一口气完成 Hadoop 全分布式集群 | 运维工程师的速通笔记
- 元素定位翻车现场！避开这3个坑效率翻倍（附定位神器）
- 常见SSL证书格式介绍以及SSL证书格式转化方法
- 1ZB、1EB、1PB 存储单位换算标准且和 TB 哪个大
- 常见的swoole_loader各个版本文件下载
- 四种香港云服务器网络带宽线路盘点
- 选择SSL证书类型介绍 - DV SSL、OV SSL和EV SSL证书区别
- 为什么说 HTTPS 很重要
- XSS语义分析的阶段性总结
- 如何防止XSS攻击？
- 整理php防注入和XSS攻击通用过滤
- 【高危】fastcdn用户数据库表存在明文，修改用户数据无鉴权限制即可增删改
- fastcdn删除节点数据缺乏身份验证机制
- fastcdn之SSH列表数据接口
- fastcdn系统昨日上线发现两个未经身份验证接口
- 手机号-社交媒体-地理位置开源情报
- xss攻击入门
Nginx
- 自定义Nginx错误页
- nginx动态添加访问白名单
- nginx防止DDOS攻击配置
- 在Nginx环境中实现HTTP跳转HTTPS的方法
- 如何设置LNMP或者LANP环境下的域名多端口访问
- 设置Nginx参数调整同IP访问页面的频率次数
docker
- Docker 安装与配置（CentOS / Ubuntu / Windows）
- Docker 容器文件拷贝
- Docker 安装与配置（CentOS / Ubuntu / Windows）
- Docker 运维人必备 7 大类 30+ 命令速查表
- 为什么不建议在 Docker 中跑 MySQL？
- 记录在CentOS/Debian/Ubuntu安装Docker及Docker compose
- Docker 无法启动报错的原因分析和解决策略
- 解决"Failed to start Docker Application Container Engine. "问题
数据库
- 解决MySQL“ERROR 1040: Too many connections”问题
- 高可用 proxysql + mysql MGR
- 面试：什么是死锁，如何避免或解决死锁；MySQL中的死锁现象，MySQL死锁如何解决
- 阿里云数据库Inventory Hint技术分析
- 针对大事务问题对业务存储过程改造
- 金仓数据库数据迁移实战：从MySQL到KES的顺利迁移
- 通过延时从库+binlog复制，恢复误操作数据
- 通过MySQL Workbench 将 SQL Server 迁移到GreatSQL
- 误操作后快速恢复数据 binlog 解析为反向 SQL
- 误删GreatSQL数据？别慌，Binlog来帮忙
- 记一次生产事故：一年的数据被删除了
- 自定义 MySQL Shell 提示符
- 聚集索引与非聚集索引的区别
- 统计一个字符在字符串里出现的次数
- 终止分区表变更操作时误删数据字典缓存导致MySQL崩溃分析
- 系统里这个同时查冷热表的sql，动动手指，从12s降到3s
- 系统变量group_replication_group_seeds为空导致MySQL节点无法启动组复制
- 第二十四讲：MySQL是怎么保证高可用的？
- 第二十八讲：如何判断一个数据库是不是出问题了？
- 第二十七讲：读写分离有哪些坑？
- 第三十讲：误删数据后除了跑路，还能怎么办？
- 第三十四讲：join语句怎么优化？
- 第三十六讲：什么时候会使用内部临时表？
- 第三十八讲：自增主键为什么不是连续的
- 第三十五讲：为什么临时表可以重名？
- 第三十二讲：我查这么多数据，会不会把数据库内存打爆？
- 第三十九讲：insert语句的锁为什么这么多？
- 第三十三讲：到底可不可以使用join？
- 第三十七讲：都说InnoDB好，那还要不要使用Memory引擎？
- 第三十一讲：为什么还有kill不掉的语句？
- 码城|计算机专业的00后转行数据分析，还有机会吗？【悟空非空也】
- 用systemd管理GreatSQL服务详解
- 独家揭秘丨GreatSQL 的MDL锁策略升级对执行的影响
- 深入理解 MySQL 锁机制
- 活动中台系统慢 SQL 治理实践
- 比想象中更复杂一点的MySQL Slow Query Log
- 某市驾驶培训监管服务平台 GreatSQL 数据库适配之旅
- 最全MySQL面试题和答案(四)
- 数据迁移丨借助 pg2mysql 从 PostgreSQL 到 GreatSQL
- 数据迁移丨借助 AI 从 PostgreSQL 到 GreatSQL
- 数据约束条件
- 数据库隔离级别
- 数据库中查询含有某个emoji表情的行数据
- 支持多种数据库！一款跨平台 SQL 编辑器和数据库管理器！
- 技术解读GaussDB (for MySQL)流控机制
- 慢SQL优化实战：从一例线上慢SQL探究执行引擎工作过程
- 工具分享丨数据闪回工具MyFlash
- 工具分享-通过开源工具 tuning-primer快速巡检MySQL5.7
- 工具分享-从ibd文件中恢复数据的神器ibd2sql
- 小白系列：数据库基础知识解析
- 安装MySQL8数据库
- 安装MySQL-9.1.0-winx64.msi的报错解决办法：Database initialization failed
- 字节跳动-后端开发岗实习面经
- 如何限制用户修改long_query_time
- 填坑 Plugin 'mysql_native_password' is not loaded
- 基于源码分析 SHOW GLOBAL STATUS 的实现原理
- 基于案例分析 MySQL 权限认证中的具体优先原则
- 基于 MySQL 8.0 细粒度授权：单独授予 KILL 权限的优雅解决方案
- 在Oracle到GreatSQL迁移中排序规则改变引发的乱码问题分析及解决
- 在 OceanBase 中，如何应对存储引擎的读放大问题？
- 图表接口按日期的统计查询开发
- 单条记录大小增长倍数和ibd文件大小的增长倍数不成正比
- 单个48TB大小SQL Server数据库备份导致日志文件无法截断
- 华为openEuler安装MYSQL数据库
- 加速无索引表引起的主从延迟数据回放
- 利用版本回退实现误操作数据恢复
- 分区函数partition by的基本用法【转载】
- 分享一个 MySQL binlog 分析小工具
- 函数索引触发的一个有趣的问题
- 关于当批量保存数据到数据库中时一直只有一条数据的问题
- 关于建表字段是否该使用not null这个问题你怎么看?
- 全局锁、表锁、行锁
- 保姆级 | MySQL的安装配置教程（非常详细）
- 使用xtrabackup实现mysql定时热备份
- 使用MySQL Workbench进行数据库备份
- 使用Docker部署的基于binlog实现Mysql8
- 使用 gt-checksum 迁移表结构到 GreatSQL
- 使用 gt-checksum 分析迁移对象
- 优化GreatSQL日志文件空间占用
- 从自建到云原生：数据管理的未来与变革
- 事务的ACID原则
- 事务处理对持久统计信息自动收集的影响
- 了解Mysql优化吗？如何优化索引？
- 主键约束、唯一性约束、唯一性索引的区别
- 主从复制中定位回放慢涉及的表
- 为什么要有 Buffer Pool？Mysql缓存能否替代Redis？
- 世事洞明皆学问 — 如何理解 OB 4.x 版本中的日志流？
- 一文详解 MySQL 中的间隙锁
- 一文彻底弄懂mysql的事务日志，undo log 和 redo log
- 一文带你深度解析MySQL 8.0事务提交原理
- 【解决方案】基于数据库驱动的自定义 TypeHandler 处理器
- 【GreatSQL优化器-18】GROUP_INDEX_SKIP_SCAN
- 【GreatSQL优化器-17】DYNAMIC RANGE
- 【GreatSQL优化器-16】INDEX_SKIP_SCAN
- 【GreatSQL优化器-15】index merge
- 【GreatSQL优化器-14】直方图应用
- 【GreatSQL优化器-13】直方图
- 【GreatSQL优化器-12】make_tmp_tables_info
- 【GreatSQL优化器-11】finalize_table_conditions
- 【GreatSQL优化器-10】find_best_ref
zblog模板
Pbootcms
PHP
- ThinkPHP+Bootstrap后台管理系统
Typecho主题
- Typecho WaterDrop 简洁博客模板
- Typecho Jasmine 简约主题模板
- Typecho Joe 简约两栏模板下载
苹果cms
帝国CMS
Discuz模板
易优CMS
worpress主题
- WordPress 自媒体资讯类博客主题 Meteor
织梦cms
易优CMS教程
织梦教程
- dedecms织梦程序安装后无法修改栏目
- dedecms织梦发布内容网站为空白排查
- 加固版织梦CMS整站源码通用安装教程
PbootCMS教程
- pbootcms编辑器过滤div代码解决办法
- pbootcms url路径地址被挂马解决办法
- Pbootcms安全设置防护教程
- pbootcms模版目录路径
- PbootCMS后台风格美化
- PbootCms关闭自动更新防止二开文件被覆盖
- 最新pbootcms被挂马终极解决方案
- pbootcms火车头采集免登录模块
- 安装pbootcms 报错 Desc: Function get_magic_quotes_gpc is deprecated; 解决方案
- pbootcms提示：URL名称与模型URL名称冲突，请换一个名称！
- PbootCMS怎么安装mysql
- PbootCMS面包屑导航样式修改
- pbootcms 设置的会话目录创建失败解决办法
- PbootCMS使用MySQL数据库配置方法
- Pbootcms Sqlite转Mysql
- pbootcms推送3种方法，不用插件
- pbootcms 栏目打不开
- PbootCMS采集工具推荐及采集注意事项
- Pbootcms 提示PDO方式连接数据库错误：invalid data source name
- pbootcms未检测到sqlite3数据库扩展怎么解决
- PbootCMS修改模板工具：打造个性化网站新利器
- pbootcms后台密码忘记找回
- PbootCMS换模板教程方法
- PbootCMS模板免费下载
- PBootcms指定栏目标签怎么用
- PBootcms当前栏目标签怎么用
- PBootcms导航菜单怎么调用
- PBootcms常用站点信息标签调用
- PBootcms常用公司信息标签调用
- PBootcms内容详情页标签
- pbootcms上一篇下一篇调用改成英文
- pbootcms做英文站面包屑“首页”怎么处理
- pbootcms公共标签调用
- pbootcms伪静态规则怎么配置
- pbootcms栏目页如何调用当前栏目的文章
- PbootCMS修改网站标题显示方式，去掉副标题
- 最全PbootCMS常用if判断语句总结
- PbootCMS默认面包屑导航怎么进行修改
- PBootCMS图文安装使用教程
- 运行PbootCMS系统有哪些环境要求？
- pbootcms友情链接怎么调用
- PBootcms幻灯片轮播图怎么调用
- PBootcms网站tags标签如何调用
- PbootCMS增加tag标签文章数量显示
- PbootCMS中使用sql标签统计网站留言总数
- PBootCMS产品多图展示调用
- PBootCMS指定内容标签怎么用
- PBootCMS的万能循环标签{pboot:sql}怎么用
- PbootCMS后台登录验证码不显示或者看不清楚解决办法
- pbootcms嵌套调用栏目二级三级目录
- PBootcms分页条标签怎么调用
- PBootcms内容列表标签怎么用
- pbootcms判断IF标签的应用
- pbootcms多条件筛选功能实现与调用
- pbootcms会员相关标签调用
- pbootcms自定义表单怎么调用
- pbootcms模板中那些url怎么调用
- pbootcms首页调用公司简介等频道内容
- PbootCMS分页条效果之数字条效果
- PbootCMS多条件搜索怎么写
- PbootCMS设置当前站点模板,模板子目录,黑白名单,敏感词过滤
- pbootcms编辑器无法上传图片：后端配置项没有正常加载，上传插件不能正常使用
- pbootcms留言自定义表单怎么调用
- pbootcms给轮播图片再增加一个上传项的方法
- pbootcms对标题和描述限制字数的方法
- pbootcms程序利用计划任务执行网站自动推送到百度
- pbootcms后台内容列表增加阅读量和点赞量自定义修改
- PBOOTCMS增加内容首图为缩略图按钮及内容图片为多图按钮
- pbootcms上传缩略图截取尺寸缩小变模糊解决方案
- pbootcms发布内容不自动提取缩略图设置方法
- pbootcms模板好用吗？是否收费，哪里的模板比较全
- pbootcms中IF条件语句是怎么使用的？
- pbootcms后台编辑器过滤div等html标签的解决办法
- PbootCMS时间标签date常用格式调用方法大全
- pbootcms怎么调用网站的留言数和文章总数
- PbootCMS网站获取指定栏目下面所有单页内容办法
- PbootCMS网站标题描述等标签限制字数的办法
- PBOOTCMS栏目/列表标签序号数从第N个开始的办法
- PbootCMS伪静态配置教程以及各web容器配置规则
- pbootcms域名授权码怎么获取，获取后怎么授权
- PbootCMS网站后台登录页面样式怎么修改
- 用PbootCMS建站好用吗？这个cms有哪些优点
- pbootcms网站容易被攻击和被黑吗?
- pbootcms网站百度site网址异常的解决办法
- pbootcms模板时间格式调用方法详解
- pbootcms增加webp和mov等格式文件类型上传的方法
- PbootCMS后台SEO标题规则设置
- PbootCMS一些常用组合标签调用代码整理
- PbootCMS如何让客服在网站的留言直接邮件提醒
- PbootCMS性能优化研究之提升网页访问速度
- PbootCMS网站常见错误提示总结
- pbootcms怎么推送发布的文章到百度
- Pbootcms留言“提交成功”的提示语怎么修改
- pbootcms访问页面出现PHP Fatal error: Allowed memory size of 134217728 bytes exhausted
- windows系统配置nginx环境运行pbootcms访问首页直接404的问题
- pbootcms去除ueditor编辑器图片自动添加的title和alt属性
- PbootCMS后台常用文件修改路径位置
- 怎么安装使用PbootCMS网站模板
- PbootCMS生成的sitemap.xml中增加tag标签链接
- pbootcms修改后台文章每页显示数量的修改办法
worpress教程
- pbootcms 新增栏目提示：栏目编号已经存在，不能再使用
- PbootCMS修改TAG地址URL静态化
- pbootCMS修改数据库链接密码
- pbootcms模板自动生成当前页面二维码
- pbootcms文章插入图片不固定宽高的办法
- PbootCMS附件上传报错UNKNOW: Code: 8192; Desc: stripos()
- PbootCMS调用内容中换行符br不换行怎么办
苹果cms教程
zblog教程
帝国CMS教程
飞牛nas
- 飞牛系统ISO-TRIM-0.8.20-394
- 飞牛系统ISO-TRIM-0.8.19-360
- 飞牛系统iso-TRIM-0.8.18-359
- 飞牛系统ISO-TRIM-0.8.16-331
996知识

一口气完成 Hadoop 全分布式集群 | 运维工程师的速通笔记

1. 环境说明

节点	IP	角色
hadoop01	192.168.227.132	NameNode + ResourC++eManager
hadoop02	192.168.227.133	DataNode + NodeManager + SecondaryNameNode
hadoop03	192.168.227.134	DataNode + NodeManager

所有节点已安装同版本 CentOS 7/8，普通用户 hadoop 具备 sudo 权限。创建hadoop用户

# 1. 创建用户并设置密码
sudo useradd -m -s /bin/bash hadoop
echo "hadoop:hadoop123" | sudo chpasswd   # hadoop123密码可自行修改

# 2. 加入 wheel 组（CentOS/RHEL）
sudo usermod -aG wheel hadoop

# 3. 确保 wheel 组可免密 sudo（仅第一次需执行）
sudo sed -i 's/^# %wheel ALL=(ALL) NOPASSWD: ALL/%wheel ALL=(ALL) NOPASSWD: ALL/' /etc/sudoers

# 4. 验证
su - hadoop
sudo whoami   # 预期输出 root

2. 统一 hosts 与免密登录

2.1 同步 hosts（所有节点）

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF

2.2 生成并分发密钥（仅需一次）

# 在 hadoop01 / hadoop02 / hadoop03 依次执行
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
for h in hadoop01 hadoop02 hadoop03; do
  ssh-copy-id -o StrictHostKeyChecking=no $h
done



命令解释：

### 1. `ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa`
- `ssh-keygen`：生成 SSH 密钥对。
- `-t rsa`：指定算法为 RSA（老习惯，现在更推荐 ed25519，但 Hadoop 生态里 RSA 依旧常见）。
- `-P ''`：设置私钥的**密码短语（passphrase）为空**，即免输入。
- `-f ~/.ssh/id_rsa`：把私钥/公钥文件写到默认位置 `~/.ssh/id_rsa`（私钥）和 `~/.ssh/id_rsa.pub`（公钥）。

执行后，当前用户就有了自己的「钥匙」：  
- 私钥：`~/.ssh/id_rsa`（留在本机，权限 600）  
- 公钥：`~/.ssh/id_rsa.pub`（可以分发给别人）

---

### 2. `for h in hadoop01 hadoop02 hadoop03; do ... done`
- 一个 Bash 循环，把后面那行命令依次对 `hadoop01、hadoop02、hadoop03` 执行一遍。

---

### 3. `ssh-copy-id -o StrictHostKeyChecking=no $h`
- `ssh-copy-id`：把当前用户的公钥追加到远程主机 `$h` 的 `~/.ssh/authorized_keys` 文件里，实现免密登录。
- `-o StrictHostKeyChecking=no`：第一次连接时不提示 `The authenticity of host ... can't be established`，直接自动写入 known_hosts。  
  **注意**：生产环境如果担心中间人攻击，可以去掉此参数手动验证指纹；但在自动化脚本里很常见。

---

验证：

ssh hadoop02 'echo ✔ SSH 免密成功'

3. 目录与安装包准备

3.1 统一目录结构（所有节点）

sudo mkdir -p /export/{servers,software}
#数据存放路径
mkdir -p /data1/hadoop/dn
mkdir -p /data2/hadoop/dn
mkdir -p /data3/hadoop/dn
sudo chown -R $(whoami) /export

3.2 上传安装包（任选其一）

Xshell/Xftp 图形拖拽
scp 命令
一行 rz（需 yum -y install lrzsz）

需要以下两个包：

jdk-8u461-Linux-x64.tar.gz
hadoop-2.10.2.tar.gz

4. JDK 一键安装脚本

保存为 install_jdk.sh，所有节点执行：

#!/bin/bash
set -e
cd /export/software
tar -zxf jdk-8u461-linux-x64.tar.gz -C /export/servers/
mv /export/servers/jdk1.8.0_461 /usr/lib/jdk

cat >> /etc/profile.d/Java.sh <<'EOF'
export JAVA_HOME=/usr/lib/jdk
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
EOF
source /etc/profile.d/java.sh
java -version

执行权限：

chmod +x install_jdk.sh && ./install_jdk.sh

5. Hadoop 安装与环境变量

5.1 解压与软链（所有节点）

cd /export/software
tar -zxf hadoop-2.10.2.tar.gz -C /export/servers/
ln -snf /export/servers/hadoop-2.10.2 /export/servers/hadoop

5.2 环境变量

cat >> /etc/profile.d/hadoop.sh <<'EOF'
export HADOOP_HOME=/export/servers/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
EOF
source /etc/profile.d/hadoop.sh
hadoop version

6. 六大核心配置文件（逐行中文备注，照抄即可）

以下操作只在 hadoop01 执行，随后 7.7 节一键同步到其它节点。

6.1 指定 JDK 路径 —— hadoop-env.sh

# 直接替换文件中的 JAVA_HOME 一行
sed -i '/^export JAVA_HOME=/c\export JAVA_HOME=/usr/lib/jdk' \
    $HADOOP_CONF_DIR/hadoop-env.sh

6.2 核心公共参数 —— core-site.xml

在 <configuration> 内填入：

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
0

6.3 HDFS 特有参数 —— hdfs-site.xml

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
1

6.4 MapReduce 运行框架 —— mapred-site.xml

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
2

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
3

6.5 YARN 框架参数 —— yarn-site.xml

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
4

6.6 集群节点列表 —— slaves

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
5

7. 集群同步与格式化

7.1 一键分发

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
6

7.2 格式化 NameNode（仅在 hadoop01）

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
7

8. 启动、验证、UI 访问

8.1 启动集群

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
8

8.2 进程检查

sudo tee /etc/hosts <<'EOF'
192.168.227.132 hadoop01
192.168.227.133 hadoop02
192.168.227.134 hadoop03
EOF
9

8.3 关闭防火墙（所有节点）

# 在 hadoop01 / hadoop02 / hadoop03 依次执行
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
for h in hadoop01 hadoop02 hadoop03; do
  ssh-copy-id -o StrictHostKeyChecking=no $h
done



命令解释：

### 1. `ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa`
- `ssh-keygen`：生成 SSH 密钥对。
- `-t rsa`：指定算法为 RSA（老习惯，现在更推荐 ed25519，但 Hadoop 生态里 RSA 依旧常见）。
- `-P ''`：设置私钥的**密码短语（passphrase）为空**，即免输入。
- `-f ~/.ssh/id_rsa`：把私钥/公钥文件写到默认位置 `~/.ssh/id_rsa`（私钥）和 `~/.ssh/id_rsa.pub`（公钥）。

执行后，当前用户就有了自己的「钥匙」：  
- 私钥：`~/.ssh/id_rsa`（留在本机，权限 600）  
- 公钥：`~/.ssh/id_rsa.pub`（可以分发给别人）

---

### 2. `for h in hadoop01 hadoop02 hadoop03; do ... done`
- 一个 Bash 循环，把后面那行命令依次对 `hadoop01、hadoop02、hadoop03` 执行一遍。

---

### 3. `ssh-copy-id -o StrictHostKeyChecking=no $h`
- `ssh-copy-id`：把当前用户的公钥追加到远程主机 `$h` 的 `~/.ssh/authorized_keys` 文件里，实现免密登录。
- `-o StrictHostKeyChecking=no`：第一次连接时不提示 `The authenticity of host ... can't be established`，直接自动写入 known_hosts。  
  **注意**：生产环境如果担心中间人攻击，可以去掉此参数手动验证指纹；但在自动化脚本里很常见。

---

0

8.4 Windows 本地 hosts

在 C:\Windows\System32\drivers\etc\hosts 追加：

# 在 hadoop01 / hadoop02 / hadoop03 依次执行
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
for h in hadoop01 hadoop02 hadoop03; do
  ssh-copy-id -o StrictHostKeyChecking=no $h
done



命令解释：

### 1. `ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa`
- `ssh-keygen`：生成 SSH 密钥对。
- `-t rsa`：指定算法为 RSA（老习惯，现在更推荐 ed25519，但 Hadoop 生态里 RSA 依旧常见）。
- `-P ''`：设置私钥的**密码短语（passphrase）为空**，即免输入。
- `-f ~/.ssh/id_rsa`：把私钥/公钥文件写到默认位置 `~/.ssh/id_rsa`（私钥）和 `~/.ssh/id_rsa.pub`（公钥）。

执行后，当前用户就有了自己的「钥匙」：  
- 私钥：`~/.ssh/id_rsa`（留在本机，权限 600）  
- 公钥：`~/.ssh/id_rsa.pub`（可以分发给别人）

---

### 2. `for h in hadoop01 hadoop02 hadoop03; do ... done`
- 一个 Bash 循环，把后面那行命令依次对 `hadoop01、hadoop02、hadoop03` 执行一遍。

---

### 3. `ssh-copy-id -o StrictHostKeyChecking=no $h`
- `ssh-copy-id`：把当前用户的公钥追加到远程主机 `$h` 的 `~/.ssh/authorized_keys` 文件里，实现免密登录。
- `-o StrictHostKeyChecking=no`：第一次连接时不提示 `The authenticity of host ... can't be established`，直接自动写入 known_hosts。  
  **注意**：生产环境如果担心中间人攻击，可以去掉此参数手动验证指纹；但在自动化脚本里很常见。

---

1

8.5 Web UI

HDFS：http://hadoop01:50070
YARN：http://hadoop01:8088

9. 验证是否可以上传数据

# 在 hadoop01 / hadoop02 / hadoop03 依次执行
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
for h in hadoop01 hadoop02 hadoop03; do
  ssh-copy-id -o StrictHostKeyChecking=no $h
done



命令解释：

### 1. `ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa`
- `ssh-keygen`：生成 SSH 密钥对。
- `-t rsa`：指定算法为 RSA（老习惯，现在更推荐 ed25519，但 Hadoop 生态里 RSA 依旧常见）。
- `-P ''`：设置私钥的**密码短语（passphrase）为空**，即免输入。
- `-f ~/.ssh/id_rsa`：把私钥/公钥文件写到默认位置 `~/.ssh/id_rsa`（私钥）和 `~/.ssh/id_rsa.pub`（公钥）。

执行后，当前用户就有了自己的「钥匙」：  
- 私钥：`~/.ssh/id_rsa`（留在本机，权限 600）  
- 公钥：`~/.ssh/id_rsa.pub`（可以分发给别人）

---

### 2. `for h in hadoop01 hadoop02 hadoop03; do ... done`
- 一个 Bash 循环，把后面那行命令依次对 `hadoop01、hadoop02、hadoop03` 执行一遍。

---

### 3. `ssh-copy-id -o StrictHostKeyChecking=no $h`
- `ssh-copy-id`：把当前用户的公钥追加到远程主机 `$h` 的 `~/.ssh/authorized_keys` 文件里，实现免密登录。
- `-o StrictHostKeyChecking=no`：第一次连接时不提示 `The authenticity of host ... can't be established`，直接自动写入 known_hosts。  
  **注意**：生产环境如果担心中间人攻击，可以去掉此参数手动验证指纹；但在自动化脚本里很常见。

---

2