HDFS的Shell操作(开发重点)
以之前的Hadoop环境为基础
把之前的用docker启的Hadoop环境启动
STATUS为Exited(退出)
现在8088端口和50070端口访问不了2333, 可能是防火墙, 还是其他的什么问题2333.
重新把之前的搭一遍关于上面的问题之后在解决
进入到那个叫hadoop-master的docker环境里面把hadoop启动
基础语法
准备工作
创建/sanguo文件夹
root@hadoop-master:~# hadoop fs -mkdir /sanguo
上传
-moveFromLocal:从本地剪切粘贴到HDFS
root@hadoop-master:~# vi shuguo.txt
写入
shuguo
root@hadoop-master:~# hadoop fs -moveFromLocal ./shuguo.txt /sanguo
-put:等同于copyFromLocal,生产环境更习惯用put
root@hadoop-master:~# vi wuguo.txt
写入
wuguo
root@hadoop-master:~# hadoop fs -put ./wuguo.txt /sanguo
-appendToFile:追加一个文件到已经存在的文件末尾
root@hadoop-master:~# vi liubei.txt
写入
liubei
root@hadoop-master:~# hadoop fs -appendToFile liubei.txt /sanguo/shuguo.txt
下载
-copyToLocal:从HDFS拷贝到本地
root@hadoop-master:~# ls
hdfs input liubei.txt run-wordcount.sh start-hadoop.sh wuguo.txt
root@hadoop-master:~# hadoop fs -copyToLocal /sanguo/shuguo.txt ./
root@hadoop-master:~# ls
hdfs input liubei.txt run-wordcount.sh shuguo.txt start-hadoop.sh wuguo.txt
root@hadoop-master:~# cat shuguo.txt
shuguo
liubei
root@hadoop-master:~#
HDFS直接操作
这里的操作就不截图了
1)-ls: 显示目录信息
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -ls /sanguo
2)-cat:显示文件内容
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -cat /sanguo/shuguo.txt
3)-chgrp、-chmod、-chown:Linux文件系统中的用法一样,修改文件所属权限
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -chmod 666 /sanguo/shuguo.txt
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -chown atguigu:atguigu /sanguo/shuguo.txt
4)-mkdir:创建路径
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -mkdir /jinguo
5)-cp:从HDFS的一个路径拷贝到HDFS的另一个路径
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -cp /sanguo/shuguo.txt /jinguo
6)-mv:在HDFS目录中移动文件
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -mv /sanguo/wuguo.txt /jinguo
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -mv /sanguo/weiguo.txt /jinguo
7)-tail:显示一个文件的末尾1kb的数据
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -tail /jinguo/shuguo.txt
8)-rm:删除文件或文件夹
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -rm /sanguo/shuguo.txt
9)-rm -r:递归删除目录及目录里面内容
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /sanguo
10)-du统计文件夹的大小信息
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -du -s -h /jinguo
27 81 /jinguo
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -du -h /jinguo
14 42 /jinguo/shuguo.txt
7 21 /jinguo/weiguo.txt
6 18 /jinguo/wuguo.tx
说明:27表示文件大小;81表示27*3个副本;/jinguo表示查看的目录
11)-setrep:设置HDFS中文件的副本数量
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -setrep 10 /jinguo/shuguo.txt
这里设置的副本数只是记录在NameNode的元数据中,是否真的会有这么多副本,还得看DataNode的数量。因为目前只有3台设备,最多也就3个副本,只有节点数的增加到10台时,副本数才能达到10。
HDFS的API操作
Windows搭建Hadoop环境
参考链接:
在IDEA中创建一个Maven工程HdfsClientDemo,并导入相应的依赖坐标+日志添加
通过maven导入时不需要手动引入jar包
pom.xml 开始会报错
maven可以自动导入jar包
最终效果
这里参考
在IDEA中创建maven项目编写java代码操作HDFS集群
idea中maven项目出现”Cannot resolve jdk.tools:jdk.tools:1.7”
这里报错了需要下载 winutils
下载链接: https://github.com/cdarlint/winutils
参考文档下载: