hadoop decommission 时卡住

hbase, 云计算, 分布式
1月 20, 2015
1 评论

hadoop decommission一个节点Datanode，几万个block都同步过去了，但是唯独剩下2个block一直停留在哪，导致该节点几个小时也无法下线。hadoop UI中显示在Under Replicated Blocks里面有2个块始终无法消除。

Under Replicated Blocks 2
Under Replicated Blocks In Files Under Construction 2

Namenode日志里面一直有这样的滚动：

2015-01-20 15:04:47,978 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Block: blk_8859027644264991843_26141120, 
Expected Replicas: 3, live replicas: 2, corrupt replicas: 0, decommissioned replicas: 1, excess 
replicas: 0, Is Open File: true, Datanodes having this block: 10.11.12.13:50010 10.11.12.14:50010 
10.11.12.15:50010 , Current Datanode: 10.11.12.13:50010, Is current datanode decommissioning: 
true

google了好久，貌似是一个hadoop的bug，https://issues.apache.org/jira/browse/HDFS-5579
NameNode发现block的Replicas不够（期待应该有3个，实际有两个），或许是namenode认为数据不完整，执着地不让这个DataNode下架。。。

最终尝试如下方式解决，把replications设置成2：

hadoop fs -setrep -R 2 /

执行完后很快，该节点就下线了，神奇的replications。

u2

docker , 云计算
9月 11, 2019
141 views

rancher v2.x 初体验

rancher v2x

Continue reading

云计算 , 系统
3月 22, 2019
144 views

sqlalchemy.exc.TimeoutError: QueuePool limit of size 5 overflow 10 reached

Python3 + Flask + mysql5.7搭建的w…

Continue reading

One thought on “hadoop decommission 时卡住”

KEVI_说道：

2022年6月1日上午11:45

补充一下，我们也遇到了，是因为 Corrupt Blocks 导致的，删掉丢失的块就好了

评论已关闭。

本地AI时代来临：Ollama + MemPalace工作流深度指南

由 u2
4月 21, 2026
96 views

Raycast深度解析：这个让Mac效率重装升级的东西，到底值不值？

由 u2
4月 14, 2026
78 views

GitHub 25K+星标！Onyx：开源可自托管的企业级AI聊天与RAG平台

由 u2
4月 8, 2026
188 views

InternVL-U 统一多模态模型

由 u2
4月 3, 2026
171 views

InternVL-U 统一多模态模型

Everything Claude Code：开源 Agent 性能优化框架

由 u2
3月 31, 2026
196 views

AI AI与机器学习技术

MiroFish：群体智能预测引擎，让未来在数字沙盘中预演

由 u2
3月 29, 2026
292 views