• <fieldset id="8imwq"><menu id="8imwq"></menu></fieldset>
  • <bdo id="8imwq"><input id="8imwq"></input></bdo>
    最新文章專題視頻專題問答1問答10問答100問答1000問答2000關(guān)鍵字專題1關(guān)鍵字專題50關(guān)鍵字專題500關(guān)鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關(guān)鍵字專題關(guān)鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
    問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
    當(dāng)前位置: 首頁 - 科技 - 知識百科 - 正文

    Hadoop運維筆記之Balancer難以在快速增長的集群上平衡大量的數(shù)

    來源:懂視網(wǎng) 責(zé)編:小采 時間:2020-11-09 12:58:49
    文檔

    Hadoop運維筆記之Balancer難以在快速增長的集群上平衡大量的數(shù)

    Hadoop運維筆記之Balancer難以在快速增長的集群上平衡大量的數(shù):背景: 公司在線上使用了CDH5集群,一開始由于疏忽,忘記了在計劃任務(wù)中定期執(zhí)行Balancer來平衡各節(jié)點的數(shù)據(jù)。 后來,在引入大量的Job之后,數(shù)據(jù)增長非常迅猛,有很多節(jié)點開始出現(xiàn)利用率超過99.9%的情況,部分Job甚至開始Failed。 于是我們便執(zhí)行Balan
    推薦度:
    導(dǎo)讀Hadoop運維筆記之Balancer難以在快速增長的集群上平衡大量的數(shù):背景: 公司在線上使用了CDH5集群,一開始由于疏忽,忘記了在計劃任務(wù)中定期執(zhí)行Balancer來平衡各節(jié)點的數(shù)據(jù)。 后來,在引入大量的Job之后,數(shù)據(jù)增長非常迅猛,有很多節(jié)點開始出現(xiàn)利用率超過99.9%的情況,部分Job甚至開始Failed。 于是我們便執(zhí)行Balan

    背景: 公司在線上使用了CDH5集群,一開始由于疏忽,忘記了在計劃任務(wù)中定期執(zhí)行Balancer來平衡各節(jié)點的數(shù)據(jù)。 后來,在引入大量的Job之后,數(shù)據(jù)增長非常迅猛,有很多節(jié)點開始出現(xiàn)利用率超過99.9%的情況,部分Job甚至開始Failed。 于是我們便執(zhí)行Balancer來

    背景:
    公司在線上使用了CDH5集群,一開始由于疏忽,忘記了在計劃任務(wù)中定期執(zhí)行Balancer來平衡各節(jié)點的數(shù)據(jù)。
    后來,在引入大量的Job之后,數(shù)據(jù)增長非常迅猛,有很多節(jié)點開始出現(xiàn)利用率超過99.9%的情況,部分Job甚至開始Failed。

    于是我們便執(zhí)行Balancer來清理數(shù)據(jù),結(jié)果發(fā)現(xiàn)有26T的數(shù)據(jù)需要平衡,而Balancer每次只移動50G的數(shù)據(jù),并且耗時30分鐘,而集群每個小時新寫入的數(shù)據(jù)會導(dǎo)致又有40-60G的數(shù)據(jù)需要平衡。這樣一來,Balancer就根本無法勝任了。

    14/10/14 20:31:11 INFO balancer.Balancer: Need to move 26.49 TB to make the cluster balanced.
    14/10/14 20:31:11 INFO balancer.Balancer: Decided to move 10 GB bytes from 10.100.1.10:50010 to 10.100.1.60:50010
    14/10/14 20:31:11 INFO balancer.Balancer: Decided to move 10 GB bytes from 10.100.1.20:50010 to 10.100.1.70:50010
    14/10/14 20:31:11 INFO balancer.Balancer: Decided to move 10 GB bytes from 10.100.1.30:50010 to 10.100.1.80:50010
    14/10/14 20:31:11 INFO balancer.Balancer: Decided to move 10 GB bytes from 10.100.1.40:50010 to 10.100.1.90:50010
    14/10/14 20:31:11 INFO balancer.Balancer: Decided to move 10 GB bytes from 10.100.1.50:50010 to 10.100.1.100:50010
    14/10/14 20:31:11 INFO balancer.Balancer: Will move 50 GB in this iteration
    ...
    

    解決辦法:
    1. 增加Balancer可操作的帶寬
    我們思考,是否是因為Balancer的默認帶寬太小,所以效率低下,于是我們嘗試將Balancer的帶寬擴容到了500M/s:

    hadoop dfsadmin -setBalancerBandwidth 524288000
    

    但問題并沒有得到太大的改善。

    2. 強行對節(jié)點進行Decommission
    我們發(fā)現(xiàn),當(dāng)對一些節(jié)點進行Decommission操作時,上面的數(shù)據(jù)雖然有10-30T甚至更多,但總能在1天內(nèi)全部Copy到其它的節(jié)點上,這里面由于默認集群副本數(shù)為3的原因,應(yīng)該只有1/3的數(shù)據(jù)被復(fù)制了,但數(shù)據(jù)是完整的,并且被復(fù)制出去的數(shù)據(jù)也是平均分配到各個節(jié)點上的。那么我們何不使用它來作為一個類似Balancer的功能來解決一些磁盤用量超過99.9%的節(jié)點呢?
    事實證明,這個方法非常可行,我們針對線上8個節(jié)點進行了Decommission操作(注意要盡量一臺一臺進行),在完成下線之后再立刻格式化數(shù)據(jù)磁盤,并重新添加回集群,新的數(shù)據(jù)也會非常快的平衡過來。比較完美的解決了之前頭疼的問題,并且只花費了不到4天的時間。

    3. Hadoop對LVM磁盤卷的支持問題
    在解決Balancer的問題時,我們還發(fā)現(xiàn),Hadoop對LVM磁盤卷的支持不是很好,表現(xiàn)在如果在一塊磁盤上創(chuàng)建了邏輯卷/根分區(qū)等,再創(chuàng)建了邏輯卷/data1分區(qū),Hadoop會一直將/data1寫到100%,然后導(dǎo)致一些Job提示沒有空間寫入。我們猜想Hadoop應(yīng)該是物理卷為單位來控制用量的。因此,我們不得不將這些包含了邏輯卷數(shù)據(jù)磁盤的主機重新安裝,并分配單獨的物理卷,如/dev/sda3作為/data1掛載,便再也沒有以上問題。

    聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

    文檔

    Hadoop運維筆記之Balancer難以在快速增長的集群上平衡大量的數(shù)

    Hadoop運維筆記之Balancer難以在快速增長的集群上平衡大量的數(shù):背景: 公司在線上使用了CDH5集群,一開始由于疏忽,忘記了在計劃任務(wù)中定期執(zhí)行Balancer來平衡各節(jié)點的數(shù)據(jù)。 后來,在引入大量的Job之后,數(shù)據(jù)增長非常迅猛,有很多節(jié)點開始出現(xiàn)利用率超過99.9%的情況,部分Job甚至開始Failed。 于是我們便執(zhí)行Balan
    推薦度:
    標(biāo)簽: 快速 長的 筆記
    • 熱門焦點

    最新推薦

    猜你喜歡

    熱門推薦

    專題
    Top
    主站蜘蛛池模板: 欧美ppypp精品一区二区| 精品亚洲视频在线观看| 国产精品久久影院| 欧美亚洲国产精品第一页| 国产区精品一区二区不卡中文 | 无码精品人妻一区二区三区中| 麻豆aⅴ精品无码一区二区| 日韩精品国产另类专区| 精品99又大又爽又硬少妇毛片| AAA级久久久精品无码区| 国产精品一区三区| 亚洲精品偷拍视频免费观看| 四虎国产精品永久在线观看| 国产精品无码久久综合| 欧美国产日韩精品| 久久精品国产一区二区电影| 亚洲精品无码av天堂| 国产AV午夜精品一区二区三区| 午夜精品在线观看| 四虎精品成人免费观看| 久久亚洲国产精品一区二区| 欧美日韩国产精品自在自线| 精品国产三级a∨在线欧美| 国产精品欧美久久久久天天影视| 亚洲精品无码专区久久久| 一区二区三区四区精品视频| 四虎国产成人永久精品免费| 国产精品美女久久久网AV| 国产综合精品女在线观看| 久久久久亚洲精品无码网址| 国产高清在线精品一区| 亚洲级αV无码毛片久久精品| 99久久精品国产一区二区蜜芽| 亚洲∧v久久久无码精品| 精品日韩欧美国产| 日韩麻豆国产精品欧美| 国产精品jizz视频| 日韩精品人妻系列无码专区| 精品人体无码一区二区三区| 91po国产在线精品免费观看| 999精品视频|