在分布式存儲的容災(zāi)中,一個重要的手段就是多時間點(diǎn)快照技術(shù),使得用戶生產(chǎn)系統(tǒng)能夠?qū)崿F(xiàn)一定時間間隔下的各版本數(shù)據(jù)的保存。特別值得一提的是,多時間點(diǎn)快照技術(shù)支持同時提取多個時間點(diǎn)樣本同時恢復(fù),這對于很多邏輯錯誤的災(zāi)難定位十分有用,如果用戶有多臺服務(wù)器或虛擬機(jī)可以用作系統(tǒng)恢復(fù),通過比照和分析,可以快速找到哪個時間點(diǎn)才是需要回復(fù)的時間點(diǎn),降低了故障定位的難度,縮短了定位時間。這個功能還非常有利于進(jìn)行故障重現(xiàn),從而進(jìn)行分析和研究,避免災(zāi)難在未來再次發(fā)生。多副本技術(shù),數(shù)據(jù)條帶化放置,多時間點(diǎn)快照和周期增量復(fù)制等技術(shù)為分布式存儲的高可靠性提供了保障。 關(guān)于分布式存儲,你需要知道的真相?;窗菜拇箝_源分布式存儲的一般架構(gòu)
分布式存儲早期主要用于互聯(lián)網(wǎng)日志、企業(yè)備份歸檔、開發(fā)測試等場景,這些場景無疑是低價值場景,成本是第yi訴求甚至訴求。然此一時彼一時,士別三日也當(dāng)刮目相看。首先是分布式存儲產(chǎn)品能力已今非昔比,逐漸具備了承載企業(yè)高價值業(yè)務(wù)的關(guān)鍵能力,例如毫秒級時延、TB/s級帶寬、雙活/3DC業(yè)務(wù)級容災(zāi)、端到端DIF等,無論是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù)的承載,功能完備性的比較大短板早已補(bǔ)齊。其次,分布式存儲已走入眾多高價值關(guān)鍵業(yè)務(wù),如運(yùn)營商BOM業(yè)務(wù)、金融渠道類業(yè)務(wù)以及超算、油藏探測HPC等高價值業(yè)務(wù),通過大規(guī)模應(yīng)用實(shí)踐來檢驗(yàn)成色。(小道消息,某些高價值場景全閃出貨價達(dá)到1000美金/TB以上啦)看完當(dāng)下還要看看未來,筆者認(rèn)為未來高價值的非結(jié)構(gòu)化數(shù)據(jù)場景,分布式存儲的版圖還會持續(xù)擴(kuò)展。如自動駕駛訓(xùn)練、4K/8K超高清、5G日志留存等場景,對多協(xié)議訪問、極zhi帶寬、擴(kuò)展性訴求強(qiáng)烈,分布式存儲已然成為這些未來業(yè)務(wù)的優(yōu)先架構(gòu)。 泰州四大開源分布式存儲系統(tǒng)原理分布式存儲是未來趨勢。
分布式存儲系統(tǒng)中還可能使用基于寫多個存儲節(jié)點(diǎn)的復(fù)制協(xié)議(Replicated-writeprotocol)。比如Dynamo系統(tǒng)中的NWR復(fù)制協(xié)議,其中,N為副本數(shù)量,W為寫操作的副本數(shù),R為讀操作的副本數(shù)。NWR協(xié)議中多個副本不再區(qū)分主和備,客戶端根據(jù)一定的策略往其中的W個副本寫入數(shù)據(jù),讀取其中的R個副本。只要W+R>N,可以保證讀到的副本中至少有一個包含了的更新。然而,這種協(xié)議的問題在于不同副本的操作順序可能不一致,從多個副本讀取時可能出現(xiàn)。這種方式在實(shí)際系統(tǒng)中比較少見,不建議使用。
在分布式存儲系統(tǒng)(包括OceanBase這樣的分布式數(shù)據(jù)庫)的使用中,我們經(jīng)常會提到“一致性”這個詞,但是這個術(shù)語在不同的系統(tǒng)、不同人的心目中有不同的內(nèi)涵,很容易造成混淆。想象一個簡單的存儲系統(tǒng),只有一個客戶端(單進(jìn)程)和一個服務(wù)端(單進(jìn)程服務(wù))??蛻舳隧樞虬l(fā)起讀寫操作,服務(wù)端也順序處理每個請求,那么無論從服務(wù)器視角還是從客戶端視角,后一個操作都可以看到前一個操作的結(jié)果。然后,系統(tǒng)變的復(fù)雜一些,系統(tǒng)還是單個服務(wù)進(jìn)程(單副本),但是有多個客戶端并發(fā)進(jìn)行操作。這個模型下,多個客戶端的操作會互相影響,比如一個客戶端會讀到不是自己寫的數(shù)據(jù)(另一個客戶端寫入的)。一般單機(jī)并發(fā)程序就是這樣的模型,比如多個線程共享內(nèi)存的程序中。 分布式存儲的基本理論。
分布式存儲包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲和分布式對象存儲外,還包括分布式數(shù)據(jù)庫和分布式緩存等,但其中架構(gòu)無外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。 常見的幾種分布式存儲以及應(yīng)用場景。臺州四大開源分布式存儲系統(tǒng)原理
分布式存儲在企業(yè)數(shù)據(jù)治理體系中,無疑扮演著重要角色?;窗菜拇箝_源分布式存儲的一般架構(gòu)
為了保證分布式存儲系統(tǒng)的高可靠和高可用,數(shù)據(jù)在系統(tǒng)中一般存儲多個副本。當(dāng)某個副本所在的存儲節(jié)點(diǎn)出現(xiàn)故障時,分布式存儲系統(tǒng)能夠自動將服務(wù)切換到其他的副本,從而實(shí)現(xiàn)自動容錯。分布式存儲系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個存儲節(jié)點(diǎn),并確保多個副本之間的數(shù)據(jù)一致性??蛻舳藢懻埱蟀l(fā)送給主副本,主副本將寫請求復(fù)制到其他備副本,常見的做法是同步操作日志(CommitLog)。主副本首先將操作日志同步到備副本,備副本回放操作日志,完成后通知主副本。接著,主副本修改本機(jī),等到所有的操作都完成后再通知客戶端寫成功。下圖中的復(fù)制協(xié)議要求主備同步成功才可以返回客戶端寫成功,這種協(xié)議稱為強(qiáng)同步協(xié)議。 淮安四大開源分布式存儲的一般架構(gòu)
江蘇魏晉元興智能科技有限公司是一家智能技術(shù)、計算機(jī)技術(shù)研發(fā)、技術(shù)咨詢,技術(shù)轉(zhuǎn)讓:軟件開 發(fā)、銷售;信息系統(tǒng)集成服務(wù):機(jī)電產(chǎn)品、計算機(jī)及配件、 電線電纜、儀器儀表、電子元器件、機(jī)械設(shè)備、機(jī)電設(shè)備 節(jié)能設(shè)備、辦公用品、攝影器材、文化用品、通訊設(shè)備、體 育器材、消防器材銷售;綜合布線工程、水電工程、園林綠 化工程、室內(nèi)裝飾工程、土石方工程設(shè)計、施工,提供勞務(wù) 服務(wù);企業(yè)形象策劃:企業(yè)管理咨詢:家用電器銷售、維 修;文化藝術(shù)交流活動組織、 策劃。( 依法須經(jīng)批準(zhǔn)的項(xiàng) 目,經(jīng)相關(guān)部門批準(zhǔn)后方可開展經(jīng)營活動)的公司,是一家集研發(fā)、設(shè)計、生產(chǎn)和銷售為一體的專業(yè)化公司。魏晉元興智能深耕行業(yè)多年,始終以客戶的需求為向?qū)В瑸榭蛻籼峁?**的網(wǎng)絡(luò)安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制。魏晉元興智能致力于把技術(shù)上的創(chuàng)新展現(xiàn)成對用戶產(chǎn)品上的貼心,為用戶帶來良好體驗(yàn)。魏晉元興智能始終關(guān)注數(shù)碼、電腦市場,以敏銳的市場洞察力,實(shí)現(xiàn)與客戶的成長共贏。