最新日韩欧美在线综合网_成人在线视_自拍偷拍第八页_欧美又大又粗又硬又色A片_亚洲精品国产成人片_一级片手机在线

IT之道-艾銻知道

您當(dāng)前位置: 主頁 > 資訊動(dòng)態(tài) > IT知識(shí)庫 >

Ceph分布式存儲(chǔ)簡(jiǎn)介


2020-02-12 20:06 作者:艾銻無限 瀏覽量:
迎戰(zhàn)疫情,艾無限用愛與您同行

中國中小企業(yè)提供免費(fèi)IT外包服務(wù)


 
        這次的肺炎疫情對(duì)中國的中小企業(yè)將會(huì)是沉重的打擊,據(jù)釘釘和微信兩個(gè)辦公平臺(tái)數(shù)據(jù)統(tǒng)計(jì)現(xiàn)有2億左右的人在家遠(yuǎn)程辦公,那么對(duì)于中小企業(yè)的員工來說不懂IT技術(shù)將會(huì)讓他們面臨的最大挑戰(zhàn)和困難。
 
        電腦不亮了怎么辦?系統(tǒng)藍(lán)屏如何處理?辦公室的電腦在家如何連接?網(wǎng)絡(luò)應(yīng)該如何設(shè)置?VPN如何搭建?數(shù)據(jù)如何對(duì)接?服務(wù)器如何登錄?數(shù)據(jù)安全如何保證?數(shù)據(jù)如何存儲(chǔ)?視頻會(huì)議如何搭建?業(yè)務(wù)系統(tǒng)如何開啟等等一系列的問題,都會(huì)困擾著并非技術(shù)出身的您

 
 
        好消息是當(dāng)您看到這篇文章的時(shí)候,就不用再為上述的問題而苦惱,您只需撥打艾銻無限的全國免費(fèi)熱線電話:400 650 7820,就會(huì)有我們的遠(yuǎn)程工程師為您解決遇到的問題,他們可以遠(yuǎn)程幫您處理遇到的一些IT技術(shù)難題。
 
       如遇到免費(fèi)熱線占線,您還可以撥打我們的24小時(shí)值班經(jīng)理電話:15601064618或技術(shù)經(jīng)理的電話:13041036957,我們會(huì)在第一時(shí)間接聽您的來電,為您提供適合的解決方案,讓您無論在家還是在企業(yè)都能無憂辦公。
 
那艾銻無限具體能為您的企業(yè)提供哪些服務(wù)呢?
       艾銻無限始創(chuàng)于2005年,歷經(jīng)15年服務(wù)了5000多家中小企業(yè)并保障了幾十萬臺(tái)設(shè)備的正常運(yùn)轉(zhuǎn),積累了豐富的企業(yè)IT緊急問題和特殊故障的解決經(jīng)驗(yàn),制定了相對(duì)應(yīng)的解決方案。我們?yōu)槟钠髽I(yè)提供的IT服務(wù)分為三大版塊:
 
        第一版塊是保障性IT外包服務(wù):如電腦設(shè)備運(yùn)維,辦公設(shè)備運(yùn)維,網(wǎng)絡(luò)設(shè)備運(yùn)維,服務(wù)器運(yùn)維等綜合性企業(yè)IT設(shè)備運(yùn)維服務(wù)。
 
        第二版塊是功能性互聯(lián)網(wǎng)外包服務(wù):如網(wǎng)站開發(fā)外包,小程序開發(fā)外包,APP開發(fā)外包,電商平臺(tái)開發(fā)外包,業(yè)務(wù)系統(tǒng)的開發(fā)外包和后期的運(yùn)維外包服務(wù)。
 
        第三版塊是增值性云服務(wù)外包:如企業(yè)郵箱上云,企業(yè)網(wǎng)站上云,企業(yè)存儲(chǔ)上云,企業(yè)APP小程序上云,企業(yè)業(yè)務(wù)系統(tǒng)上云,阿里云產(chǎn)品等后續(xù)的云運(yùn)維外包服務(wù)。
 
        您要了解更多服務(wù)也可以登錄艾銻無限的官網(wǎng):www.bjitwx.com查看詳細(xì)說明,在疫情期間,您企業(yè)遇到的任何困境只要找到艾銻無限,能免費(fèi)為您提供服務(wù)的我們絕不收一分錢,我們?nèi)w艾銻人承諾此活動(dòng)直到中國疫情結(jié)束,我們將這次活動(dòng)稱為——春雷行動(dòng)。
 
       以下還有我們?yōu)槟峁┑囊恍┘夹g(shù)資訊,以便可以幫助您更好的了解相關(guān)的IT知識(shí),幫您渡過疫情中辦公遇到的困難和挑戰(zhàn),艾銻無限愿和中國中小企業(yè)一起共進(jìn)退,因?yàn)槲覀兿嘈湃f物同體,能量合一,只要我們一起齊心協(xié)力,一定會(huì)成功。再一次祝福您和您的企業(yè),戰(zhàn)勝疫情,您和您的企業(yè)一定行。

北京艾銻無限告訴您:Ceph分布式存儲(chǔ)簡(jiǎn)介
 
 

一、Ceph簡(jiǎn)介:

        Ceph是一種為優(yōu)秀的性能、可靠性和可擴(kuò)展性而設(shè)計(jì)的統(tǒng)一的、分布式文件系統(tǒng)。ceph 的統(tǒng)一體現(xiàn)在可以提供文件系統(tǒng)、塊存儲(chǔ)和對(duì)象存儲(chǔ),分布式體現(xiàn)在可以動(dòng)態(tài)擴(kuò)展。在國內(nèi)一些公司的云環(huán)境中,通

常會(huì)采用 ceph 作為openstack 的唯一后端存儲(chǔ)來提高數(shù)據(jù)轉(zhuǎn)發(fā)效率。

       Ceph項(xiàng)目最早起源于Sage就讀博士期間的工作(最早的成果于2004年發(fā)表),并隨后貢獻(xiàn)給開源社區(qū)。在經(jīng)過了數(shù)年的發(fā)展之后,目前已得到眾多云計(jì)算廠商的支持并被廣泛應(yīng)用。RedHat及OpenStack都

可與Ceph整合以支持虛擬機(jī)鏡像的后端存儲(chǔ)。

二、Ceph特點(diǎn):

高性能:

   a. 摒棄了傳統(tǒng)的集中式存儲(chǔ)元數(shù)據(jù)尋址的方案,采用CRUSH算法,數(shù)據(jù)分布均衡,  

        并行度高。

    b.考慮了容災(zāi)域的隔離,能夠?qū)崿F(xiàn)各類負(fù)載的副本放置規(guī)則,例如跨機(jī)房、機(jī)架  

        感知等。

    c. 能夠支持上千個(gè)存儲(chǔ)節(jié)點(diǎn)的規(guī)模,支持TB到PB級(jí)的數(shù)據(jù)。

高可用性:

    a. 副本數(shù)可以靈活控制。

    b. 支持故障域分隔,數(shù)據(jù)強(qiáng)一致性。

    c. 多種故障場(chǎng)景自動(dòng)進(jìn)行修復(fù)自愈。

    d. 沒有單點(diǎn)故障,自動(dòng)管理。

高可擴(kuò)展性:

    a. 去中心化。

    b. 擴(kuò)展靈活。

    c. 隨著節(jié)點(diǎn)增加而線性增長(zhǎng)。

特性豐富:

    a. 支持三種存儲(chǔ)接口:塊存儲(chǔ)、文件存儲(chǔ)、對(duì)象存儲(chǔ)。

    b. 支持自定義接口,支持多種語言驅(qū)動(dòng)。

三、Ceph應(yīng)用場(chǎng)景:

Ceph可以提供對(duì)象存儲(chǔ)、塊設(shè)備存儲(chǔ)和文件系統(tǒng)服務(wù),其對(duì)象存儲(chǔ)可以對(duì)接網(wǎng)盤(owncloud)應(yīng)用業(yè)務(wù)等;其塊設(shè)備存儲(chǔ)可以對(duì)接(IaaS),當(dāng)前主流的IaaS運(yùn)平臺(tái)軟件,如:OpenStack、CloudStack、

Zstack、Eucalyptus等以及kvm等。

Ceph是一個(gè)高性能、可擴(kuò)容的分布式存儲(chǔ)系統(tǒng),它提供三大功能:

   對(duì)象存儲(chǔ)(RADOSGW):提供RESTful接口,也提供多種編程語言綁定。兼容S3、Swift;

   塊存儲(chǔ)(RDB):由RBD提供,可以直接作為磁盤掛載,內(nèi)置了容災(zāi)機(jī)制;

   文件系統(tǒng)(CephFS):提供POSIX兼容的網(wǎng)絡(luò)文件系統(tǒng)CephFS,專注于高性能、大容量存儲(chǔ);

什么是塊存儲(chǔ)/對(duì)象存儲(chǔ)/文件系統(tǒng)存儲(chǔ)?

1.對(duì)象存儲(chǔ):

    也就是通常意義的鍵值存儲(chǔ),其接口就是簡(jiǎn)單的GET、PUT、DEL 和其他擴(kuò)展,代表主要有 Swift 、S3 以及 Gluster 等;

2.塊存儲(chǔ):

    這種接口通常以 QEMU Driver 或者 Kernel Module 的方式存在,這種接口需要實(shí)現(xiàn) Linux 的 Block Device 的接口或者 QEMU 提供的 Block Driver 接口,如 Sheepdog,AWS 的 EBS,阿里云的盤古系統(tǒng),還

有 Ceph 的 RBD(RBD是Ceph面向塊存儲(chǔ)的接口)。在常見的存儲(chǔ)中 DAS、SAN 提供的也是塊存儲(chǔ);

3.文件系統(tǒng)存儲(chǔ):

     通常意義是支持 POSIX 接口,它跟傳統(tǒng)的文件系統(tǒng)如 Ext4 是一個(gè)類型的,但區(qū)別在于分布式存儲(chǔ)提供了并行化的能力,如 Ceph 的 CephFS (CephFS是Ceph面向文件存儲(chǔ)的接口),但是有時(shí)候又會(huì)把

GlusterFS ,HDFS 這種非POSIX接口的類文件存儲(chǔ)接口歸入此類。當(dāng)然 NFS、NAS也是屬于文件系統(tǒng)存儲(chǔ);

四、Ceph核心組件:



(1)Monitors:監(jiān)視器,維護(hù)集群狀態(tài)的多種映射,同時(shí)提供認(rèn)證和日志記錄服務(wù),包括有關(guān)monitor 節(jié)點(diǎn)端到端的信息,其中包括 Ceph 集群ID,監(jiān)控主機(jī)名和IP以及端口。并且存儲(chǔ)當(dāng)前版本信息以及最新更

改信息,通過 "ceph mon dump"查看 monitor map。

(2)MDS(Metadata Server):Ceph 元數(shù)據(jù),主要保存的是Ceph文件系統(tǒng)的元數(shù)據(jù)。注意:ceph的塊存儲(chǔ)和ceph對(duì)象存儲(chǔ)都不需要MDS。

(3)OSD:即對(duì)象存儲(chǔ)守護(hù)程序,但是它并非針對(duì)對(duì)象存儲(chǔ)。是物理磁盤驅(qū)動(dòng)器,將數(shù)據(jù)以對(duì)象的形式存儲(chǔ)到集群中的每個(gè)節(jié)點(diǎn)的物理磁盤上。OSD負(fù)責(zé)存儲(chǔ)數(shù)據(jù)、處理數(shù)據(jù)復(fù)制、恢復(fù)、回(Backfilling)、再

平衡。完成存儲(chǔ)數(shù)據(jù)的工作絕大多數(shù)是由 OSD daemon 進(jìn)程實(shí)現(xiàn)。在構(gòu)建 Ceph OSD的時(shí)候,建議采用SSD 磁盤以及xfs文件系統(tǒng)來格式化分區(qū)。此外OSD還對(duì)其它OSD進(jìn)行心跳檢測(cè),檢測(cè)結(jié)果匯報(bào)給Monitor

(4)RADOS:Reliable Autonomic Distributed Object Store。RADOS是ceph存儲(chǔ)集群的基礎(chǔ)。在ceph中,所有數(shù)據(jù)都以對(duì)象的形式存儲(chǔ),并且無論什么數(shù)據(jù)類型,RADOS對(duì)象存儲(chǔ)都將負(fù)責(zé)保存這些對(duì)象。

RADOS層可以確保數(shù)據(jù)始終保持一致。

(5)librados:librados庫,為應(yīng)用程度提供訪問接口。同時(shí)也為塊存儲(chǔ)、對(duì)象存儲(chǔ)、文件系統(tǒng)提供原生的接口。

(6)RADOSGW:網(wǎng)關(guān)接口,提供對(duì)象存儲(chǔ)服務(wù)。它使用librgw和librados來實(shí)現(xiàn)允許應(yīng)用程序與Ceph對(duì)象存儲(chǔ)建立連接。并且提供S3 和 Swift 兼容的RESTful API接口。

(7)RBD:塊設(shè)備,它能夠自動(dòng)精簡(jiǎn)配置并可調(diào)整大小,而且將數(shù)據(jù)分散存儲(chǔ)在多個(gè)OSD上。

(8)CephFS:Ceph文件系統(tǒng),與POSIX兼容的文件系統(tǒng),基于librados封裝原生接口。


五、Ceph存儲(chǔ)系統(tǒng)的邏輯層次結(jié)構(gòu):

 
 
 
六、RADOS的系統(tǒng)邏輯結(jié)構(gòu):

 
七、Ceph 數(shù)據(jù)存儲(chǔ)過程:
 

無論使用哪種存儲(chǔ)方式(對(duì)象、塊、文件系統(tǒng)),存儲(chǔ)的數(shù)據(jù)都會(huì)被切分成Objects。Objects size大小可以由管理員調(diào)整,通常為2M或4M。每個(gè)對(duì)象都會(huì)有一個(gè)唯一的OID,由ino與ono生成,雖然這些名詞看上
去很復(fù)雜,其實(shí)相當(dāng)簡(jiǎn)單。

ino:即是文件的File ID,用于在全局唯一標(biāo)識(shí)每一個(gè)文件

ono:則是分片的編號(hào)

比如:一個(gè)文件FileID為A,它被切成了兩個(gè)對(duì)象,一個(gè)對(duì)象編號(hào)0,另一個(gè)編號(hào)1,那么這兩個(gè)文件的oid則為A0與A1。

File —— 此處的file就是用戶需要存儲(chǔ)或者訪問的文件。對(duì)于一個(gè)基于Ceph開發(fā)的對(duì)象存儲(chǔ)應(yīng)用而言,這個(gè)file也就對(duì)應(yīng)于應(yīng)用中的“對(duì)象”,也就是用戶直接操作的“對(duì)象”。

Object —— 此處的object是RADOS所看到的“對(duì)象”。Object與上面提到的file的區(qū)別是,object的最大size由RADOS限定(通常為2MB或4MB),以便實(shí)現(xiàn)底層存儲(chǔ)的組織管理。因此,當(dāng)上層應(yīng)用向RADOS存入

size很大的file時(shí),需要將file切分成統(tǒng)一大小的一系列object(最后一個(gè)的大小可以不同)進(jìn)行存儲(chǔ)。為避免混淆,在本文中將盡量避免使用中文的“對(duì)象”這一名詞,而直接使用file或object進(jìn)行說明。

PG(Placement Group)—— 顧名思義,PG的用途是對(duì)object的存儲(chǔ)進(jìn)行組織和位置映射。具體而言,一個(gè)PG負(fù)責(zé)組織若干個(gè)object(可以為數(shù)千個(gè)甚至更多),但一個(gè)object只能被映射到一個(gè)PG中,即,PG

和object之間是“一對(duì)多”映射關(guān)系。同時(shí),一個(gè)PG會(huì)被映射到n個(gè)OSD上,而每個(gè)OSD上都會(huì)承載大量的PG,即,PG和OSD之間是“多對(duì)多”映射關(guān)系。在實(shí)踐當(dāng)中,n至少為2,如果用于生產(chǎn)環(huán)境,則至少為3。

一個(gè)OSD上的PG則可達(dá)到數(shù)百個(gè)。事實(shí)上,PG數(shù)量的設(shè)置牽扯到數(shù)據(jù)分布的均勻性問題。關(guān)于這一點(diǎn),下文還將有所展開。

OSD —— 即object storage device,前文已經(jīng)詳細(xì)介紹,此處不再展開。唯一需要說明的是,OSD的數(shù)量事實(shí)上也關(guān)系到系統(tǒng)的數(shù)據(jù)分布均勻性,因此其數(shù)量不應(yīng)太少。在實(shí)踐當(dāng)中,至少也應(yīng)該是數(shù)十上百個(gè)的\

量級(jí)才有助于Ceph系統(tǒng)的設(shè)計(jì)發(fā)揮其應(yīng)有的優(yōu)勢(shì)。

基于上述定義,便可以對(duì)尋址流程進(jìn)行解釋了。具體而言, Ceph中的尋址至少要經(jīng)歷以下三次映射:

(1)File -> object映射

(2)Object -> PG映射,hash(oid) & mask -> pgid(哈希算法)


(3)PG -> OSD映射,CRUSH算法

CRUSH,Controlled Replication Under Scalable Hashing,它表示數(shù)據(jù)存儲(chǔ)的分布式選擇算法, ceph 的高性能/高可用就是采用這種算法實(shí)現(xiàn)。CRUSH 算法取代了在元數(shù)據(jù)表中為每個(gè)客戶端請(qǐng)求進(jìn)行查找,它

通過計(jì)算系統(tǒng)中數(shù)據(jù)應(yīng)該被寫入或讀出的位置。CRUSH能夠感知基礎(chǔ)架構(gòu),能夠理解基礎(chǔ)設(shè)施各個(gè)部件之間的關(guān)系。并CRUSH保存數(shù)據(jù)的多個(gè)副本,這樣即使一個(gè)故障域的幾個(gè)組件都出現(xiàn)故障,數(shù)據(jù)依然可

用。CRUSH 算是使得 ceph 實(shí)現(xiàn)了自我管理和自我修復(fù)。

RADOS 分布式存儲(chǔ)相較于傳統(tǒng)分布式存儲(chǔ)的優(yōu)勢(shì)在于:

1. 將文件映射到object后,利用Cluster Map 通過CRUSH 計(jì)算而不是查找表方式定位文件數(shù)據(jù)存儲(chǔ)到存儲(chǔ)設(shè)備的具體位置。優(yōu)化了傳統(tǒng)文件到塊的映射和Block MAp的管理。

2. RADOS充分利用OSD的智能特點(diǎn),將部分任務(wù)授權(quán)給OSD,最大程度地實(shí)現(xiàn)可擴(kuò)展

八、Ceph IO流程及數(shù)據(jù)分布:

(1)正常IO流程圖:
 
 
步驟:
  1. client 創(chuàng)建cluster handler。
  2. client 讀取配置文件。
  3. client 連接上monitor,獲取集群map信息。
  4. client 讀寫io 根據(jù)crshmap 算法請(qǐng)求對(duì)應(yīng)的主osd數(shù)據(jù)節(jié)點(diǎn)。
  5. 主osd數(shù)據(jù)節(jié)點(diǎn)同時(shí)寫入另外兩個(gè)副本節(jié)點(diǎn)數(shù)據(jù)。
  6. 等待主節(jié)點(diǎn)以及另外兩個(gè)副本節(jié)點(diǎn)寫完數(shù)據(jù)狀態(tài)。
  7. 主節(jié)點(diǎn)及副本節(jié)點(diǎn)寫入狀態(tài)都成功后,返回給client,io寫入完成。
(2)新主IO流程圖:
 
說明:如果新加入的OSD1取代了原有的 OSD4成為 Primary OSD, 由于 OSD1 上未創(chuàng)建 PG , 不存在數(shù)據(jù),那么 PG 上的 I/O 無法進(jìn)行,怎樣工作的呢?
新主IO流程步驟:
  1. client連接monitor獲取集群map信息。
  2. 同時(shí)新主osd1由于沒有pg數(shù)據(jù)會(huì)主動(dòng)上報(bào)monitor告知讓osd2臨時(shí)接替為主。
  3. 臨時(shí)主osd2會(huì)把數(shù)據(jù)全量同步給新主osd1。
  4. client IO讀寫直接連接臨時(shí)主osd2進(jìn)行讀寫。
  5. osd2收到讀寫io,同時(shí)寫入另外兩副本節(jié)點(diǎn)。
  6. 等待osd2以及另外兩副本寫入成功。
  7. osd2三份數(shù)據(jù)都寫入成功返回給client, 此時(shí)client io讀寫完畢。
  8. 如果osd1數(shù)據(jù)同步完畢,臨時(shí)主osd2會(huì)交出主角色。
  9. osd1成為主節(jié)點(diǎn),osd2變成副本。
九、Ceph Pool和PG分布情況:
pool:是ceph存儲(chǔ)數(shù)據(jù)時(shí)的邏輯分區(qū),它起到namespace的作用。每個(gè)pool包含一定數(shù)量(可配置) 的PG。PG里的對(duì)象被映射到不同的Object上。pool是分布到整個(gè)集群的。 pool可以做故障隔離域,根據(jù)不同的用戶場(chǎng)景不統(tǒng)一進(jìn)行隔離。
 
 
 
 
 

相關(guān)文章

IT外包服務(wù)
二維碼 關(guān)閉
主站蜘蛛池模板: 国产成人精品a视频 | 乳首av| 少妇被躁爽到高潮无码文 | 国产激情精品视频 | 操大逼片| 无码人妻AV一区二区三区蜜臀 | 国产精品午睡沙发系列 | 日本免费极度色诱福利视频 | 免费精品视频一区 | 亚洲黄色影视 | 国产草草影院一区二区三区 | 性猛交xxxx乱大交孕妇2 | 国产成人精品日本亚洲语音 | 玖玖av| 亚洲精品久久久久77777 | 97国产影院 | 综合五月激情二区视频 | 国产精品美女久久久网站 | 黑人粗大猛烈进出高潮视频 | 曰韩无码AV一区二区免费 | 国产一级av片一区久久久 | 亚洲精品99久久久久久 | 亚洲精品国产免费 | 亚洲欧美人成视频一区在线 | 天堂精品 | 中文字幕不卡免费视频 | 在线中文字幕乱码英文字幕正常 | 中文字幕中文字幕在线中文字幕三区 | 欧美一卡一卡二卡四卡仙踪林 | 日本在线看片免费人成视频1000 | 亚洲精品成人免费 | 最新中文字幕在线观看 | 极品久久久久久 | 一夲道无码人妻精品一区二区 | 无码人妻精品一二三区免费 | 国产日韩欧美一区二区三区综合精品 | 亚洲欧美精品一区 | 顶级黄色片 | 亚洲国产成人高清在线观看 | 久久中文骚妇内射 | 137肉体写真日本裸交 |