一、數(shù)據(jù)庫(kù) sharding 要注意些什么
Sharding的基本思想就要把一個(gè)數(shù)據(jù)庫(kù)切分成多個(gè)部分放到不同的數(shù)據(jù)庫(kù)(server)上,從而緩解單一數(shù)據(jù)庫(kù)的性能問題。不太嚴(yán)格的講,對(duì)于海量數(shù)據(jù)的數(shù)據(jù)庫(kù),如果是因?yàn)楸矶喽鴶?shù)據(jù)多,這時(shí)候適合使用垂直切分,即把關(guān)系緊密(比如同一模塊)的表切分出來放在一個(gè)server上。如果表并不多,但每張表的數(shù)據(jù)非常多,這時(shí)候適合水平切分,即把表的數(shù)據(jù)按某種規(guī)則(比如按ID散列)切分到多個(gè)數(shù)據(jù)庫(kù)(server)上。當(dāng)然,現(xiàn)實(shí)中更多是這兩種情況混雜在一起,這時(shí)候需要根據(jù)實(shí)際情況做出選擇,也可能會(huì)綜合使用垂直與水平切分,從而將原有數(shù)據(jù)庫(kù)切分成類似矩陣一樣可以無限擴(kuò)充的數(shù)據(jù)庫(kù)(server)陣列。
切分策略
如前面所提到的,切分是按先垂直切分再水平切分的步驟進(jìn)行的。垂直切分的結(jié)果正好為水平切分做好了鋪墊。垂直切分的思路就是分析表間的聚合關(guān)系,把關(guān)系緊密的表放在一起。多數(shù)情況下可能是同一個(gè)模塊,或者是同一“聚集”。這里的“聚集”正是領(lǐng)域驅(qū)動(dòng)設(shè)計(jì)里所說的聚集。在垂直切分出的表聚集內(nèi),找出“根元素”(這里的“根元素”就是領(lǐng)域驅(qū)動(dòng)設(shè)計(jì)里的“聚合根”),按“根元素”進(jìn)行水平切分,也就是從“根元素”開始,把所有和它直接與間接關(guān)聯(lián)的數(shù)據(jù)放入一個(gè)shard里。這樣出現(xiàn)跨shard關(guān)聯(lián)的可能性就非常的小。應(yīng)用程序就不必打斷既有的表間關(guān)聯(lián)。比如:對(duì)于社交網(wǎng)站,幾乎所有數(shù)據(jù)最終都會(huì)關(guān)聯(lián)到某個(gè)用戶上,基于用戶進(jìn)行切分就是較好的選擇。再比如論壇系統(tǒng),用戶和論壇兩個(gè)模塊應(yīng)該在垂直切分時(shí)被分在了兩個(gè)shard里,對(duì)于論壇模塊來說,F(xiàn)orum顯然是聚合根,因此按Forum進(jìn)行水平切分,把Forum里所有的帖子和回帖都隨Forum放在一個(gè)shard里是很自然的。
對(duì)于共享數(shù)據(jù)數(shù)據(jù),如果是只讀的字典表,每個(gè)shard里維護(hù)一份應(yīng)該是一個(gè)不錯(cuò)的選擇,這樣不必打斷關(guān)聯(lián)關(guān)系。如果是一般數(shù)據(jù)間的跨節(jié)點(diǎn)的關(guān)聯(lián),就必須打斷。
延伸閱讀:
二、什么是數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)管理系統(tǒng)
數(shù)據(jù)庫(kù)的應(yīng)用非常廣泛,舉個(gè)例子,我們平時(shí)在瀏覽器上搜索內(nèi)容,就要用到數(shù)據(jù)庫(kù)去檢索我們的關(guān)鍵字。以前我們可能會(huì)用數(shù)組、集合、文件等來存儲(chǔ)數(shù)據(jù),但是接下來我們就會(huì)面臨一個(gè)問題,當(dāng)存儲(chǔ)的數(shù)據(jù)或內(nèi)容過多的時(shí)候,我們?nèi)绾稳ゾ珳?zhǔn)的找到我們需要的東西,這時(shí)候數(shù)據(jù)庫(kù)管理系統(tǒng)就派上了用場(chǎng)。除此之外,數(shù)據(jù)庫(kù)管理系統(tǒng)還能永久的儲(chǔ)存我們的數(shù)據(jù)。
為了便于大家理解,這里先給大家講解幾個(gè)概念
DB數(shù)據(jù)庫(kù)(database):存儲(chǔ)數(shù)據(jù)的“倉(cāng)庫(kù)”。它保存了一系列有組織的數(shù)據(jù)。
DBMS數(shù)據(jù)庫(kù)管理系統(tǒng)(Database Management System):數(shù)據(jù)庫(kù)是通過DBMS創(chuàng)建和操作的容器。