從傳統(tǒng)歸檔到云存儲(chǔ)歸檔的演變
在過(guò)去的幾年里,人們?cè)跀?shù)據(jù)歸檔方面的興趣有增無(wú)減。由于公司數(shù)據(jù)的爆炸性增長(zhǎng),同時(shí)也為了滿足某種法規(guī)要求,不得不保留更長(zhǎng)時(shí)間的數(shù)據(jù);以及減少成本的要求使數(shù)據(jù)歸檔越來(lái)越被人們重視。現(xiàn)在數(shù)據(jù)歸檔已經(jīng)進(jìn)化為基于云的歸檔解決方案。
我們都知道,大約網(wǎng)絡(luò)中20-30%的數(shù)據(jù)是歸檔數(shù)據(jù),其中70-80%的數(shù)據(jù)是靜態(tài)的或非活動(dòng)的,這些靜態(tài)數(shù)據(jù)很少變化也很少被訪問(wèn)。把這些非活動(dòng)數(shù)據(jù)保存在**層存儲(chǔ)是非常昂貴也是效率極低的一種方法。盡管如此,通常是有必要或有某種要求來(lái)保留這些非活動(dòng)數(shù)據(jù)以備將來(lái)參考或滿足某種法規(guī)要求的。那么在保證數(shù)據(jù)**,保證法規(guī)遵從的前提下,把他們保存在價(jià)格低廉的可用媒介上是有意義的。
要滿足這些需求,通常的方法是通過(guò)歸檔。歸檔不像備份,它是把非活動(dòng)數(shù)據(jù)從主存儲(chǔ)上轉(zhuǎn)移到另一個(gè)容易訪問(wèn)的,價(jià)格也更低廉的二級(jí)存儲(chǔ)層上,然后在本地磁盤資源上刪除它。這樣可以通過(guò)釋放昂貴的主存儲(chǔ)更多空間來(lái)減少成本,減少備份窗口,增加操作的高效性,并長(zhǎng)期提供數(shù)據(jù)保護(hù)的可靠性。一個(gè)可行的、高效的數(shù)據(jù)歸檔應(yīng)該可以提供:可擴(kuò)展性、成本高效性、可用性、數(shù)據(jù)保護(hù)長(zhǎng)期性。
在本文中,我們將深入看一看數(shù)據(jù)歸檔進(jìn)程的演變和不同的數(shù)據(jù)歸檔方法,這些方法是:
1、傳統(tǒng)的磁帶歸檔
2、基于磁盤的數(shù)據(jù)歸檔
3、云存儲(chǔ)歸檔
傳統(tǒng)歸檔
這種備份歸檔是傳統(tǒng)的基于磁帶上的歸檔。作為備份過(guò)程的一部分,應(yīng)用備份軟件或系統(tǒng)設(shè)備把數(shù)據(jù)寫入磁帶或自動(dòng)磁帶庫(kù)內(nèi),數(shù)據(jù)從磁盤上被保存到磁帶上。這些磁帶和它們所包含的數(shù)據(jù)按普通備份和指定一個(gè)漫長(zhǎng)的保留期間被區(qū)分開,通常是從10年到無(wú)限長(zhǎng)。當(dāng)數(shù)據(jù)備份從服務(wù)器的磁盤驅(qū)動(dòng)器中刪除的時(shí)候,這些歸檔磁帶被送到異地存儲(chǔ)設(shè)備長(zhǎng)久存儲(chǔ)。
這種方法的好處就是磁帶相對(duì)便宜,易于管理,保存時(shí)間長(zhǎng),并且提供非常可靠的存儲(chǔ),存儲(chǔ)大量數(shù)據(jù)非常高效。為了增加存儲(chǔ)容量,你只需要簡(jiǎn)單的增加磁帶就可以了。你也可以通過(guò)用某種類型的備份設(shè)備創(chuàng)建數(shù)據(jù)副本或主要數(shù)據(jù)磁帶來(lái)提供額外的數(shù)據(jù)冗余。
磁帶的不利就是在你可以取回?cái)?shù)據(jù)前不得不等磁帶從異地取回,然后也需要時(shí)間來(lái)掃描磁帶,找到需要恢復(fù)的數(shù)據(jù),重新創(chuàng)建磁帶存儲(chǔ)數(shù)據(jù)。此外它限制爆炸性的數(shù)據(jù)增長(zhǎng)導(dǎo)致以往縮小備份窗口,限制保留的能力,沒有切實(shí)可行的手段來(lái)驗(yàn)證磁帶介質(zhì)及其數(shù)據(jù)存儲(chǔ)年限的完整性。
基于磁盤的數(shù)據(jù)歸檔
過(guò)去的幾年中大量的數(shù)據(jù)急劇增長(zhǎng),在當(dāng)今的商業(yè)環(huán)境存儲(chǔ)和訪問(wèn)大量的歸檔數(shù)據(jù)的要求也日益增長(zhǎng)。大多是新的法規(guī)遵從要求,如SOX,隨著全球化以及傳統(tǒng)的公司結(jié)構(gòu)的瓦解,不再像以前一樣有一個(gè)或兩個(gè)集中地點(diǎn),現(xiàn)在公司已擁有多個(gè)辦事處,分散在不同的區(qū)域,需要快速便捷地獲得大量的檔案資料,研究以及其他業(yè)務(wù)合作,這樣就誕生了基于磁盤基礎(chǔ)上的歸檔系統(tǒng)。
為了滿足這些新的要求,如訪問(wèn)數(shù)據(jù)更高效,存儲(chǔ)大量增長(zhǎng)的新的數(shù)據(jù),包括電子郵件,數(shù)據(jù)庫(kù)等。公司開始在尋找其他存儲(chǔ)以便滿足這些需求,有效控制成本。
歸檔進(jìn)化和現(xiàn)代化的**步是基于磁盤的解決方案的部署。使用廉價(jià)的shelf硬件和SATA驅(qū)動(dòng)器以及廉價(jià)NAS設(shè)備。這樣公司可以把他們的數(shù)據(jù)保留在他們可以很方便,快速訪問(wèn)的站點(diǎn)。然而,這些早期實(shí)現(xiàn)并不能充分滿足他們歸檔的獨(dú)特需求,如擴(kuò)展到Pb來(lái)適應(yīng)大量數(shù)據(jù)增長(zhǎng)的能力,以及冗長(zhǎng)的數(shù)據(jù)保留期,在超出基本RAID6的基礎(chǔ)上提供方法來(lái)保護(hù)并確保數(shù)據(jù)的完整性,以達(dá)到滿足法規(guī)遵從的要求。他們也缺乏自動(dòng)管理歸檔進(jìn)程的能力。
這樣就有了下一步,也就是設(shè)計(jì)管理數(shù)據(jù)歸檔進(jìn)程的特定歸檔系統(tǒng)的引進(jìn)。這些系統(tǒng)提供快速,易于管理存儲(chǔ),在容量方面可以輕松擴(kuò)展,應(yīng)用必要的工具和軟件來(lái)管理歸檔進(jìn)程。這些系統(tǒng)也提供超出RAID6的數(shù)據(jù)保護(hù)特征,數(shù)據(jù)保留,數(shù)據(jù)驗(yàn)證完整性以及WORM(一旦寫入可多次訪問(wèn))能力。
這種歸檔方法的好處是數(shù)據(jù)副本可以在線存儲(chǔ),并能輕松快速被訪問(wèn)。這也就免去了磁帶要從異地站點(diǎn)取回的麻煩,也不需要特定的硬件或備份軟件來(lái)從磁帶存儲(chǔ)數(shù)據(jù)。它也非常容易檢索和搜索磁盤上的特定數(shù)據(jù)。你也可以通過(guò)簡(jiǎn)單的復(fù)制要求來(lái)從一個(gè)地方的數(shù)據(jù)移到另一個(gè)網(wǎng)絡(luò)。可以很容易的擴(kuò)充這些系統(tǒng)的容量來(lái)滿足數(shù)據(jù)增長(zhǎng)的需求。*大的好處就是減少了主存儲(chǔ)要求,因此避免了經(jīng)常購(gòu)買額外的昂貴的主存儲(chǔ)。
對(duì)于企業(yè)來(lái)說(shuō)磁盤基礎(chǔ)上的歸檔的不利就是企業(yè)在購(gòu)買磁盤時(shí),不得不在*初時(shí)購(gòu)買大約50TB的磁盤。對(duì)于許多企業(yè)來(lái)說(shuō),它既不實(shí)際也不節(jié)省成本,他們買了這么大的磁盤空間,而他們*初也許只需要一到二TB。實(shí)際上,你不得不為也許幾年也沒有完全利用的存儲(chǔ)磁盤買單。也有很多隨之而來(lái)的電力、制冷、管理、維護(hù)和升級(jí)這些系統(tǒng)以及他們的支持架構(gòu)的成本。
云存儲(chǔ)歸檔
面對(duì)著預(yù)算越來(lái)越少,員工逐漸減少,而數(shù)據(jù)存儲(chǔ)需求卻在不斷增長(zhǎng)的情況,企業(yè)開始尋找其他更加成本高效的方法來(lái)擴(kuò)展他們的存儲(chǔ)容量。現(xiàn)在,企業(yè)正在關(guān)注*新的發(fā)展如云計(jì)算,存儲(chǔ)即服務(wù)(SaaS)作為一種可能的方法來(lái)滿足他們?nèi)找嬖鲩L(zhǎng)的存儲(chǔ)需求,同時(shí)滿足減少成本,人員,硬件,架構(gòu)等的需求。
在云存儲(chǔ)這個(gè)新領(lǐng)域的服務(wù)供應(yīng)商對(duì)企業(yè)幾乎提供無(wú)窮大的可擴(kuò)展的存儲(chǔ),這種服務(wù)是在應(yīng)用基礎(chǔ)上的一個(gè)固定的成本。這允許企業(yè)在需要的基礎(chǔ)上擴(kuò)展他們的存儲(chǔ),不用再為通常的成本擔(dān)心,通常是擴(kuò)展磁盤環(huán)境,如創(chuàng)建更多架構(gòu),雇傭,培訓(xùn)更多人員來(lái)管理額外的存儲(chǔ),為額外的存儲(chǔ)增加制冷、電力成本等。在其他優(yōu)點(diǎn)中,這個(gè)服務(wù)模型也提供地理上的多站點(diǎn)架構(gòu)。它允許不同區(qū)域的多站點(diǎn)業(yè)務(wù)任何時(shí)間點(diǎn)從網(wǎng)絡(luò)**問(wèn)他們的數(shù)據(jù)。所有的這個(gè)訪問(wèn)透明的提供給用戶和出現(xiàn)者。給所有數(shù)據(jù)傳輸提供**連接的時(shí)候這些解決方案通常應(yīng)用企業(yè)現(xiàn)存的架構(gòu)和應(yīng)用很容易整合。
這種類型服務(wù)的好處是你幾乎可以瞬時(shí)擴(kuò)展你的存儲(chǔ),而不會(huì)在之前產(chǎn)生硬件或擴(kuò)展網(wǎng)絡(luò)架構(gòu),雇傭,培訓(xùn)更多人員來(lái)管理額外存儲(chǔ)的資本支出。同時(shí)你也避免了隨著時(shí)間的推移升級(jí)和更新存儲(chǔ)硬件的成本。
這種類型服務(wù)的不利之處是公司的數(shù)據(jù)存儲(chǔ)在其他人的系統(tǒng)上,而不是公司本地系統(tǒng)。因此在轉(zhuǎn)向云時(shí),你要仔細(xì)分析什么類型的數(shù)據(jù)歸檔到云上,也要了解是如何保護(hù)數(shù)據(jù)的。在這種情況下,找一家有歸檔和**存儲(chǔ)數(shù)據(jù)良好記錄的公司是非常重要的。
因?yàn)楦倪M(jìn)的數(shù)據(jù)歸檔的訪問(wèn)和可靠性使用戶更傾向于從主存儲(chǔ)上轉(zhuǎn)移數(shù)據(jù)。這樣做不僅減少了主存儲(chǔ)上的成本,也減少了數(shù)據(jù)保護(hù)和災(zāi)難恢復(fù)的成本。