數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù),英文名稱為Data Warehouse,可簡(jiǎn)寫(xiě)為DW或DWH。數(shù)據(jù)倉(cāng)庫(kù),是為企業(yè)所有級(jí)別的決策制定過(guò)程,提供所有類(lèi)型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個(gè)數(shù)據(jù)存儲(chǔ),出于分析性報(bào)告和決策支持目的而創(chuàng)建。 為需要業(yè)務(wù)智能的企業(yè),提供指導(dǎo)業(yè)務(wù)流程改進(jìn)、監(jiān)視時(shí)間、成本、質(zhì)量以及控制。
數(shù)據(jù)倉(cāng)庫(kù)是決策支持系統(tǒng)(dss)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉(cāng)庫(kù)研究和解決從數(shù)據(jù)庫(kù)中獲取信息的問(wèn)題。數(shù)據(jù)倉(cāng)庫(kù)的特征在于面向主題、集成性、穩(wěn)定性和時(shí)變性。數(shù)據(jù)倉(cāng)庫(kù) ,由數(shù)據(jù)倉(cāng)庫(kù)之父比爾·恩門(mén)(Bill Inmon)于1990年提出,主要功能仍是將組織透過(guò)資訊系統(tǒng)之聯(lián)機(jī)事務(wù)處理(OLTP)經(jīng)年累月所累積的大量資料,透過(guò)數(shù)據(jù)倉(cāng)庫(kù)理論所特有的資料儲(chǔ)存架構(gòu),作一有系統(tǒng)的分析整理,以利各種分析方法如聯(lián)機(jī)分析處理(OLAP)、數(shù)據(jù)挖掘(Data Mining)之進(jìn)行,并進(jìn)而支持如決策支持系統(tǒng)(DSS)、主管資訊系統(tǒng)(EIS)之創(chuàng)建,幫助決策者能快速有效的自大量資料中,分析出有價(jià)值的資訊,以利決策擬定及快速回應(yīng)外在環(huán)境變動(dòng),幫助建構(gòu)商業(yè)智能(BI)。
多維數(shù)據(jù)庫(kù)
多維數(shù)據(jù)庫(kù)(Multi Dimensional Database,MDD)可以簡(jiǎn)單地理解為:將數(shù)據(jù)存放在一個(gè)n維數(shù)組中,而不是像關(guān)系數(shù)據(jù)庫(kù)那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過(guò)多維視圖來(lái)觀察數(shù)據(jù)。
多維數(shù)據(jù)庫(kù)是指將數(shù)據(jù)存放在一個(gè)門(mén)維數(shù)組中,而不是像關(guān)系數(shù)據(jù)庫(kù)那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過(guò)多維視圖來(lái)觀察數(shù)據(jù)。多維數(shù)據(jù)庫(kù)增加了一個(gè)時(shí)間維,與關(guān)系數(shù)據(jù)庫(kù)相比,它的優(yōu)勢(shì)在于可以提高數(shù)據(jù)處理速度,加快反應(yīng)時(shí)間,提高查詢效率。
數(shù)據(jù)倉(cāng)庫(kù)和多維數(shù)據(jù)庫(kù)的區(qū)別
數(shù)據(jù)倉(cāng)庫(kù)中廣泛采用的數(shù)據(jù)庫(kù)設(shè)計(jì)模型有兩種:關(guān)系型和多維型。普遍認(rèn)為在數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)方法中關(guān)系模型是“Inmon”方法而多維模型是“Kimball”方法。
先來(lái)看下關(guān)系模型,關(guān)系型數(shù)據(jù)以一種稱為“標(biāo)準(zhǔn)化”的形式存在。數(shù)據(jù)標(biāo)準(zhǔn)化是指數(shù)據(jù)庫(kù)設(shè)計(jì)會(huì)使數(shù)據(jù)分解成非常低的粒度級(jí),標(biāo)準(zhǔn)化數(shù)據(jù)以一種孤立模式 存在,這種情況下對(duì)數(shù)據(jù)表里的數(shù)據(jù)關(guān)系要求很?chē)?yán)格。一般遵循3NF范式。采用關(guān)系型設(shè)計(jì)的數(shù)據(jù)庫(kù)一般具有較強(qiáng)的靈活性和多功能性(可以支持?jǐn)?shù)據(jù)的多種視 圖)。
再來(lái)看下多維模型,多維模型一般有星型模式、雪花模式、混雜模式(又叫星系模式)。多維模型設(shè)計(jì)的最大優(yōu)點(diǎn)在于訪問(wèn)的高效性。
兩種模型的區(qū)別
作為數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的基礎(chǔ),星形連接和關(guān)系型結(jié)構(gòu)兩者之間存在很多不同。最重要的區(qū)別是在靈活性和性能方面。關(guān)系模型具有高靈活性,但是對(duì)用戶來(lái)說(shuō)在性能方面卻不是很理想的。多維模型在滿足用戶需求方面是非常高效的,但是靈活性不好。
另一重要區(qū)別在于設(shè)計(jì)的范圍不同。必然地,多維設(shè)計(jì)只能在有限的范圍內(nèi)進(jìn)行,也就是說(shuō),數(shù)據(jù)庫(kù)設(shè)計(jì)只能在一組請(qǐng)求過(guò)程下得到最優(yōu)化。如果所有不同組請(qǐng)求全部加入到設(shè)計(jì)當(dāng)中,最優(yōu)化變得毫無(wú)意義。
當(dāng)使用關(guān)系模型時(shí),在性能方面沒(méi)有特別的優(yōu)化方法。既然關(guān)系模型要求數(shù)據(jù)以最低粒度級(jí)存儲(chǔ),那么就可以無(wú)限制地添加新數(shù)據(jù)。很顯然,添加數(shù)據(jù)到關(guān)系 模型永遠(yuǎn)也不會(huì)停止。正因?yàn)檫@樣,關(guān)系模式適合大范圍數(shù)據(jù)(如一個(gè)企業(yè)模型),而多維模型適用于小范圍數(shù)據(jù)(如一個(gè)部門(mén)或甚至一個(gè)子部門(mén))。
區(qū)別的起源:
關(guān)系環(huán)境是通過(guò)起源數(shù)據(jù)模型設(shè)計(jì)出來(lái)的。多維模型是根據(jù)最終用戶的請(qǐng)求塑造的。換句話說(shuō),關(guān)系模型通過(guò)純數(shù)據(jù)模型和其他模式設(shè)計(jì),而多維模型通過(guò)處理請(qǐng)求塑造。
在適用性方面:由于關(guān)系模型通過(guò)抽象數(shù)據(jù)形成,所以模型自身非常靈活。但這種靈活性,對(duì)于直接數(shù)據(jù)訪問(wèn)的執(zhí)行卻不是最優(yōu)化的。如果想得到一個(gè)高性能的關(guān)系模型,最佳方法是從模型中抽取出數(shù)據(jù),并重新構(gòu)造一種適合于快速訪問(wèn)的模式。
多維模型在直接訪問(wèn)數(shù)據(jù)方面是快速而高效的。從體系結(jié)構(gòu)觀點(diǎn)來(lái)看,在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)基礎(chǔ)方面關(guān)系模型是更好地支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)的模式,其原因是,數(shù)據(jù)倉(cāng)庫(kù)需要根 據(jù)不同的議程和多種觀察數(shù)據(jù)的方式來(lái)支持許多不同的用戶組。也就是說(shuō),數(shù)據(jù)倉(cāng)庫(kù)對(duì)于訪問(wèn)已給定的用戶并不是最佳的。相反,數(shù)據(jù)倉(cāng)庫(kù)可以以多種方式支持多個(gè) 不同的用戶。
關(guān)系模式,數(shù)據(jù)以最低粒度級(jí)和標(biāo)準(zhǔn)化形式存儲(chǔ);關(guān)系表間的關(guān)系已經(jīng)定義好并且包含一個(gè)含有外鍵的關(guān)鍵字表;新表可以對(duì)關(guān)系表中的基本數(shù)據(jù)集定義新的 匯總和篩選標(biāo)準(zhǔn);也就是說(shuō)可以很簡(jiǎn)單以一種形式創(chuàng)建關(guān)系表,再以另一種形式重新塑造這些表,這樣做對(duì)于數(shù)據(jù)倉(cāng)庫(kù)環(huán)境來(lái)說(shuō)是非常理想的。
此外,關(guān)系模式支持將來(lái)未知的需求、支持適度變化的需求方面具有多維模型無(wú)法比擬的優(yōu)勢(shì)。
因此根據(jù)上面討論過(guò)的原因可以看出:關(guān)系模型對(duì)數(shù)據(jù)倉(cāng)庫(kù)是理想的基礎(chǔ),而星形連接對(duì)于數(shù)據(jù)集市是最佳的。
獨(dú)立集市和從屬集市的區(qū)別:
獨(dú)立集市是指直接通過(guò)歷史應(yīng)用創(chuàng)建的數(shù)據(jù)集市。建立獨(dú)立數(shù)據(jù)集市不需要有“全局思想”考慮。
與獨(dú)立數(shù)據(jù)集市相對(duì)應(yīng)的是從屬數(shù)據(jù)集市。從屬數(shù)據(jù)集市是利用來(lái)自數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)建立的。它的數(shù)據(jù)源不依賴與歷史數(shù)據(jù)或操作型數(shù)據(jù),只依賴于數(shù)據(jù)倉(cāng)庫(kù)??傊?,從屬數(shù)據(jù)集市要求有預(yù)先的計(jì)劃、長(zhǎng)期的觀察、全局的分析和企業(yè)各不同部門(mén)對(duì)需求分析的合作與協(xié)調(diào)。
建立多個(gè)獨(dú)立數(shù)據(jù)集市后,很快用戶就會(huì)發(fā)現(xiàn)數(shù)據(jù)集市之間的信息不統(tǒng)一,也不同步,而且每增加一個(gè)數(shù)據(jù)集市就會(huì)出現(xiàn)不斷增長(zhǎng)的細(xì)節(jié)數(shù)據(jù)冗余的問(wèn)題,需要大量的資源來(lái)建立接口程序,維護(hù)這些程序也變成了負(fù)擔(dān)。因此獨(dú)立數(shù)據(jù)集市不適合與解決企業(yè)中的信息問(wèn)題。
當(dāng)然,如果企業(yè)采用了從屬數(shù)據(jù)集市,并在建立任何數(shù)據(jù)集市之前先創(chuàng)建了一個(gè)數(shù)據(jù)倉(cāng)庫(kù),那么,獨(dú)立數(shù)據(jù)集市固有的哪些體系結(jié)構(gòu)方面的問(wèn)題就不會(huì)出現(xiàn)了。
換句話說(shuō),獨(dú)立數(shù)據(jù)集市表示的是不需要顧及全局及全景的一個(gè)短期的、有限范圍的解決方法。另一方面,從屬數(shù)據(jù)集市則要求一個(gè)長(zhǎng)期和全局的展望。但是獨(dú)立數(shù)據(jù)集市不能為企業(yè)信息提供一個(gè)堅(jiān)實(shí)的基礎(chǔ),而從屬數(shù)據(jù)集市確能為信息決策提供了一個(gè)真正的長(zhǎng)期基礎(chǔ)。
-
數(shù)據(jù)倉(cāng)庫(kù)
+關(guān)注
關(guān)注
0文章
61瀏覽量
10613 -
多維數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
0文章
2瀏覽量
1500
發(fā)布評(píng)論請(qǐng)先 登錄
什么是數(shù)據(jù)倉(cāng)庫(kù)?數(shù)據(jù)倉(cāng)庫(kù)的優(yōu)勢(shì)分析
多版本數(shù)據(jù)倉(cāng)庫(kù)模型設(shè)計(jì)
銀行數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別
數(shù)據(jù)倉(cāng)庫(kù)的OLAP多維展現(xiàn)技術(shù)的研究與應(yīng)用

保護(hù)MySQL數(shù)據(jù)倉(cāng)庫(kù)的最佳實(shí)踐
數(shù)據(jù)倉(cāng)庫(kù)是什么_數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)_數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)庫(kù)區(qū)別

多維數(shù)據(jù)庫(kù)有哪些

數(shù)據(jù)倉(cāng)庫(kù)是什么_數(shù)據(jù)倉(cāng)庫(kù)有什么特點(diǎn)_數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)區(qū)別分析

如何建設(shè)企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)_多維數(shù)據(jù)庫(kù)模型的設(shè)計(jì)你知道多少

如何搭建數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)庫(kù)發(fā)展史2--數(shù)據(jù)倉(cāng)庫(kù)

評(píng)論