數(shù)據(jù)倉庫和OLAP技術(shù)概述

　　聯(lián)機(jī)分析處理

　　聯(lián)機(jī)分析處理OLAP是一種軟件技術(shù)，它使分析人員能夠迅速、一致、交互地從各個方面觀察信息，以達(dá)到深入理解數(shù)據(jù)的目的。它具有FASMI（Fast Analysis of Shared Multidimensional Information），即共享多維信息的快速分析的特征。其中F是快速性（Fast），指系統(tǒng)能在數(shù)秒內(nèi)對用戶的多數(shù)分析要求做出反應(yīng)；A是可分析性（Analysis），指用戶無需編程就可以定義新的專門計算，將其作為分析的一部分，并以用戶所希望的方式給出報告；M是多維性（Multi—dimensional），指提供對數(shù)據(jù)分析的多維視圖和分析；I是信息性（Information），指能及時獲得信息，并且管理大容量信息。

　　數(shù)據(jù)倉庫和聯(lián)機(jī)分析處理（OLAP）是決策支持基本要素，已經(jīng)日益成為數(shù)據(jù)庫行業(yè)的重點。許多商業(yè)產(chǎn)品和服務(wù)現(xiàn)已推出，并且所有主要的數(shù)據(jù)庫管理系統(tǒng)供應(yīng)商現(xiàn)在已經(jīng)在這些領(lǐng)域提供產(chǎn)品。決策支持，相比于傳統(tǒng)的聯(lián)機(jī)事務(wù)處理應(yīng)用程序，會有些不同的要求數(shù)據(jù)庫技術(shù)。本文提供的數(shù)據(jù)概述數(shù)據(jù)倉庫和OLAP技術(shù)，著眼于他們的新的要求。我們描述后端工具來提取，清潔和數(shù)據(jù)加載到數(shù)據(jù)倉庫;典型OLAP的多維數(shù)據(jù)模型;前端客戶端工具用于查詢和數(shù)據(jù)分析;服務(wù)器擴(kuò)展來高效的查詢處理;用來管理元數(shù)據(jù)和倉庫工具。此外，勘測技術(shù)現(xiàn)狀，本文還指出了一些有前景的研究問題，其中一些涉及數(shù)據(jù)庫研究界合作多年的研究的問題，但其他一些問題只是剛剛開始被解決。本概述是基于一個教程，有作者們在會議VLDB 1996年提出。

　　1. 介紹

　　數(shù)據(jù)倉庫是決策支持技術(shù)的集合，旨在使知識工作者（總裁，經(jīng)理，分析師）做出更快更好的決策。過去三年已經(jīng)看到的爆炸性的增長，無論是在所提供的產(chǎn)品和服務(wù)的數(shù)量，還是在采用這些技術(shù)的工業(yè)領(lǐng)域。按照META集團(tuán)說法，數(shù)據(jù)倉庫市場，包括硬件，數(shù)據(jù)庫軟件和工具，預(yù)計是由1995年的20億美金增長到1998年分80億美金。數(shù)據(jù)倉庫技術(shù)已經(jīng)成功部署在許多行業(yè)：制造業(yè)（訂單運輸和客戶支持），零售（用于用戶分析和庫存管理），金融服務(wù)（理賠分析，風(fēng)險分析，信用卡分析和欺詐檢測），交通（車隊管理），電信（呼叫分析和欺詐檢測），公用事業(yè)（電力使用分析）和醫(yī)療保?。▽τ诮Y(jié)果的分析）。本文介紹了數(shù)據(jù)倉庫技術(shù)的路線圖，著重于有特殊需求的數(shù)據(jù)倉庫數(shù)據(jù)庫管理系統(tǒng)（DBMS）。

　　數(shù)據(jù)倉庫是一個“面向主題的，集成的，隨時間變化的，非易失性的，主要用于組織決策的數(shù)據(jù)集合。 ”通常情況下，數(shù)據(jù)倉庫用來分別維護(hù)組織的不同業(yè)務(wù)的數(shù)據(jù)庫。有很多原因來這么做。數(shù)據(jù)倉庫支持在線分析處理（OLAP ），它的功能和性能要求完全不同于由業(yè)務(wù)數(shù)據(jù)庫所支持的聯(lián)機(jī)事務(wù)處理（ OLTP）應(yīng)用程序。

　　OLTP應(yīng)用程序通常使得文書數(shù)據(jù)處理任務(wù)自動化，如訂單錄入和銀行交易等一些組織的日常運作。這些任務(wù)是結(jié)構(gòu)化和重復(fù)性，以及由短的，原子，孤立的交易。該交易需要詳細(xì)，最新的數(shù)據(jù)，通常通常訪問他們的主鍵來讀取或更新少數(shù)（幾十）記錄。操作數(shù)據(jù)庫往往是百兆到千兆字節(jié)。數(shù)據(jù)庫的一致性和可恢復(fù)性是至關(guān)重要的，最大化事務(wù)吞吐量是關(guān)鍵性能指標(biāo)。因此，數(shù)據(jù)庫被設(shè)計為反映已知的應(yīng)用，特別是的操作語義，以盡量減少并發(fā)沖突。

　　數(shù)據(jù)倉庫，相反的，是有針對性的決策支持。歷史，總結(jié)和整合的數(shù)據(jù)比詳細(xì)的，個人記錄更重要。由于數(shù)據(jù)倉庫包含合并數(shù)據(jù)，或許可以從幾個業(yè)務(wù)數(shù)據(jù)庫，在一段時間可能很長的時期，他們往往要比業(yè)務(wù)數(shù)據(jù)庫較大的訂單;企業(yè)數(shù)據(jù)倉庫預(yù)計為數(shù)百GB到TB級大小。工作負(fù)載大多是查詢密集型與臨時性的，復(fù)雜查詢可以訪問數(shù)以百萬計的記錄，并進(jìn)行了大量的掃描，聯(lián)接和聚合。查詢吞吐量和響應(yīng)時間比事務(wù)吞吐量更重要。

　　促進(jìn)復(fù)雜的分析和可視化、數(shù)據(jù)倉庫通常多維建模。例如，在一個銷售數(shù)據(jù)倉庫，銷售，銷售區(qū)域、銷售人員和產(chǎn)品可能是一些感興趣的維度。通常，這些維度是分層次的;銷售時間可能是組織為day-month-quarter-year的層次結(jié)構(gòu)，產(chǎn)品作為product-category-industry的層次結(jié)構(gòu)。典型的OLAP操作包括上鉆（增加聚合的水平）和下鉆（減少聚合的水平或增加細(xì)節(jié)）以及一個或多個維度層次結(jié)構(gòu)切割（選擇和投影），軸轉(zhuǎn)（調(diào)整的多維視圖的數(shù)據(jù)）。

　　由于已有的業(yè)務(wù)數(shù)據(jù)庫已經(jīng)很好的支持已知的OLTP工作負(fù)載，所以試圖對業(yè)務(wù)數(shù)據(jù)庫執(zhí)行復(fù)雜的OLAP查詢，將導(dǎo)致不可接受的性能。此外，決策支持需求的數(shù)據(jù)可能從業(yè)務(wù)數(shù)據(jù)庫中丟失;例如，了解趨勢或進(jìn)行預(yù)測所需要歷史數(shù)據(jù)，而業(yè)務(wù)數(shù)據(jù)庫只存儲當(dāng)前的數(shù)據(jù)。決策支持一般需要從多個不同來源的數(shù)據(jù)進(jìn)行整合：這可能包括外部資源，如股票的市場反饋需要額外的幾個業(yè)務(wù)數(shù)據(jù)庫。不同的來源可能含有不同質(zhì)量的數(shù)據(jù)，或使用不一致的陳述，代碼和格式，需要協(xié)調(diào)。最后，支持多維數(shù)據(jù)模型和操作的典型OLAP需要特殊的數(shù)據(jù)組織，訪問方式和實現(xiàn)方法，不是如一般的商業(yè)數(shù)據(jù)庫管理系統(tǒng)用來針對OLTP。由于這些原因，數(shù)據(jù)倉庫的實現(xiàn)有別于業(yè)務(wù)數(shù)據(jù)庫。

　　數(shù)據(jù)倉庫可能會實施在標(biāo)準(zhǔn)的或擴(kuò)展的關(guān)系DBMS 上，就是所謂關(guān)系型OLAP（ROLAP ）服務(wù)器。這些服務(wù)器假設(shè)數(shù)據(jù)存儲在關(guān)系數(shù)據(jù)庫，并且支持?jǐn)U展SQL和特殊訪問及實施方法來有效實現(xiàn)多維數(shù)據(jù)模型和操作。相比之下，多維OLAP （ MOLAP）服務(wù)器直接把多維數(shù)據(jù)存儲在特定的數(shù)據(jù)結(jié)構(gòu)（例如，數(shù)組），并實現(xiàn)了OLAP在這些特點的數(shù)據(jù)結(jié)構(gòu)的操作。

　　這不僅僅是建設(shè)和維護(hù)一個數(shù)據(jù)倉庫，還需要選擇一個OLAP服務(wù)器并為倉庫明確模式和一些復(fù)雜的查詢。存在著不同結(jié)構(gòu)的替代品。許多組織希望實施綜合性企業(yè)的倉庫，收集跨越整個組織的所有科目（例如，客戶，產(chǎn)品信息，銷售，資產(chǎn)，人員）。然而，構(gòu)建企業(yè)級數(shù)據(jù)倉庫是一個漫長而復(fù)雜的過程，需要廣泛的業(yè)務(wù)建模，可能需要多年才能成功。相反的，一些組織滿足于數(shù)據(jù)集市，它是針對選定的科目的子集（例如，營銷數(shù)據(jù)可能包括客戶，產(chǎn)品和銷售信息）。這些數(shù)據(jù)集市實現(xiàn)更快的推算，因為它們不需要企業(yè)廣泛的共識，但如果一個完整的商業(yè)模式并不發(fā)達(dá)的話，從長遠(yuǎn)來看，它們可能會導(dǎo)致復(fù)雜的集成問題。

　　在第2節(jié)，我們描述了一個典型的數(shù)據(jù)倉庫體系結(jié)構(gòu)，和設(shè)計和操作數(shù)據(jù)倉庫的過程。在3-7節(jié)，我們回顧了在數(shù)據(jù)加載相關(guān)技術(shù)和刷新數(shù)據(jù)倉庫，倉庫服務(wù)器，前端工具和倉庫管理工具。在每一種情況下，我們指出什么是傳統(tǒng)的數(shù)據(jù)庫技術(shù)不同的，我們會提到有代表性的產(chǎn)品。在本文中，我們不打算提供每個類別的所有產(chǎn)品的綜合描述。我們鼓勵有興趣的讀者看看在最近的商業(yè)雜志，如Databased Advisor， Database Programming，Design， Datamation，DBMS Magazine， vendors’ Web sites來獲取商業(yè)產(chǎn)品，白皮書和案例研究的更多細(xì)節(jié)。OLAP Council是在整個行業(yè)的標(biāo)準(zhǔn)化工作上一個很好的信息源。還有科德等人的論文定義了OLAP產(chǎn)品的12條規(guī)則。還有，Data Warehousing Information Center是數(shù)據(jù)倉庫和OLAP良好的資源。

　　數(shù)據(jù)倉庫的研究是相當(dāng)新的，并一直專注的主要是查詢處理和視圖維護(hù)問題。還有很多開放性的研究問題，在第8節(jié)，我們會簡要提及的這些問題并得出結(jié)論。

　　2. 架構(gòu)與端到端流程

　　圖1是一個典型的數(shù)據(jù)倉庫架構(gòu)。

　　數(shù)據(jù)倉庫和OLAP技術(shù)概述

　　它包括一些工具。這些工具可以用來從多種操作數(shù)據(jù)庫和外部源中提取數(shù)據(jù)，并清洗、轉(zhuǎn)換和整合這些數(shù)據(jù)，然后把數(shù)據(jù)加載到數(shù)據(jù)倉庫;定期刷新倉庫來更新的源和清除倉庫的數(shù)據(jù)，或者是慢歸檔存儲。除了主倉庫，可能會有好幾個部門數(shù)據(jù)集市。存儲在數(shù)據(jù)倉庫和數(shù)據(jù)集市的數(shù)據(jù)，由一個或多個倉庫服務(wù)器管理，并呈現(xiàn)數(shù)據(jù)的多維視圖給不同的前端工具，如：查詢工具、報告作者、分析工具和數(shù)據(jù)挖掘工具。最后，還有一個存儲庫，用于存儲和管理元數(shù)據(jù)，并為監(jiān)測和管理倉儲系統(tǒng)。

　　倉庫可能被設(shè)計成分布式，以來得到負(fù)載均衡，可伸縮性和高可用性。在這樣一個分布式體系結(jié)構(gòu)，元數(shù)據(jù)存儲庫通常是在每個節(jié)點的倉庫都進(jìn)行備份的，整個倉庫集中管理的。另一個體系結(jié)構(gòu)，是倉庫或數(shù)據(jù)集市的聯(lián)合，每個倉庫或者數(shù)據(jù)集市都有自己的貯存和分級管理。該設(shè)計實現(xiàn)力求使用方便，所以可能花費過于昂貴的代價來構(gòu)造一個邏輯集成的企業(yè)倉庫。

　　設(shè)計和推出一個數(shù)據(jù)倉庫是一個復(fù)雜的過程，包括以下活動：

　　定義體系結(jié)構(gòu)，容量規(guī)劃，并選擇存儲服務(wù)器、數(shù)據(jù)庫和OLAP服務(wù)器和工具。

　　整合服務(wù)器、存儲和客戶端工具。

　　設(shè)計倉庫表和視圖。

　　定義物理倉庫組織，數(shù)據(jù)布局、分區(qū)和訪問方法。

　　使用網(wǎng)關(guān)、ODBC驅(qū)動程序，或其他的包裝器連接數(shù)據(jù)源，。

　　設(shè)計和實現(xiàn)數(shù)據(jù)提取、清洗、轉(zhuǎn)換、加載和刷新的腳本。

　　貯存表和視圖的定義、腳本和其他元數(shù)據(jù)。

　　設(shè)計和實現(xiàn)終端用戶應(yīng)用程序。

　　推出倉庫和應(yīng)用程序。

　　3. 后端工具和實用程序

　　數(shù)據(jù)倉庫系統(tǒng)使用各種數(shù)據(jù)提取和清洗工具，錄入倉庫的加載和更新的實用程序。通常外來源的數(shù)據(jù)提取的實現(xiàn)需要通過網(wǎng)關(guān)和標(biāo)準(zhǔn)接口（如Information Builders EDA/SQL， ODBC， Oracle Open Connect， Sybase Enterprise Connect， Informix Enterprise Gateway）。

　　數(shù)據(jù)清洗

　　由于數(shù)據(jù)倉庫是用于決策，數(shù)據(jù)倉庫中的數(shù)據(jù)正確性的非常重要的。然而，因為大量的數(shù)據(jù)來自多個參與的數(shù)據(jù)源，數(shù)據(jù)中出現(xiàn)錯誤和異常的概率很高。因此，幫助檢測數(shù)據(jù)的異常和對其改正的工具，可以帶來很高高效益。在一些情況下，數(shù)據(jù)清洗顯得非常有必要：字段長度不一致，不一致的描述，不一致的價值分配，缺失的條目和違背完整性約束。可想而知，數(shù)據(jù)錄入表中的可選字段是不一致數(shù)據(jù)的重要來源。

　　有三個相關(guān)，但不同的類數(shù)據(jù)清理工具。數(shù)據(jù)遷移工具可以制定簡單轉(zhuǎn)換規(guī)則，例如，用性別種類來替換性別字符串。Prism的Warehouse Manager是這種類型的工具中比較流行的一個。數(shù)據(jù)清理工具使用特定領(lǐng)域的知識（如郵政地址）來對數(shù)據(jù)進(jìn)行清理。他們經(jīng)常利用解析和模糊匹配技術(shù)來完成來著多個源的清洗。一些工具可以指定源的“相對清洗”。 Integrity和Trillum等工具屬于此類。數(shù)據(jù)審計工具可以通過掃描數(shù)據(jù)從而發(fā)現(xiàn)規(guī)則和關(guān)系（或提醒違背了規(guī)定的規(guī)則）。因此，這樣的工具可以認(rèn)為是數(shù)據(jù)挖掘工具的變體。這樣的工具可能會發(fā)現(xiàn)一個可疑的樣本（基于統(tǒng)計分析），例如，某汽車經(jīng)銷商從未收到任何投訴。

　　加載

　　提取、清洗和轉(zhuǎn)換后，數(shù)據(jù)必須被加載到倉庫。額外的預(yù)處理可能仍然被需要：檢查完整性約束;排序;通過總結(jié)、聚合和其他計算來建立存儲在倉庫中的派生表;創(chuàng)建目錄和其他訪問路徑;分區(qū)實現(xiàn)多個目標(biāo)存儲區(qū)域。通常情況下，批量裝載工具可以用來做這件事。除了填充倉庫，一個負(fù)載工具必須允許系統(tǒng)管理員監(jiān)控狀態(tài)，取消、掛起和恢復(fù)一個負(fù)載，失敗后重啟而沒有損失數(shù)據(jù)的完整性。

　　數(shù)據(jù)倉庫的加載工具必須處理比操作數(shù)據(jù)庫更大規(guī)模的數(shù)據(jù)量。只有一個小時間窗口中（通常在晚上），倉庫可以離線刷新它。連續(xù)加載會花費很長的時間，例如。，可以加載TB級的數(shù)據(jù)會花幾周和幾個月時間！因此，通常需要利用管線式和分區(qū)式的并行性。進(jìn)行一個滿載的優(yōu)勢在于它可以被視為一個長的批處理事務(wù)，來建立一個新的數(shù)據(jù)庫。雖然在運行中，但是當(dāng)前數(shù)據(jù)庫仍然可以支持查詢;當(dāng)負(fù)載事務(wù)提交時，當(dāng)前數(shù)據(jù)庫被新的數(shù)據(jù)庫所取代。使用周期檢查點保證，如果加載過程中發(fā)生了失敗，這個進(jìn)程可以從上個檢查點重啟。

　　然而，即使使用并行性，一個滿載可能仍然需要太長的時間。大多數(shù)商業(yè)工具（如，RedBrick Table Management Utility）在刷新過程中使用增量加載，來降低必須被納入倉庫的數(shù)據(jù)規(guī)模。只插入更新的元組。然而，這樣的加載過程更加難以管理了。增量加載會與正在進(jìn)行的查詢起沖突，所以它被作為一個短事務(wù)（定期提交，如，每隔1000個記錄或每隔幾秒），但這樣一來這個事務(wù)的序列必須被設(shè)計，來確保導(dǎo)出數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)的索引的一致性。

閱讀全文

數(shù)據(jù)倉庫(10319) 數(shù)據(jù)倉庫(10319)
OLAP(10006) OLAP(10006)

數(shù)據(jù)立方體壓縮技術(shù)研究

【作者】：陳富強(qiáng)【來源】：《華南理工大學(xué)》2010年【摘要】：隨著商業(yè)智能技術(shù)與決策支持技術(shù)的發(fā)展,數(shù)據(jù)倉庫的應(yīng)用越來越廣,其數(shù)據(jù)量也越來越大,對計算資源的要求越來越高。數(shù)據(jù)立方體是數(shù)據(jù)倉庫中的一種

2010-04-24 09:17:57

數(shù)據(jù)倉庫的定義(2)#Python

數(shù)據(jù)函數(shù)感知算法python

未來加油dz發(fā)布于 2023-08-23 19:48:46

數(shù)據(jù)倉庫的定義(1)#Python

數(shù)據(jù)函數(shù)感知算法python

未來加油dz發(fā)布于 2023-08-23 19:47:04

數(shù)據(jù)倉庫的發(fā)展(2)#Python

數(shù)據(jù)函數(shù)感知算法python

未來加油dz發(fā)布于 2023-08-23 19:46:06

數(shù)據(jù)倉庫概述及特點

數(shù)據(jù)庫已經(jīng)在信息技術(shù)領(lǐng)域有了廣泛的應(yīng)用，我們社會生活的各個部門，幾乎都有各種各樣的數(shù)據(jù)庫保存著與我們的生活息息相關(guān)的各種數(shù)據(jù)。作為數(shù)據(jù)庫的一個分支，數(shù)據(jù)倉庫概念的提出，相對于數(shù)據(jù)庫從時間上就近得多。

2023-08-11 14:33:46

2856

加速Oracle數(shù)據(jù)倉庫 Emulex和博科第6代光纖通道

電子發(fā)燒友網(wǎng)站提供《加速Oracle數(shù)據(jù)倉庫 Emulex和博科第6代光纖通道.pdf》資料免費下載

2023-08-03 10:20:45

基于云平臺的多維數(shù)據(jù)分析的研究與應(yīng)用

　　在現(xiàn)今不斷發(fā)展的信息化社會中，企業(yè)產(chǎn)生了海量的數(shù)據(jù)資料。怎樣利用和分析這些數(shù)據(jù)，使得決策人員能夠以更簡單易懂的方式看到查詢結(jié)果和數(shù)據(jù)，為企業(yè)提供有利的決策信息，成為企業(yè)關(guān)注的問題。數(shù)據(jù)倉庫和聯(lián)機(jī)

2023-07-19 10:30:00

如何提高數(shù)據(jù)倉庫的性能及優(yōu)化設(shè)計

?！　”鞠到y(tǒng)主要功能是利用oracle9i所提供的技術(shù)：分區(qū)、實體化視圖和查詢重寫來實現(xiàn)數(shù)據(jù)倉庫的性能優(yōu)化：用戶自己建表、視圖并進(jìn)行查詢比較；比較是否采用優(yōu)化技術(shù)和直接查詢的時間，體現(xiàn)優(yōu)化程度。　　隨著計算機(jī)技術(shù)的

2023-07-18 16:10:37

數(shù)據(jù)倉庫實現(xiàn)(2)#數(shù)據(jù)挖掘

數(shù)據(jù)

學(xué)習(xí)硬聲知識發(fā)布于 2023-07-06 16:20:43

數(shù)據(jù)倉庫實現(xiàn)(1)#數(shù)據(jù)挖掘

數(shù)據(jù)

學(xué)習(xí)硬聲知識發(fā)布于 2023-07-06 16:20:17

數(shù)據(jù)倉庫基本概念(2)#數(shù)據(jù)挖掘

數(shù)據(jù)

學(xué)習(xí)硬聲知識發(fā)布于 2023-07-06 16:19:30

數(shù)據(jù)倉庫基本概念(1)#數(shù)據(jù)挖掘

數(shù)據(jù)

學(xué)習(xí)硬聲知識發(fā)布于 2023-07-06 16:18:57

數(shù)據(jù)倉庫設(shè)計(3)#數(shù)據(jù)挖掘

數(shù)據(jù)

學(xué)習(xí)硬聲知識發(fā)布于 2023-07-06 16:13:54

數(shù)據(jù)倉庫設(shè)計(2)#數(shù)據(jù)挖掘

數(shù)據(jù)

學(xué)習(xí)硬聲知識發(fā)布于 2023-07-06 16:13:09

數(shù)據(jù)倉庫設(shè)計(1)#數(shù)據(jù)挖掘

數(shù)據(jù)

學(xué)習(xí)硬聲知識發(fā)布于 2023-07-06 16:12:16

數(shù)據(jù)湖真的能取代數(shù)據(jù)倉庫嗎？【SNP SAP數(shù)據(jù)轉(zhuǎn)型】

數(shù)據(jù)湖和數(shù)據(jù)倉庫的存在并不沖突，也并不是取代的關(guān)系，而是相互的融合關(guān)系。 數(shù)據(jù)湖是近兩年中比較新的技術(shù)在大數(shù)據(jù)領(lǐng)域中，對于一個真正的數(shù)據(jù)湖應(yīng)該是什么樣子，現(xiàn)在對數(shù)據(jù)湖認(rèn)知還是處在探索的階段，像現(xiàn)在

2023-07-03 15:48:27

145

數(shù)據(jù)倉庫解決方案的實施過程是什么？#數(shù)據(jù)倉庫 #光點科技

數(shù)據(jù)倉庫

光點科技發(fā)布于 2023-06-19 14:24:46

數(shù)據(jù)倉庫解決方案的主要作用是什么？#數(shù)據(jù)倉庫 #光點科技

數(shù)據(jù)

光點科技發(fā)布于 2023-06-19 11:39:06

什么是數(shù)據(jù)倉庫解決方案？#數(shù)據(jù)倉庫 #光點科技

數(shù)據(jù)

光點科技發(fā)布于 2023-06-19 10:27:00

Quest :數(shù)據(jù)倉庫現(xiàn)代化

Quest數(shù)據(jù)倉庫現(xiàn)代化解決方案讓組織能夠?qū)ζ渌x云數(shù)據(jù)平臺中的戰(zhàn)略數(shù)據(jù)資產(chǎn)進(jìn)行建模、遷移和監(jiān)管。這些解決方案利用QuestData Empowerment產(chǎn)品組合的強(qiáng)大功能，確保數(shù)據(jù)可用且隨時能夠滿足不斷變化的業(yè)務(wù)需求。

2023-01-12 11:11:24

431

將數(shù)據(jù)湖和數(shù)據(jù)倉庫評估為機(jī)器學(xué)習(xí)數(shù)據(jù)倉庫

　　數(shù)據(jù)倉庫創(chuàng)建于 20 世紀(jì) 80 年代，旨在幫助企業(yè)組織高數(shù)據(jù)量，以便做出更好的業(yè)務(wù)決策。數(shù)據(jù)倉庫與企業(yè)資源規(guī)劃（ ERP ）、客戶關(guān)系管理（ CRM ）軟件、庫存和銷售點系統(tǒng)等遺留資源一起使用。

2022-10-10 15:42:21

559

下秒數(shù)據(jù)CEO蔡致暖：云原生時代數(shù)據(jù)管道的迭代之路

數(shù)據(jù)管道是一項重要的數(shù)據(jù)基礎(chǔ)設(shè)施，使用智能數(shù)據(jù)管道技術(shù)，能夠幫助組織將所有應(yīng)用程序、數(shù)據(jù)庫、事件和文件等數(shù)據(jù)信息提取到數(shù)據(jù)倉庫中

2022-09-20 10:59:48

388

數(shù)據(jù)庫發(fā)展史2--數(shù)據(jù)倉庫

回顧數(shù)據(jù)倉庫的發(fā)展歷程，大致可以將其分為幾個階段：萌芽探索到全企業(yè)集成時代、企業(yè)數(shù)據(jù)集成時代、混亂時代--"數(shù)據(jù)倉庫之父"間的論戰(zhàn)、理論模型確認(rèn)時代以及數(shù)據(jù)倉庫產(chǎn)品百家爭鳴時代。 數(shù)據(jù)倉庫理論發(fā)展

2022-09-19 15:29:26

864

內(nèi)部部署倉庫架構(gòu)vs.云計算數(shù)據(jù)倉庫架構(gòu)

高質(zhì)量的計算環(huán)境(包括服務(wù)器、操作系統(tǒng)、存儲和數(shù)據(jù)庫)對于任何使用大量數(shù)據(jù)的應(yīng)用程序的成功都是至關(guān)重要的。這無疑適用于數(shù)據(jù)倉庫：企業(yè)為了選擇最佳的數(shù)據(jù)倉庫平臺，IT和數(shù)據(jù)管理團(tuán)隊需要評估完整的系統(tǒng)環(huán)境，而不僅僅是其核心的數(shù)據(jù)庫軟件。

2022-07-28 14:41:08

614

華為保障光大銀行順利實現(xiàn)數(shù)據(jù)倉庫平臺歸一化

近日，光大銀行基于華為云GaussDB（DWS）建設(shè)的數(shù)倉平臺成功切換投產(chǎn)，成為國內(nèi)首家使用GaussDB產(chǎn)品實現(xiàn)數(shù)據(jù)倉庫平臺大集中的銀行。

2022-05-07 15:32:45

1015

數(shù)據(jù)治理系列之元數(shù)據(jù)管理平臺的原理

元數(shù)據(jù)主要記錄數(shù)據(jù)倉庫中模型的定義、各級之間的映射關(guān)系、數(shù)據(jù)倉庫的數(shù)據(jù)狀態(tài)和ETL的任務(wù)運行狀態(tài)。元數(shù)據(jù)管理是對數(shù)據(jù)采集、存儲、處理和顯示等數(shù)據(jù)生命周期的描述信息，幫助用戶理解數(shù)據(jù)關(guān)系和相關(guān)屬性。

2021-11-18 11:00:37

1385

數(shù)據(jù)分析過程中元數(shù)據(jù)該如何管理

元數(shù)據(jù)，主要記錄是數(shù)據(jù)倉庫中模型的定義，各級之間的映射關(guān)系，監(jiān)控數(shù)據(jù)倉庫的數(shù)據(jù)狀態(tài)和ETL的任務(wù)運行狀態(tài)。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)與數(shù)據(jù)的關(guān)系就像數(shù)據(jù)與自然的關(guān)系。

2021-11-17 17:50:56

408

數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的一些基本概念

OLAP：聯(lián)機(jī)分析處理 OLAP是E.F.Codd于1993年提出的。 OLAP是一種軟件技術(shù)，他使分析人員可以迅速、一致、交互地從各個方面觀察信息，以達(dá)到深入理解數(shù)據(jù)的目的，這些信息是從原始數(shù)據(jù)

2021-09-01 15:11:33

401

基于數(shù)據(jù)倉庫技術(shù)的銀行ACRM系統(tǒng)設(shè)計與實現(xiàn)_王萍萍

基于數(shù)據(jù)倉庫技術(shù)的銀行ACRM系統(tǒng)設(shè)計與實現(xiàn)_王萍萍(3842在電腦電源電路上的接法)-基于數(shù)據(jù)倉庫技術(shù)的銀行ACRM系統(tǒng)設(shè)計與實現(xiàn)_王萍萍這是一份非常不錯的資料，歡迎下載，希望對您有幫助！

2021-07-26 13:08:20

數(shù)據(jù)倉庫環(huán)境的現(xiàn)代化工具綜述

數(shù)據(jù)倉庫歷史悠久，這里的基本想法是，大多數(shù)企業(yè)建立各種應(yīng)用程序來自動化其基本業(yè)務(wù)流程，而這些業(yè)務(wù)流程各自發(fā)展，從而產(chǎn)生多個版本的數(shù)據(jù)。在過去，對于那些想了解不同產(chǎn)品線或地區(qū)的銷售收入或利潤率的人來說，數(shù)據(jù)不一致是令人頭疼的問題。

2021-05-05 17:13:00

360

一文詳解實時數(shù)據(jù)倉庫的發(fā)展、架構(gòu)和趨勢

數(shù)據(jù)處理現(xiàn)狀：當(dāng)前基于Hive的離線數(shù)據(jù)倉庫已經(jīng)非常成熟，數(shù)據(jù)中臺體系也基本上是圍繞離線數(shù)倉進(jìn)行建設(shè)。但是隨著實時計算引擎的不斷發(fā)展以及業(yè)務(wù)對于實時報表的產(chǎn)出需求不斷膨脹，業(yè)界最近幾年就一直聚焦并

2021-04-29 16:55:50

1921

如何理解整個數(shù)據(jù)倉庫建設(shè)體系？

數(shù)據(jù)倉庫的基本概念數(shù)據(jù)倉庫概念：英文名稱為Data Warehouse，可簡寫為DW或DWH。數(shù)據(jù)倉庫的目的是構(gòu)建面向分析的集成化數(shù)據(jù)環(huán)境，為企業(yè)提供決策支持（Decision Support

2021-04-26 11:06:03

1411

什么是數(shù)據(jù)倉庫？數(shù)據(jù)倉庫的優(yōu)勢分析

數(shù)據(jù)倉庫，有一個被廣泛接受的定義：數(shù)據(jù)倉庫（Data Warehouse）是一個面向主題的（Subject Oriented）、集成的（Integrated）、相對穩(wěn)定的（Non-Volatile）、反映歷史變化（Time Variant）的數(shù)據(jù)集合。

2020-11-01 10:57:42

9155

數(shù)據(jù)倉庫開發(fā)技術(shù)的重要一環(huán)：ETL

大家都知道數(shù)據(jù)倉庫，是為企業(yè)所有級別的決策制定過程，提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。因此越來越多的企業(yè)和管理者對數(shù)據(jù)倉庫格外關(guān)注。做好數(shù)據(jù)倉庫開發(fā)，一靠工具，二靠技術(shù)。就工具方面來說，很多云廠商已經(jīng)

2020-09-23 13:58:10

1878

什么是數(shù)據(jù)倉庫、數(shù)據(jù)集市、數(shù)據(jù)湖？

來源：一個數(shù)據(jù)玩家的自我修養(yǎng) 本文已授權(quán) 經(jīng)?？吹接腥藛栠@個問題，數(shù)據(jù)玩家也看過很多解釋，感覺都不夠直觀，這里，我嘗試用一個大家都理解的例子來說明。什么是數(shù)據(jù)倉庫？大家都去宜家買過東西吧，還記得

2020-09-21 10:44:29

2255

阿里云云原生數(shù)據(jù)倉庫標(biāo)刷新世界紀(jì)錄，將性價比帶入不足1毛錢時代

日前，據(jù)權(quán)威國際處理性能委員會TPC官方披露，在被譽(yù)為“數(shù)據(jù)庫分析場景珠穆朗瑪峰”的TPC-DS基準(zhǔn)測試中，阿里云自研的云原生數(shù)據(jù)倉庫AnalyticDB以1489萬的性能指標(biāo)刷新了世界紀(jì)錄，比第二名提升近30%以上，同時單位計算成本降低到0.08元，首次將數(shù)據(jù)倉庫的性價比帶入“不足1毛錢”時代。

2020-05-14 15:07:36

1829

為什么需要數(shù)據(jù)倉庫?

數(shù)據(jù)倉庫的一般概念非常簡單：從支持業(yè)務(wù)流程的操作系統(tǒng)中定期提取數(shù)據(jù)副本，并將其加載到單獨的存儲庫中，在該存儲庫中，數(shù)據(jù)將被合并，然后可用于分析和報告。

2020-05-13 15:47:36

2847

數(shù)據(jù)倉庫技術(shù)會因為云計算有什么不一樣

為了使數(shù)據(jù)對他們的業(yè)務(wù)有用、可行和可擴(kuò)展，企業(yè)需要一種有效且經(jīng)濟(jì)高效的方式來存儲、標(biāo)記和解釋這些數(shù)據(jù)。實現(xiàn)這種目的最有利可圖的方法之一就是采用數(shù)據(jù)倉庫。

2020-05-01 21:01:00

1021

大數(shù)據(jù)數(shù)據(jù)倉庫應(yīng)該如何建設(shè)

互聯(lián)網(wǎng)行業(yè)，除了數(shù)據(jù)量大之外，業(yè)務(wù)時效性要求也很高，甚至很多是要求實時的，另外，互聯(lián)網(wǎng)行業(yè)的業(yè)務(wù)變化非?？?，不可能像傳統(tǒng)行業(yè)一樣，可以使用自頂向下的方法建立數(shù)據(jù)倉庫，一勞永逸，它要求新的業(yè)務(wù)很快能融入數(shù)據(jù)倉庫中來，老的下線的業(yè)務(wù)，能很方便的從現(xiàn)有的數(shù)據(jù)倉庫中下線。

2020-03-10 16:37:09

743

大數(shù)據(jù)時代離得開數(shù)據(jù)倉庫嗎

2020-01-09 10:10:35

947

中國銀聯(lián)這些年來大數(shù)據(jù)技術(shù)的變革以及優(yōu)化

2007 年左右，中國銀聯(lián)開始進(jìn)入到數(shù)據(jù)倉庫年代。相較于報表，數(shù)據(jù)倉庫對于用戶體驗來說是一個巨大的革新，基本上體現(xiàn)在數(shù)據(jù)發(fā)展以業(yè)務(wù)為驅(qū)動，主要有結(jié)構(gòu)化數(shù)據(jù)集中存儲、勾兌整合、服務(wù)業(yè)務(wù)等特點。也就是說，數(shù)據(jù)倉庫還原了數(shù)據(jù)的本質(zhì)，以數(shù)據(jù)本身的特性來處理數(shù)據(jù)。

2019-12-12 14:32:46

2993

作為一個快速簡便的數(shù)據(jù)倉庫，Snowflake可以動態(tài)擴(kuò)展

Amazon Redshift是一個快速可擴(kuò)展的數(shù)據(jù)倉庫，可讓用戶分析數(shù)據(jù)倉庫和Amazon S3數(shù)據(jù)湖中的所有數(shù)據(jù)。用戶使用SQL查詢Redshift。Redshift數(shù)據(jù)倉庫是一個可以使用并發(fā)查詢負(fù)載自動部署和刪除容量的集群。但是，所有集群節(jié)點都在同一可用區(qū)中進(jìn)行配置。

2019-09-22 09:11:07

3927

云數(shù)據(jù)倉庫會是什么樣子的

數(shù)據(jù)倉庫收集來自組織業(yè)務(wù)的所有結(jié)構(gòu)化數(shù)據(jù)，因此組織可以將其集成到單個數(shù)據(jù)模型中，運行分析并獲取商業(yè)智能，無論是用于開發(fā)新產(chǎn)品還是向客戶營銷現(xiàn)有服務(wù)。

2019-07-15 16:09:07

599

大數(shù)據(jù)時代下的數(shù)據(jù)倉庫搭建之路

數(shù)據(jù)倉庫并不是獨立存在的一個個體，而是與整個大數(shù)據(jù)體系融為一體的——換句話說，數(shù)據(jù)倉庫就像人的心臟，人只有心臟而沒有其他器官是無法單獨存活下來的。

2019-06-27 16:32:40

1459

如何搭建數(shù)據(jù)倉庫

數(shù)據(jù)倉庫是所有產(chǎn)品的數(shù)據(jù)中心，公司體系下的所有產(chǎn)品產(chǎn)生的所有數(shù)據(jù)最終都流向數(shù)據(jù)倉庫，可以說數(shù)據(jù)倉庫不產(chǎn)生數(shù)據(jù)，也不消費數(shù)據(jù)，只是數(shù)據(jù)的搬運工。

2019-06-25 15:41:56

1857

成為數(shù)據(jù)挖掘工程師有哪些要求

計算機(jī)、統(tǒng)計學(xué)等相關(guān)專業(yè)，具有深厚的統(tǒng)計學(xué)、數(shù)學(xué)、數(shù)據(jù)挖掘知識，熟悉數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的相關(guān)技術(shù);

2019-06-09 17:24:00

5401

浪潮inData數(shù)據(jù)庫一體機(jī) 企業(yè)互聯(lián)網(wǎng)轉(zhuǎn)型的數(shù)字心臟

Processing）聯(lián)機(jī)分析處理數(shù)據(jù)倉庫系統(tǒng)用于支持復(fù)雜分析類業(yè)務(wù)，數(shù)據(jù)庫中的數(shù)據(jù)經(jīng)過提取清洗等處理導(dǎo)入數(shù)據(jù)倉庫中。伴隨著企業(yè)的數(shù)字化轉(zhuǎn)型，數(shù)據(jù)量增長越來越快，在線交易、商業(yè)決策、報表、日志、離線分析等需要數(shù)據(jù)支持的業(yè)務(wù)也越來越多，這導(dǎo)致數(shù)據(jù)庫和數(shù)據(jù)倉庫系統(tǒng)越來越復(fù)雜，甚至是失控。前幾年，HTAP（H

2019-01-31 12:33:01

185

數(shù)據(jù)倉庫是什么數(shù)據(jù)倉庫和聯(lián)機(jī)分析處理及數(shù)據(jù)挖掘技術(shù)的資料概述

操作型處理（也叫事務(wù)處理）：對數(shù)據(jù)庫聯(lián)機(jī)的日常操作，通常是對一個或一組記錄的查詢和修改特點：快速響應(yīng)用戶請求，對數(shù)據(jù)的安全性、完整性以及事務(wù)吞吐量要求很高。

2018-10-26 11:48:23

如何建設(shè)企業(yè)級數(shù)據(jù)倉庫_多維數(shù)據(jù)庫模型的設(shè)計你知道多少

集市的一個典型的特征，從根本上而言，數(shù)據(jù)倉庫數(shù)據(jù)模型的模式更多是為了避免冗余和數(shù)據(jù)復(fù)用，套用現(xiàn)成的模式，是設(shè)計數(shù)據(jù)倉庫最合理的選擇。當(dāng)然大數(shù)據(jù)技術(shù)體系下，數(shù)據(jù)倉庫數(shù)據(jù)模型的設(shè)計，還是一個盲點，探索中。

2018-02-24 14:42:53

2133

數(shù)據(jù)倉庫的模型設(shè)計

本文詳細(xì)介紹了關(guān)于數(shù)據(jù)倉庫的模型設(shè)計，A. 數(shù)據(jù)建模方法論，B. 分層設(shè)計原則，C. 主題域設(shè)計方法。

2018-02-24 14:30:55

5314

數(shù)據(jù)倉庫是什么_數(shù)據(jù)倉庫有什么特點_數(shù)據(jù)庫和數(shù)據(jù)倉庫區(qū)別分析

數(shù)據(jù)倉庫是一個面向主題的、集成的、不可更新的、隨時間不斷變化的數(shù)據(jù)集合，它用于支持企業(yè)或組織的決策分析處理。數(shù)據(jù)倉庫是一個過程而不是一個項目。

2018-02-24 14:04:38

19023

數(shù)據(jù)倉庫和多維數(shù)據(jù)庫的區(qū)別在哪里

數(shù)據(jù)倉庫，是為企業(yè)所有級別的決策制定過程，提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。多維數(shù)據(jù)庫，可以簡單地理解為：將數(shù)據(jù)存放在一個n維數(shù)組中，而不是像關(guān)系數(shù)據(jù)庫那樣以記錄的形式存放。因此它存在大量稀疏矩陣，人們可以通過多維視圖來觀察數(shù)據(jù)。

2018-02-24 13:46:13

12285

數(shù)據(jù)倉庫是什么_數(shù)據(jù)倉庫的特點_數(shù)據(jù)倉庫與數(shù)據(jù)庫區(qū)別

本文開始介紹了數(shù)據(jù)倉庫是什么，其次詳細(xì)介紹了數(shù)據(jù)倉庫的特點、數(shù)據(jù)倉庫的基本架構(gòu)與數(shù)據(jù)倉庫用途，最后介紹了數(shù)據(jù)倉庫的五大好處，闡述了數(shù)據(jù)庫與數(shù)據(jù)倉庫的區(qū)別。

2018-02-11 10:42:31

22165

基于hadoop的數(shù)據(jù)倉庫介紹

Hive是基于Hadoop的數(shù)據(jù)倉庫工具，可對存儲在HDFS上的文件中的數(shù)據(jù)集進(jìn)行數(shù)據(jù)整理、特殊查詢和分析處理，提供了類似于SQL語言的查詢語言–HiveQL，可通過HQL語句實現(xiàn)簡單的MR統(tǒng)計，Hive將HQL語句轉(zhuǎn)換成MR任務(wù)進(jìn)行執(zhí)行。

2018-02-11 10:17:27

6962

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

本文開始介紹了什么是數(shù)據(jù)倉庫以及數(shù)據(jù)倉庫的用途，其次介紹了數(shù)據(jù)倉庫分層的原因，最后介紹了數(shù)據(jù)倉庫的架構(gòu)圖及理想的架構(gòu)分析。

2018-02-11 10:08:42

58188

基于WebGIS的海量氣象及大氣污染數(shù)據(jù)倉庫系統(tǒng)

氣象及大氣污染數(shù)據(jù)倉庫系統(tǒng)作為21世紀(jì)新一代的氣象信息存儲發(fā)布管理系統(tǒng)，可以大大提升現(xiàn)有海量氣象以及大氣污染數(shù)據(jù)的管理水平和對業(yè)務(wù)科研的支持。氣象及大氣污染數(shù)據(jù)倉庫系統(tǒng)是基于B/S架構(gòu)的系統(tǒng)，采用

2017-12-08 16:44:00

OLAP分類的基本概念和基本操作

OLAP有多種實現(xiàn)方法，根據(jù)存儲數(shù)據(jù)的方式不同可以分為ROLAP、MOLAP、HOLAP。我們已經(jīng)知道OLAP的操作是以查詢——也就是數(shù)據(jù)庫的SELECT操作為主，但是查詢可以很復(fù)雜，比如基于關(guān)系數(shù)據(jù)

2017-12-07 17:19:25

11898

oltp和olap的區(qū)別_怎么辨別oltp和olap的區(qū)別

Processing）。OLTP是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的主要應(yīng)用，主要是基本的、日常的事務(wù)處理，例如銀行交易。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用，支持復(fù)雜的分析操作，側(cè)重決策支持，并且提供直觀易懂的查詢結(jié)果。

2017-11-13 11:21:12

10820

HIVE技術(shù)的物流數(shù)據(jù)倉庫分析

隨著電子商務(wù)的不斷壯大，物流業(yè)的蓬勃發(fā)展，物流數(shù)據(jù)開始呈現(xiàn)爆炸式增長。目前用于物流行業(yè)的仍然是傳統(tǒng)數(shù)據(jù)倉庫居多，已有的物流信息管理系統(tǒng)的建設(shè)也大多采用常規(guī)的解決方案，即購置昂貴的的大型服務(wù)器

2017-11-01 17:27:14

保護(hù)MySQL數(shù)據(jù)倉庫的最佳實踐

數(shù)據(jù)倉庫中最常見的數(shù)據(jù)庫管理系統(tǒng)可能就是開源的MySQL數(shù)據(jù)庫。以下5個小技巧重點介紹了一些保護(hù)MySQL數(shù)據(jù)倉庫的最佳實踐。 1.限制訪問確保MySQL數(shù)據(jù)倉庫安全最有效的方法之一是只給用戶需要

2017-09-27 14:10:28

采購決策支持系統(tǒng)數(shù)據(jù)倉庫技術(shù)的研究_邵麗麗

采購決策支持系統(tǒng)數(shù)據(jù)倉庫技術(shù)的研究_邵麗麗

2017-03-19 11:28:16

基于OLAP的新產(chǎn)品銷售合同數(shù)據(jù)的多維分析陳文霞

基于OLAP的新產(chǎn)品銷售合同數(shù)據(jù)的多維分析_陳文霞

2017-03-17 08:00:00

數(shù)據(jù)倉庫技術(shù)在零售業(yè)稅務(wù)決策支持系統(tǒng)中的應(yīng)用孫眾眾

數(shù)據(jù)倉庫技術(shù)在零售業(yè)稅務(wù)決策支持系統(tǒng)中的應(yīng)用_孫眾眾

2017-03-14 08:00:00

一種負(fù)載敏感的OLAP查詢結(jié)果緩存管理技術(shù)_陽穎燦

一種負(fù)載敏感的OLAP查詢結(jié)果緩存管理技術(shù)_陽穎燦

2017-03-04 18:11:24

基于數(shù)據(jù)倉庫的科學(xué)儀器設(shè)備數(shù)據(jù)分析系統(tǒng)_李玉泉

基于數(shù)據(jù)倉庫的科學(xué)儀器設(shè)備數(shù)據(jù)分析系統(tǒng)_李玉泉

2017-03-04 18:03:51

數(shù)據(jù)倉庫的OLAP多維展現(xiàn)技術(shù)的研究與應(yīng)用

基于數(shù)據(jù)倉庫以及聯(lián)機(jī)分析的相關(guān)知識，采用ETL和Analysis Services相關(guān)技術(shù)，通過在線銷售系統(tǒng)中的實驗，分析在線銷售系統(tǒng)的多維數(shù)據(jù)集，利用OLAP多維展現(xiàn)技術(shù)，將OLAP對多維數(shù)據(jù)集中數(shù)

2012-08-08 11:21:05

數(shù)據(jù)庫與數(shù)據(jù)倉庫的區(qū)別

2011-02-16 18:02:48

3328

OLAP在電信數(shù)據(jù)倉庫中的設(shè)計

通過研究數(shù)據(jù)倉庫在電信業(yè)務(wù)中的應(yīng)用，論述電信領(lǐng)域數(shù)據(jù)倉庫和部分聯(lián)機(jī)分析處理的設(shè)計開發(fā)過程。綜述數(shù)據(jù)倉庫模型、聯(lián)機(jī)分析處理（OLAP）模型、匯總表的設(shè)計以及開發(fā)中所要

2010-12-29 17:31:40

利用數(shù)據(jù)倉庫技術(shù)開發(fā)文化稽查統(tǒng)計分析系統(tǒng)

提出統(tǒng)計分析系統(tǒng)不應(yīng)該歸入普通管理信息系統(tǒng)，而應(yīng)該根據(jù)用戶具體需求，充分分析其本質(zhì)，利用數(shù)據(jù)倉庫技術(shù)進(jìn)行開發(fā)和實現(xiàn)，并闡述了如何利用數(shù)據(jù)倉庫技術(shù)從需求分析到最

2010-09-07 10:09:00

數(shù)據(jù)集市,什么是數(shù)據(jù)集市

數(shù)據(jù)集市,什么是數(shù)據(jù)集市 數(shù)據(jù)集市，或者叫做"小數(shù)據(jù)倉庫"，是用于公司單獨部門或分部的數(shù)據(jù)倉庫，與完善的數(shù)據(jù)倉庫(試圖存儲公

2010-03-19 16:44:40

2098

數(shù)據(jù)建模在數(shù)據(jù)倉庫建設(shè)中的應(yīng)用

數(shù)據(jù)倉庫是國土資源決策支持系統(tǒng)建設(shè)中的核心內(nèi)容,是決策支持系統(tǒng)處理的基礎(chǔ)。建立數(shù)據(jù)倉庫的目的,是把國土資源的內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)進(jìn)行有效的集成,為各級決策領(lǐng)導(dǎo)、各級

2010-02-25 15:10:35

起重機(jī)遠(yuǎn)程監(jiān)控數(shù)據(jù)倉庫系統(tǒng)研究及實現(xiàn)

從性能預(yù)測分析角度出發(fā)，采用OLAP 方法對在網(wǎng)絡(luò)環(huán)境下遠(yuǎn)程監(jiān)控起重機(jī)大量數(shù)據(jù)處理方法進(jìn)行了研究。采用E-R 關(guān)系模型建立了事務(wù)操作型起重機(jī)實時狀態(tài)監(jiān)測數(shù)據(jù)庫，通過對狀

2010-01-27 14:31:26

一種基于實時數(shù)據(jù)倉庫的實時DSS體系結(jié)構(gòu)

為滿足實時決策的需要，設(shè)計了基于實時數(shù)據(jù)倉庫的實時決策支持系統(tǒng)。該系統(tǒng)采用企業(yè)應(yīng)用集成技術(shù)，同時在系統(tǒng)內(nèi)加入實時數(shù)據(jù)緩沖結(jié)構(gòu)和JIM 系統(tǒng)，用以實現(xiàn)實時數(shù)據(jù)的查詢和

2010-01-27 14:20:12

數(shù)據(jù)倉庫技術(shù)在病案數(shù)據(jù)分析中的應(yīng)用研究

隨著電子病案廣泛使用，挖掘海量病案數(shù)據(jù)中潛藏信息進(jìn)行支持決策是提高醫(yī)院管理效率的重要手段。本文探討數(shù)據(jù)倉庫在病案數(shù)據(jù)分析中的應(yīng)用，確定主題為某醫(yī)院常發(fā)疾病治療

2009-12-25 14:25:22

基于XML的數(shù)據(jù)倉庫概念模型設(shè)計

隨著XML 已經(jīng)成為半結(jié)構(gòu)化數(shù)據(jù)交換的標(biāo)準(zhǔn)，以XML 作為數(shù)據(jù)源進(jìn)行數(shù)據(jù)倉庫的設(shè)計已逐漸流行。本文提出了一種基于XML 的數(shù)據(jù)倉庫概念建模設(shè)計方法，以XML Schema定義的XML 文檔作

2009-12-18 17:04:30

電信數(shù)據(jù)倉庫設(shè)計

本文針對佳木斯電信的業(yè)務(wù)需求，設(shè)計了佳木斯電信數(shù)據(jù)倉庫的總體架構(gòu)，并以營業(yè)受理情況主題為例介紹了佳木斯電信數(shù)據(jù)倉庫數(shù)據(jù)模型的設(shè)計過程。

2009-12-18 17:01:29

銀行數(shù)據(jù)倉庫的系統(tǒng)設(shè)計與實現(xiàn)

企業(yè)中的數(shù)據(jù)存在于各個異構(gòu)的傳統(tǒng)數(shù)據(jù)庫系統(tǒng)中，數(shù)據(jù)倉庫是企業(yè)整合數(shù)據(jù)的一種有效途徑。數(shù)據(jù)倉庫使得企業(yè)的信息變得易于獲取并且為企業(yè)決策提供可靠依據(jù)。然而建設(shè)一

2009-09-26 08:47:28

統(tǒng)計行業(yè)數(shù)據(jù)倉庫構(gòu)建及應(yīng)用

數(shù)據(jù)倉庫可以管理和重組統(tǒng)計行業(yè)大量分散數(shù)據(jù)，便于以后分析和決策。介紹數(shù)據(jù)倉庫概念、改進(jìn)的三層體系結(jié)構(gòu)、構(gòu)建過程和實現(xiàn)方法、統(tǒng)計行業(yè)應(yīng)用步驟及前景，對提高統(tǒng)計行

2009-09-16 10:57:36

基于分布式數(shù)據(jù)倉庫技術(shù)的ETL系統(tǒng)的研究與應(yīng)用

ETL系統(tǒng)是構(gòu)建和維護(hù)數(shù)據(jù)倉庫的基本構(gòu)件，由于要處理海量數(shù)據(jù)和訪問各種異構(gòu)數(shù)據(jù)源，如何同時具有高效的數(shù)據(jù)處理能力和通用的數(shù)據(jù)源訪問能力是值得研究的問題。本文針對

2009-09-14 16:26:39

數(shù)據(jù)挖掘與數(shù)據(jù)倉庫技術(shù)及其在保險業(yè)中的應(yīng)用

文章介紹了數(shù)據(jù)挖掘中常用技術(shù)和數(shù)據(jù)倉庫結(jié)構(gòu)，并且探討了粗糙集方法，決策樹方法以及關(guān)聯(lián)規(guī)則方法等數(shù)據(jù)挖掘技術(shù)在保險風(fēng)險規(guī)則挖掘中的應(yīng)用。關(guān)鍵字：數(shù)據(jù)挖掘、數(shù)據(jù)

2009-09-04 08:16:30

OLAM體系結(jié)構(gòu)和算法的研究及應(yīng)用

聯(lián)機(jī)分析挖掘（OLAM）把OLAP（聯(lián)機(jī)分析處理技術(shù)）和DM（數(shù)據(jù)挖掘）統(tǒng)一起來，從而在數(shù)據(jù)庫或數(shù)據(jù)倉庫的不同層次進(jìn)行挖掘。為了提高聯(lián)機(jī)分析挖掘的效率，論文給出了基于OLAP

2009-09-01 14:56:06

基于數(shù)據(jù)倉庫的生產(chǎn)智能控制和管理決策系統(tǒng)

本文主要講述了數(shù)據(jù)倉庫技術(shù)在一個企業(yè)信息化實際項目中的應(yīng)用，提出了從數(shù)據(jù)倉庫的建立、數(shù)據(jù)的抽取到數(shù)據(jù)多維分析并通過數(shù)據(jù)透視表顯示的一個構(gòu)想。主題詞：數(shù)據(jù)倉庫

2009-08-31 11:23:17