隨著市場(chǎng)競(jìng)爭(zhēng)的日趨激烈,商業(yè)活動(dòng)也變得越來(lái)越復(fù)雜,企業(yè)對(duì)信息的依賴(lài)性也變得越來(lái)越高,對(duì)信息的處理和利用能力的強(qiáng)弱決定了企業(yè)的興衰成敗,因此企業(yè)對(duì)決策的準(zhǔn)確性和及時(shí)性的要求也越來(lái)越高,充分利用、挖掘企業(yè)現(xiàn)有的海量數(shù)據(jù),能夠幫助企業(yè)做出更好的商業(yè)決策,使得在提供多維數(shù)據(jù)集中數(shù)據(jù)的關(guān)系系統(tǒng)方面的投資產(chǎn)生更高的回報(bào),從而提高企業(yè)的競(jìng)爭(zhēng)力。
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、與時(shí)間相關(guān)、穩(wěn)定的數(shù)據(jù)集合,用于支持管理決策。數(shù)據(jù)倉(cāng)庫(kù)將來(lái)自于一個(gè)或多個(gè)數(shù)據(jù)源的數(shù)據(jù)根據(jù)不同的主題進(jìn)行存儲(chǔ),并對(duì)原始數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換和加載等一系列篩選和清理工作。數(shù)據(jù)倉(cāng)庫(kù)是BI的核心,它的性能高低直接決定了BI的表現(xiàn)。
數(shù)據(jù)倉(cāng)庫(kù)具有以下特征:1)面向主題性:要求數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的不是以應(yīng)用劃分的數(shù)據(jù)而是以業(yè)務(wù)內(nèi)容劃分的數(shù)據(jù),建立可獨(dú)立維護(hù)的良構(gòu)的主題數(shù)據(jù)庫(kù);2)數(shù)據(jù)集成性:要求數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)采用統(tǒng)一的編碼方式,對(duì)原有的分散的數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行抽取、加工、匯總、消除數(shù)據(jù)的不一致性后進(jìn)入數(shù)據(jù)倉(cāng)庫(kù);3)非易失性:在數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之后并不進(jìn)行一般意義上的數(shù)據(jù)更新操作,被長(zhǎng)期保留,以便為決策者提供決策分析數(shù)據(jù),所涉及到的操作主要是查詢(xún);4)反映歷史變化:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常反映的是歷史信息,只增不刪,使數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)總是擁有時(shí)間維度,使決策者通過(guò)這些信息,對(duì)企業(yè)的發(fā)展歷程和未來(lái)的發(fā)展趨勢(shì)做出定量分析和預(yù)測(cè)。
數(shù)據(jù)倉(cāng)庫(kù)的關(guān)鍵技術(shù)可分為數(shù)據(jù)抽取(將OLTP系統(tǒng)中數(shù)據(jù)按照數(shù)據(jù)倉(cāng)庫(kù)的格式組織數(shù)據(jù))、數(shù)據(jù)清洗(去除數(shù)據(jù)的不一致性,并去除與分析無(wú)關(guān)或不利于分析的數(shù)據(jù))、數(shù)據(jù)轉(zhuǎn)換(將來(lái)源不同的分散數(shù)據(jù)集成并轉(zhuǎn)換以供分析使用)、數(shù)據(jù)裝載和維護(hù)(周期性的加載新數(shù)據(jù),刷新當(dāng)前數(shù)據(jù),并重新計(jì)算以供決策使用)等。
圖1 數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)過(guò)程
2 多維數(shù)據(jù)集
多維數(shù)據(jù)集是OLAP中的主要對(duì)象,是一項(xiàng)可對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行快速訪(fǎng)問(wèn)的技術(shù),多維數(shù)據(jù)集是一個(gè)數(shù)據(jù)集合,通常從數(shù)據(jù)倉(cāng)庫(kù)的子集構(gòu)造,并組織和匯總成一個(gè)由一組維度和度量值定義的多維結(jié)構(gòu)。度量值是用戶(hù)將要分析的數(shù)值數(shù)據(jù),而維度則是度量值將要被深化的類(lèi)別,維度是可以分層的。多維數(shù)據(jù)集是由關(guān)系數(shù)據(jù)庫(kù)中的一組特殊表創(chuàng)建的,這些表是事實(shí)數(shù)據(jù)表和維度表。
1)事實(shí)表,每個(gè)數(shù)據(jù)倉(cāng)庫(kù)都包含一個(gè)或多個(gè)事實(shí)表,事實(shí)表通常包含大量的行,主要特點(diǎn)是包含數(shù)字?jǐn)?shù)據(jù)(不包含描述性的信息)。這些數(shù)字信息可以匯總,以提供企業(yè)作為歷史的數(shù)據(jù),每個(gè)事實(shí)數(shù)據(jù)表包含一個(gè)由多個(gè)部分組成的索引,該索引包含作為外鍵的相關(guān)性維度表的主鍵;
2)維度表包含事實(shí)數(shù)據(jù)表中事實(shí)記錄的特性,有些特性提供描述性信息,有些特性指定如何匯總事實(shí)數(shù)據(jù)表數(shù)據(jù),以便為分析者提供有用的信息,維度表包含幫助匯總數(shù)據(jù)的特性的層次結(jié)構(gòu)。
3 構(gòu)建多維數(shù)據(jù)集
3.1 構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)
以商品銷(xiāo)售管理數(shù)據(jù)庫(kù)為例構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),在商品銷(xiāo)售管理數(shù)據(jù)庫(kù)中包含很多表,通過(guò)ETL完成數(shù)據(jù)抽取、清洗和轉(zhuǎn)換以構(gòu)建商品銷(xiāo)售管理數(shù)據(jù)倉(cāng)庫(kù),如表1。
表1 商品銷(xiāo)售管理數(shù)據(jù)倉(cāng)庫(kù)
在此系統(tǒng)中,如果對(duì)數(shù)據(jù)倉(cāng)庫(kù)中所存放的歷史數(shù)據(jù)進(jìn)行分析和集成,就可以分析出各個(gè)國(guó)家每個(gè)季度的銷(xiāo)售情況,甚至可以進(jìn)一步深化到每個(gè)城市每個(gè)月的銷(xiāo)售情況,根據(jù)所獲得的結(jié)果,做出合理的決策。通過(guò)對(duì)商品銷(xiāo)售管理系統(tǒng)的需求分析,確定以產(chǎn)品銷(xiāo)售分析為主題,以產(chǎn)品銷(xiāo)售的地理位置和時(shí)間等為數(shù)據(jù)倉(cāng)庫(kù)的索引基準(zhǔn)點(diǎn),以上索引基準(zhǔn)點(diǎn)都可以作為商品銷(xiāo)售管理的數(shù)據(jù)倉(cāng)庫(kù)維度,而產(chǎn)品的銷(xiāo)售情況為事實(shí)表。
3.2 確定維和度量值
在實(shí)際決策過(guò)程中,決策者往往希望能從多個(gè)角度觀察多個(gè)指標(biāo)的值。并且找出這些指標(biāo)之間的關(guān)系,這些觀察數(shù)據(jù)的角度叫做維。根據(jù)此系統(tǒng)的需求,關(guān)于銷(xiāo)售管理數(shù)據(jù)將從員工、時(shí)間、地理位置,供貨商,銷(xiāo)售額等角度展開(kāi),通過(guò)對(duì)商品名稱(chēng)銷(xiāo)售的國(guó)家、時(shí)間段和銷(xiāo)售額跟蹤采集的數(shù)據(jù)可以導(dǎo)出各種商品在不同時(shí)間段、不同銷(xiāo)售地點(diǎn)的銷(xiāo)售額等度量值,根據(jù)這些度量值得到事實(shí)表。本系統(tǒng)的事實(shí)表是商品銷(xiāo)售情況表,其中OrderDate屬于時(shí)間維,ProductID屬于產(chǎn)品維,EmployeeID屬于員工維,ShipperID屬于供貨商維等。
3.3 為維度表選擇屬性
在完成事實(shí)表之后,就可以為維度表選擇屬性了,利用維度設(shè)計(jì)器可以很容易的從維度屬性創(chuàng)建層次結(jié)構(gòu)。在此為地理位置維添加屬性,第一級(jí)別是國(guó)家,然后依次是省/州、城市、郵政編號(hào),然后將其銷(xiāo)售額匯總,從而得到?jīng)Q策者需要的信息,對(duì)于特定銷(xiāo)售情況好的商品的城市,可以增加該商品供貨,以滿(mǎn)足銷(xiāo)售需求,而對(duì)于銷(xiāo)售情況相對(duì)較差的城市,決策者可以考慮減少供貨,并采取積極有效的措施,如進(jìn)行促銷(xiāo)活動(dòng)來(lái)刺激消費(fèi),從而增加銷(xiāo)售量,提升利潤(rùn)。
4 結(jié)束語(yǔ)
多維數(shù)據(jù)集可以針對(duì)不同的維度進(jìn)行多角度的分析,還可以對(duì)數(shù)據(jù)進(jìn)行鉆取、切片等,功能非常強(qiáng)大。對(duì)于EXCEL用戶(hù)來(lái)說(shuō),可以使用透視表通過(guò)拖拽各個(gè)維度,從全方面多角度進(jìn)行分析,多維數(shù)據(jù)模型為OLAM決策支持和分析系統(tǒng)的設(shè)計(jì)提供依據(jù),對(duì)于決策分析非常實(shí)用。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.vmgcyvh.cn/
本文標(biāo)題:基于多維數(shù)據(jù)集的BI技術(shù)研究
本文網(wǎng)址:http://www.vmgcyvh.cn/html/consultation/1081947002.html