
最新動(dòng)態(tài)
NEWS
數(shù)據(jù)倉庫:數(shù)據(jù)倉庫顧名思義,是一個(gè)很大的數(shù)據(jù)存儲(chǔ)集合,面向主題的,集成的,相對穩(wěn)定的,反映歷史變化的數(shù)據(jù)集合,用于支持管理決策。對多樣的業(yè)務(wù)數(shù)據(jù)進(jìn)行篩選與整合。它為企業(yè)提供一定的BI(商業(yè)智能)能力,指導(dǎo)業(yè)務(wù)流程改進(jìn)、監(jiān)視時(shí)間、成本、質(zhì)量以及控制。數(shù)據(jù)倉庫的輸入方是不同的數(shù)據(jù)源,比如:有的數(shù)據(jù)存在mysql里,有的數(shù)據(jù)存在mongdb里,還有一些第三方的數(shù)據(jù)源,最終的輸出用于企業(yè)的數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)報(bào)表等方向。多數(shù)據(jù)源通過ETL(Extract-數(shù)據(jù)抽?。籘ransform-數(shù)據(jù)轉(zhuǎn)換;Load-數(shù)據(jù)加載)集成。還有數(shù)據(jù)倉庫和數(shù)據(jù)庫的關(guān)系,這里在網(wǎng)上找了個(gè)圖,講的還是比較清楚的。面向業(yè)務(wù)的數(shù)據(jù)庫常稱作OLTP,面向分析的數(shù)據(jù)倉庫亦稱為OLAP數(shù)據(jù)挖掘:數(shù)據(jù)挖掘看穿你的需求,廣義上說,任何從數(shù)據(jù)庫中挖掘信息的過程都叫做數(shù)據(jù)挖掘。從這點(diǎn)看來,數(shù)據(jù)挖掘就是BI。但從技術(shù)術(shù)語上說,數(shù)據(jù)挖掘(Data Mining)特指的是:源數(shù)據(jù)經(jīng)過清洗和轉(zhuǎn)換等成為適合于挖掘的數(shù)據(jù)集。數(shù)據(jù)挖掘在這種具有固定形式的數(shù)據(jù)集上完成知識(shí)的提煉,最后以合適的知識(shí)模式用于進(jìn)一步分析決策工作。從這種狹義的觀點(diǎn)上,我們可以定義:數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識(shí)的過程。數(shù)據(jù)挖掘往往針對特定的數(shù)據(jù)、特定的問題,選擇一種或者多種挖掘算法,找到數(shù)據(jù)下面隱藏的規(guī)律,這些規(guī)律往往被用來預(yù)測、支持決策。BI經(jīng)過幾年的積累,大部分中大型的企事業(yè)單位已經(jīng)建立了比較完善的CRM、ERP、OA等基礎(chǔ)信息化系統(tǒng)。這些系統(tǒng)的統(tǒng)一特點(diǎn)都是:通過業(yè)務(wù)人員或者用戶的操作,最終對數(shù)據(jù)庫進(jìn)行增加、修改、刪除等操作。上述系統(tǒng)可統(tǒng)一稱為OLTP(Online Transaction Process,在線事務(wù)處理),指的就是系統(tǒng)運(yùn)行了一段時(shí)間以后,必然幫助企事業(yè)單位收集大量的歷史數(shù)據(jù)。但是,在數(shù)據(jù)庫中分散、獨(dú)立存在的大量數(shù)據(jù)對于業(yè)務(wù)人員來說,只是一些無法看懂的天書。業(yè)務(wù)人員所需要的是信息,是他們能夠看懂、理解并從中受益的抽象信息。此時(shí),如何把數(shù)據(jù)轉(zhuǎn)化為信息,使得業(yè)務(wù)人員(包括管理者)能夠充分掌握、利用這些信息,并且輔助決策,就是商業(yè)智能(BI)主要解決的問題。如何把數(shù)據(jù)庫中存在的數(shù)據(jù)轉(zhuǎn)變?yōu)闃I(yè)務(wù)人員需要的信息?大部分的答案是報(bào)表系統(tǒng)。簡單說,報(bào)表系統(tǒng)已經(jīng)可以稱作是BI了,它是BI的低端實(shí)現(xiàn)。 現(xiàn)在國外的企業(yè),大部分已經(jīng)進(jìn)入了中端BI,叫做數(shù)據(jù)分析。有一些企業(yè)已經(jīng)開始進(jìn)入高端BI,叫做數(shù)據(jù)挖掘。而我國的企業(yè),目前大部分還停留在報(bào)表階段。目前國內(nèi)現(xiàn)在做BI的廠家有很多,比較知名的BI廠家比如:永洪科技,核心產(chǎn)品Yonghong-Z-Suite幫助企業(yè)構(gòu)建大數(shù)據(jù)應(yīng)用,也有很豐富的行業(yè)積累,政府,電力,能源,金融等等,有興趣可以自己查些資料。系嗎?
數(shù)據(jù)倉庫:
數(shù)據(jù)倉庫顧名思義,是一個(gè)很大的數(shù)據(jù)存儲(chǔ)集合,面向主題的,集成的,相對穩(wěn)定的,反映歷史變化的數(shù)據(jù)集合,用于支持管理決策。對多樣的業(yè)務(wù)數(shù)據(jù)進(jìn)行篩選與整合。它為企業(yè)提供一定的BI(商業(yè)智能)能力,指導(dǎo)業(yè)務(wù)流程改進(jìn)、監(jiān)視時(shí)間、成本、質(zhì)量以及控制。
數(shù)據(jù)倉庫的輸入方是不同的數(shù)據(jù)源,比如:有的數(shù)據(jù)存在mysql里,有的數(shù)據(jù)存在mongdb里,還有一些第三方的數(shù)據(jù)源,最終的輸出用于企業(yè)的數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)報(bào)表等方向。
多數(shù)據(jù)源通過ETL(Extract-數(shù)據(jù)抽取;Transform-數(shù)據(jù)轉(zhuǎn)換;Load-數(shù)據(jù)加載)集成。
還有數(shù)據(jù)倉庫和數(shù)據(jù)庫的關(guān)系,這里在網(wǎng)上找了個(gè)圖,講的還是比較清楚的。
面向業(yè)務(wù)的數(shù)據(jù)庫常稱作OLTP,面向分析的數(shù)據(jù)倉庫亦稱為OLAP
數(shù)據(jù)挖掘:
數(shù)據(jù)挖掘看穿你的需求,廣義上說,任何從數(shù)據(jù)庫中挖掘信息的過程都叫做數(shù)據(jù)挖掘。從這點(diǎn)看來,數(shù)據(jù)挖掘就是BI。但從技術(shù)術(shù)語上說,數(shù)據(jù)挖掘(Data Mining)特指的是:源數(shù)據(jù)經(jīng)過清洗和轉(zhuǎn)換等成為適合于挖掘的數(shù)據(jù)集。數(shù)據(jù)挖掘在這種具有固定形式的數(shù)據(jù)集上完成知識(shí)的提煉,最后以合適的知識(shí)模式用于進(jìn)一步分析決策工作。從這種狹義的觀點(diǎn)上,我們可以定義:數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識(shí)的過程。數(shù)據(jù)挖掘往往針對特定的數(shù)據(jù)、特定的問題,選擇一種或者多種挖掘算法,找到數(shù)據(jù)下面隱藏的規(guī)律,這些規(guī)律往往被用來預(yù)測、支持決策。
BI
經(jīng)過幾年的積累,大部分中大型的企事業(yè)單位已經(jīng)建立了比較完善的CRM、ERP、OA等基礎(chǔ)信息化系統(tǒng)。這些系統(tǒng)的統(tǒng)一特點(diǎn)都是:通過業(yè)務(wù)人員或者用戶的操作,最終對數(shù)據(jù)庫進(jìn)行增加、修改、刪除等操作。上述系統(tǒng)可統(tǒng)一稱為OLTP(Online Transaction Process,在線事務(wù)處理),指的就是系統(tǒng)運(yùn)行了一段時(shí)間以后,必然幫助企事業(yè)單位收集大量的歷史數(shù)據(jù)。但是,在數(shù)據(jù)庫中分散、獨(dú)立存在的大量數(shù)據(jù)對于業(yè)務(wù)人員來說,只是一些無法看懂的天書。業(yè)務(wù)人員所需要的是信息,是他們能夠看懂、理解并從中受益的抽象信息。此時(shí),如何把數(shù)據(jù)轉(zhuǎn)化為信息,使得業(yè)務(wù)人員(包括管理者)能夠充分掌握、利用這些信息,并且輔助決策,就是商業(yè)智能(BI)主要解決的問題。
如何把數(shù)據(jù)庫中存在的數(shù)據(jù)轉(zhuǎn)變?yōu)闃I(yè)務(wù)人員需要的信息?大部分的答案是報(bào)表系統(tǒng)。簡單說,報(bào)表系統(tǒng)已經(jīng)可以稱作是BI了,它是BI的低端實(shí)現(xiàn)。 現(xiàn)在國外的企業(yè),大部分已經(jīng)進(jìn)入了中端BI,叫做數(shù)據(jù)分析。有一些企業(yè)已經(jīng)開始進(jìn)入高端BI,叫做數(shù)據(jù)挖掘。而我國的企業(yè),目前大部分還停留在報(bào)表階段。目前國內(nèi)現(xiàn)在做BI的廠家有很多,比較知名的BI廠家比如:永洪科技,核心產(chǎn)品Yonghong-Z-Suite幫助企業(yè)構(gòu)建大數(shù)據(jù)應(yīng)用,也有很豐富的行業(yè)積累,政府,電力,能源,金融等等,有興趣可以自己查些資料。
責(zé)編:梅亞川