摘要 星形模式是基于關系數據庫的數據倉庫中的一個著名概念,由于星形連接模式的設計思想能夠滿足人們從不同觀察角度(維)分析數據的需求,所以在基于關系數據庫的數據倉庫的設計中廣泛地使用了星形模式。本文主要介紹《廣東省高速公路一張網資金結算情況分
摘要 星形模式是基于關系數據庫的數據倉庫中的一個著名概念,由于星形連接模式的設計思想能夠滿足人們從不同觀察角度(維)分析數據的需求,所以在基于關系數據庫的數據倉庫的設計中廣泛地使用了星形模式。本文主要介紹《廣東省高速公路一張網資金結算情況分析系統》中的數據倉庫技術。
關鍵詞 數據倉庫;星形模式;維度
1 數據倉庫的特點
數據倉庫技術是用以更好地支持企業或組織的決策分析處理的,面向主題的,集成的,不可更新的、隨時間不斷變化的數據集合。它通過將數據按照不同的綜合程度(即粒度)來組織,以滿足不同分析的需要。
本文主要介紹一下《廣東省高速公路一張網資金結算情況分析系統》中如何使用數據倉庫技術來實現“異常流水”與其修改量分析與“流水上傳與拆分”分析這兩個主題。
2 星形模式
星形模式是基于關系數據庫的數據倉庫中的一個著名概念,由于星形連接模式的設計思想能夠滿足人們從不同觀察角度(維)分析數據的需求,加上數據倉庫通常用來回答綜合性的問題,所以在基于關系數據庫的數據倉庫的設計中廣泛地使用了星形模式,如電信運營商中普遍進行的話務總體分析。
3 系統中的數據倉庫設計
3.1 廣東聯合電子結算中心操作型環境 DB2 數據庫服務器下的數據組織情況
在廣東聯合電子結算中心, “異常流水”、“流水拆分”、“流水上傳”有關的關系模式
l 粵通卡精確拆分結果明細表
tb_cardaccuratesplitresult (流水號,工班, 出口路段…, 收入路段)
l 現金精確拆分結果明細表
tb_cashaccuratesplitresult (流水號,工班, 出口路段…,收入路段)
l 流水非精確拆分記錄表
tb_inaccuratesplitrecord (流水號,工班, 出口路段…, 收入路段)
l 拆分流水異常記錄表
tb_outlistspliterrorgb(流水號,工班,出口路段, …,錯誤類型代碼)
l 拆分流水異常記錄歷史表
tb_outlistspliterrorgb_his(流水號,工班,出口路段, …,錯誤類型代碼)
l 流水異常記錄表
tb_outlisterrorgb(流水號,工班,出口路段, …,錯誤類型代碼)
l 流水異常記錄歷史表
tb_outlisterrorgb_his(流水號,工班,出口路段, …,錯誤類型代碼)
l 出口流水表
tb_outlistgb (流水號,工班,出口路段, …,上傳時間)
3.2 系統的中數據倉庫設計
考慮到篇幅,各步驟經過簡化如下:
l 概念模型設計
l 邏輯模型設計
l 數據倉庫生成
3.2.1概念模型設計中的界定系統邊界
在廣東電信公話中心,管理者最迫切進行的分析主要有:
l 各高速公路路段公司不同工班的流水上傳、流水拆分。
l 分析各個高速公路路段公司上傳的異常流水(包含異常及拆分異常)、及其修改的情況;
要進行以上的分析,所需數據應包括:
l 分析各個高速公路路段公司在一段周期內的流水上傳、拆分、異常總量、異常修改情況。
l 分析各個高速公路路段公司上傳的異常流水(包含異常及拆分異常)、及上傳的異常的流水(包含異常及拆分異常)流水的修改情況;
l 各個高速公路路段公司及他們的軟件開發商
l 廣東省高速公路所有的路段信息;
3.2.2 邏輯模型設計
因為細節級數據太大,數據倉庫又建立在本人的PC機上 MS SQL SERVER 服務器上,加之迫于分析任務提交時間的壓力,故本數據倉庫中不再涉及細節級數據表的設計、數據挖掘。
關系模式定義:
ok_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…)
no_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…)
upload_split(路段編碼, 路段名稱, 工班, 上傳流水數量, 拆分流水數量…)
kaifa (roadno, kaifa_name)
tb_road(areano,roadno,roadname,…)
3.2.3 數據倉庫數據生成
數據倉庫中數據的生成包括操作型環境數據的挖掘和數據倉庫中數據的生成這兩部分的內容。在這一步里所要做的工作是接口編程,以實現將操作型環境下的數據裝載進入數據倉庫環境。
4 數據倉庫的數據導出與展現
4.1 萬能數據庫查詢分析器
萬能數據庫查詢分析器,中文版本《DB 查詢分析器》、英文版本《DBQuery Analyzer》。它具有強大的功能、友好的操作界面、良好的操作性、跨越各種數據庫平臺乃至于EXCEL和文本文件。
你可以通過它查詢ODBC數據源(包括世面上所有的數據庫、TXT/CSV文件、EXCEL文件)的數據。你可以同時執行多條DML語句乃至存貯過程,結果會以你設定的表格、文本框、文件來返回。從數據庫導出千萬條數據時,效率與DBMS沒有什么區別。
《萬能數據庫查詢分析器》中文版本《DB 查詢分析器》在中關村在線下載量超過10萬次,位居整個數據庫類排行榜中第8位,所以在實際工作中,本人用《DB 查詢分析器》作為客戶端,實現將數據倉庫中的數據展現與導出。
4.2 本系統中的兩個主題的星形模式4.3 數據樣例示意
圖6 數據展現1
圖7 數據展現2
圖8 點擊“DB 查詢分析器”的工具欄按鈕,即可導出數據1
圖9 點擊“DB 查詢分析器”的工具欄按鈕,即可導出數據2
5 結束語
筆者在《廣東省高速公路一張網資金結算情況分析系統》的研究與開發過程中,是數據倉庫技術在實際工作中的又一次運用。
參考文獻:
[1] 馬根峰 · 萬能數據庫查詢分析器中的事務管理在Oracle中的應用· 上海:微型電腦應用2008.4
[2] 新產品&工具點評 特別推薦:“萬能數據庫查詢分析器”發布 · 程序員,2007.2
[3] 馬根峰 · DB QueryAnalyzer中的事務管理在DB2中的應用· 北京:電腦編程技巧與維護2011.22
[4] 馬根峰 · 《DB 查詢分析器》批量執行DML語句并返回更詳細的信息· 北京:電腦編程技巧與維護2011.24
[5] 王珊 · 數據倉庫技術與聯機分析處理 · 北京:科學出版社,1998.6
[6] MichaelCorey(美),MichaelAbbey(美) · SQL SERVER 7 Data Warehousing · 北京:希望電子出版社,2000.1
[7] 袁鵬飛 · SQLServer 7.0數據庫系統管理與應用開發 · 北京:人民郵電出版社,1999.5
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com