數據倉庫實施需注意的四大問題

數據倉庫實施過程中需要注意的問題

在實施數據倉庫的過程中,還面臨著很多影響數據倉庫項目成敗的關鍵因素,而這些因素實際上并不完全是技術層面的。這也是為什么數據倉庫項目失敗比例很高的主要原因。只有在項目中很好的解決這些問題,才能保證數據倉庫項目的最終成功。下面分別介紹這些需要關注的問題:

1.采用何種實施方法

企業(yè)級數據倉庫的實現通常有兩種途徑:一種是從建造某個部門特定的數據集市開始,逐步擴充數據倉庫所包含的主題和范圍,最后形成一個能夠完全反應企業(yè)全貌的企業(yè)級數據倉庫;另外一種則是從一開始就從企業(yè)的整體來考慮數據倉庫的主題和實施。前一種方法是各個擊破,投資少、周期短且易于見到成果,但由于該設計開始時是以特定的部門級主題為框架的,向其他的主題和部門擴充往往非常困難。而后一種方法恰恰相反:投資大、周期長,但是易于擴展。

以哪種方法進行實施,主要取決于各個行業(yè)和客戶的實際情況。如電信和銀行業(yè),采用第二種方法比較可行,這是因為這兩個行業(yè)業(yè)務發(fā)展變化快,為了能夠適應將來的變化,整個數據倉庫架構必須是可擴展的和易于維護的。如果只是基于部門級的需求去設計,將來肯定無法適應變化。如果重新設計,勢必造成前期投入的浪費。對其他一些行業(yè),如制造業(yè)和零售業(yè),本著“急用先行”的原則,可以先從某一局部入手,慢慢擴展為數據倉庫。

從技術上講,以部門需求作為主要考慮因素建立的系統(tǒng),它的數據量不會太大,會影響對將來數據膨脹風險的正確估計,當數據集市擴展到企業(yè)范圍的時候,由于原有技術無法支撐新的數據規(guī)模,會造成數據裝載和數據分析速度的降低,甚至達到不可用的地步。另外,企業(yè)級的數據倉庫會涉及更多的額業(yè)務系統(tǒng),只有充分研究各業(yè)務系統(tǒng),才能了解如何對不同格式、不同標準、不同接口的數據進行集成。如果沒有這方面的準備,當擴展到企業(yè)層面時,會面臨很多技術問題,難以解決,而不得不對原有系統(tǒng)進行修改或重建。

當然,對于第二種方法,也不是說把攤子鋪的越大越好。合理的做法是“統(tǒng)籌規(guī)劃,分步實施”.根據業(yè)務需求,把業(yè)務的主要方面都涵蓋進去,確定彼此之間的聯(lián)系;對于次要的需求,可以預留一些接口,以備將來細化。否則,如果整個調研周期拖得太長,等進入實施階段,業(yè)務又發(fā)生變化,不得不重新修改設計,同樣會造成浪費。所以,先搭建好一個易于擴展且穩(wěn)定的架構,在此基礎上逐步實施,是一個兼顧長遠發(fā)展與合理投入的最佳方式。

此外,分步實施還可以減少風險:前一階段的經驗教訓可以為下一階段提供有益的借鑒,從而使得數據倉庫的建設不斷完善,不斷發(fā)展。

2.從業(yè)務需求出發(fā),結合先進的實現技術

和其他的應用系統(tǒng)相比,數據倉庫對于需求分析和系統(tǒng)設計等前期工作要求更高,其重要性也更加突出??梢哉f,分析和設計階段決定了數據倉庫最終的失敗。因為需求不明確、設計不合理造成的根本性缺陷是以后實施階段所無法彌補的。因此在分析和設計階段,對相關的業(yè)務部門和技術部門要進行詳細的調研,在用戶和開發(fā)人員之間的迭代和反饋是必須和重要的,它決定了數據倉庫最終的成功與否。

由于數據倉庫是面向業(yè)務分析的,所以最主要的需求應該從業(yè)務部門獲取和收集,因為數據倉庫最終是要服務于業(yè)務部門的。需求抓的不準,導致將來將無法解決業(yè)務部門的問題,這個數據倉庫項目就是失敗的,技術再先進也沒有用。這是衡量數據倉庫成敗與否的唯一尺度。

實施的過程中,最好能夠把行業(yè)專家的經驗,與企業(yè)現有的需求進行整合,以期得到一個更加全面的需求范圍,有利于適應將來業(yè)務的變化和擴展。

從技術的角度來講,必須建立一個可伸縮、可擴展、高性能的數據倉庫平臺,才能為將來不斷的完善、不斷發(fā)展打下一個良好的基礎;同時,由于數據倉庫項目要涉及多個業(yè)務系統(tǒng),數據量非常龐大,所以本身的投入也是很大的,在保證系統(tǒng)高效穩(wěn)定的前提下,盡量降低成本是非常重要的。

3.如何進行主題規(guī)劃

正如前面所講,建立數據倉庫需要長遠的規(guī)劃,我們建議企業(yè)“自底向上”地建立數據倉庫,并不意味著不需要在設計階段的長遠規(guī)劃。采用逐步積累的方式建立數據倉庫,其最大的問題是已有的主題是否有助于形成企業(yè)級的主題,數據加載模塊時候能夠重用等。數據倉庫的長遠規(guī)劃,并不僅僅是技術部門的事情,應當把數據倉庫的構建作為企業(yè)發(fā)展戰(zhàn)略的一個重要組成部分。

數據倉庫設計的第一步是主題的確定,從現在的情況看,主題的范圍太大實現不了,太小沒有意義,應該選擇相對獨立而且技術上可行的一些業(yè)務。例如客戶分析、產品分析、收入分析和市場分析等。因為這些分析與企業(yè)當前的業(yè)務運行聯(lián)系最緊密,通過它們,可以了解:

·哪個企業(yè)擁有哪些不同類型的客戶?

·哪些是給我最大收益的客戶?如何提升他們的價值?

·如何掌握新的競爭形勢下客戶的需求與行為?

·哪些業(yè)務最受歡迎,利潤最高?

·業(yè)務的分布如何?

·快速成長的新的收入來源有哪些?

·應收賬款、欠費情況如何?

·與其他同行競爭對手的結算金額占整個收入的比例?

·我的客戶是否打算選擇其他競爭對手?

·運營成本和收益?

·哪些市場活動是有成效的,收益多少?

在完成第一階段的實施后,可以開始第二階段的實施。第二階段主要是從市場營銷、資源管理、網絡管理、客戶服務等部分入手;第三階段可繼續(xù)擴展到財務、績效等更高層次的、全局性的財務、運營情況分析。這時候,所有的重要信息都已連成一體,CEO可以了解有關成本、利潤、市場營銷還有客戶發(fā)展趨勢等多方面的企業(yè)宏觀層面的決策信息,它們?yōu)槎ㄖ茟?zhàn)略決策提供了充分的依據。決策的制定再也不是單憑經驗和感覺了。從而大大的提高了決策的質量,規(guī)避了風險。減少了決策失誤造成的巨大損失。這也正是數據倉庫高投資回報率的重要體現。

當然,在進行主體規(guī)劃的時候,必須重點強調的是:技術框架和系統(tǒng)設計必須從整個企業(yè)的角度來考慮,即使剛開始實施的時候是面向某個部門的。以電信企業(yè)為例,在進行“客戶”主題設計的時候,就必須考慮到同一用戶還有可能是長途電話、移動電話的用戶。因此在設計時如果同時考慮固定電話用戶,就不僅要解決不同系統(tǒng)的互聯(lián)問題,在不同系統(tǒng)中用戶數據的集成也將是一個巨大的挑戰(zhàn)。

4.領導層的參與和支持

數據倉庫是面向業(yè)務主題的分析型應用。它既需要業(yè)務部門的全力配合,又需要先進可靠的技術手段及良好的項目管理過程來實現。它涉及眾多的業(yè)務部門、系統(tǒng)開發(fā)部門、系統(tǒng)運維支撐部門等。在設計和實施階段需要不同部門的溝通和協(xié)作,是一個負責的系統(tǒng)工程。只有領導層從戰(zhàn)略的高度上認識到它的重要性,在項目實施過程中給與大力支持和配合,協(xié)調各部門資源,保證他們可以及時到位,全職投入才能取得項目的成功。所以數據倉庫項目又通常被稱為“一把手”工程。從這一點上看,建立一個企業(yè)級的數據倉庫,主要的障礙不在于技術,而是不同部門之間組織、協(xié)調的問題。而高層領導的大力推動和支持,無疑是解決這一問題的最有效的途徑。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2013-10-21
數據倉庫實施需注意的四大問題
數據倉庫實施過程中需要注意的問題在實施數據倉庫的過程中,還面臨著很多影響數據倉庫項目成敗的關鍵因素,而這些因素實際上并不完全是技術

長按掃碼 閱讀全文