「華人戴明學院」是戴明哲學的學習共同體 ,致力於淵博型智識系統的研究、推廣和運用。 The purpose of this blog is to advance the ideas and ideals of W. Edwards Deming.

2008年7月6日 星期日

wws談 數據品質

這兒談的"數據品質"其實不深入
前2年 WWS 做Dell 公司顧問
接觸許多中國企業
對於這方面有專文

IDC:中國企業數據集成難點在於數據品質


發佈時間:2008.07.07 09:09 來源:CNET 作者:王丹

IDC在一項有關“中國數據集成與數據品質市場”調查的白皮書指出:“大部分中國企業數據集成項目難以達到預期的原因在於數據品質問題。”

  這項由Informatica公司贊助的調查研究結果表明,在接受調查的100家大中型企業中,超過70%的接受調查的中國企業已經建設或正在建設數據集成項目,其中具有前瞻性的企業通過建設企業數據集成平臺實施數據集成,並重點關注數據品質熱點問題。

  關注數據品質

  研究發現:大部分中國企業數據集成項目難以達到預期是由數據品質問題導致。

   對此,IDC中國高級分析師劉飛表示,IT系統的大量建設造成數據的重復、不一致、格式混亂等問題。這些低品質的數據,即便在完成數據集成之後,得出的 也可能是品質不高的資訊。IDC說:“中國企業複雜的的數據環境導致了多種多樣的數據問題出現:72%的接受調查的中國企業存在重復數據,60%的企業存 在不完整數據。另外,跨系統利用數據、系統間數據傳遞不及時、以及業務指標理解不一致造成了企業典型的數據問題。”

  就如何衡量數據品質好壞的問題來說,劉飛指出:“如果是靜態數據,則要求完整、準確、一致,格式規範;如果是動態數據,則要求能被及時調用,快速更新。”

   數據集成這個概念對很多中國客戶來說,其實都還不是很熟悉,儘管他們已經或多或少在實際應用這項技術。Informatica大中國區董事總經理吳韶益 說:“要感謝全球化,客戶在數據集成領域的知識進步非常。數據集成已經在全球形成熱門話題,企業有很多IT預算都是在解決這個問題。現在,很多先進的大型 企業都開始採用數據集成技術,概念也在被越來越多的客戶所接受。”劉飛也說:“作為解決企業數據碎片、數據孤島問題的解決方案,數據集成已經獲得了中國企 業的充分認同。”

  IDC指出:中國特殊的軟體建設背景形成了複雜的的數據環境;43%的接受調查的中國企業有10個以上的業務支撐軟體 系統,81% 的接受調查的中國企業在使用兩2種以上的數據庫產品,42%的接受調查的中國企業在以非結構化方式存儲重要數據。而中國企業實施數據集成主要受以下三方面 需求的驅動:來自相關政策和法規的要求、實現差異化競爭的需要、以及企業並購帶來的需求。

  吳韶益一雀巢公司為例,表明瞭數據集成的重要 性,在雀巢公司,當數據不集中的時候,它的風險反而是小的,而進行數據集中的時候,風險反而被擴大了,它就像癌細胞從不重要器官移到重要器官的時候,風險 被擴大了。此外,有很多大型管理軟體的客戶也碰到了一個問題,不同的應用系統在不同的分支結構所得到的結果就不一樣,因為製造業客戶的成本計算非常講究, 每一個時間點它的成本在變化。而摩托羅拉因為採用了數據集中,至少省了200-300百萬美元,這還只是製造業的一個案例而已。

   Informatica中國區資深市場經理朱敏也表示:Informatica進入中國有兩年半的時間,為什麼現在無論是第三方的媒體還有客戶對數據集成 的認知會有明顯的升高?這裡首先有本身公司所起到的重要作用,或者說整個行業裏的重要客戶它們走在最前沿,他們能夠帶動起整個中國經濟或者其他行業在這方 面的重視性。

  “比如說,消費者辦理二代身份證,可能家中幾個人戶口本上的生日和身份證的資訊都不一致。一個人的履歷經過二三十年的記 錄,可能很多地方都有不一致的現象,只有到資訊化階段了,拿出來一掃描就發現有了問題。——沒想到,這個東西反而成了一個產業,並且每年增長21%。歸根 結底是數據化和全球化造成了這樣的趨勢。”IDC中國區總裁郭昕接受記者採訪時這樣表示。

  附: IDC建議

  -數據集成是解決中國企業迫切需求的方案,它能夠全面了解企業內所有的數據,幫助中國企業解決數據分散、異構數據庫的遮罩等問題,並對多樣存儲方式的數據進行快速收集和整合。

  -選擇數據集成平臺工具,IDC認為首要的衡量標準是擴展性高。同時需要考慮其他相關因素如:可廣泛訪問所有類型或來源的數據、可簡化並加速開發、部署以及維護的一個統一的體系結構、企業級的安全性、可靠性和可用性等。

  -企業需要提高數據品質,但由於系統和應用程式經常接收到新數據,數據的總量也在不斷提高,確保數據品質並不是一次就能完成的。因此,所有企業都應該使用一種反復進行的階段性過程來管理數據品質。

  -建議中國企業基於面向服務的體系結構,使用集成能力中心(ICC)方法,依託企業數據集成平臺,實現企業數據集成並解決數據品質問題。企業數據集成平臺可以依靠不同項目分階段建設和完善,數據品質持續改善則需要遵循數據品質管理流程完成。(責任編輯:崔平)

沒有留言:

網誌存檔