當前,隨著政府數字化轉型的持續推進,政務大數據建設成為當前熱點,政務數據的資產化、服務化和價值化成為必然。然而,政務系統之間獨立共存,信息孤島、數字鴻溝普遍存在,數據治理難度大、數據開發成本高,如何推動政務大數據的全面應用,盤活數據資產,實現跨系統、跨平臺、跨數據結構的協同合作,已成為政務能力提升的關鍵問題。
“海川”數據中臺圍繞管理數據、分析數據和運用數據的需求,構建資源管理、數據匯聚、數據質量、數倉加工、共享開放、用戶畫像等數據中心,充分挖掘數據價值,形成政府服務核心數據能力,推進政府公共數據業務化應用。
資源管理中心對數據標準、元數據、數據資產進行統一管理和維護,實現數據資產的標準可見。支持數據環境管理,定義數據源和主題域;支持元數據管理,建立數據標準、定義數據字典,形成數據血緣分析;支持數據地圖功能,以樹狀目錄和管理駕駛艙的形式直觀展示數據資源的總體概況和流轉情況。
數據匯聚中心實現多源異構數據的匯聚轉換,打破數據孤島,形成一套標準數據。支持SQL語句和可視化方式配置轉換邏輯,實現復雜異構轉換關系;支持多種數據庫間的數據的實時增量和周期批量同步,支持100TB級大規模關系數據的同步增量轉換并具有實踐生產案例;支持匯聚轉換監控,可查看數據全量和增量同步情況以及運行狀態。
數據質量中心圍繞完整性、一致性、準確性等維度監控分析數據質量,實現全鏈路的數據治理。支持數據質量檢測,通過配置質量檢測規則,支持全量數據和抽樣數據比對;通過“數據探測針”方式進行數據實時抽樣比對;支持數據質量追溯和跟蹤,生成質量檢測報告。
數倉加工中心基于OneData規范定義數據倉庫的指標和數據模型,實現數倉加工。提供離線計算、批量計算、算法計算等計算能力,應對不同場景的復雜業務需求??啥x數據加工作業任務,根據指定的設計模型,定期生成數據立方體Cube,支持數據快速統計。
共享開放中心通過服務接口方式對數據進行封裝和開放,是數據中臺能力的出口,是連接前臺應用和數據的橋梁。定義標準數據資源目錄,可配置數據來源及數據開放邏輯模型,支持API接口調用、接口主動推送、數據庫推送、文件下載等多種數據服務模式,支持服務認證、服務授權、服務限流、服務監控等服務網關管理功能,保證數據開放的安全和效率。
用戶畫像中心建立面向對象的全域標簽體系,實現跨業務板塊、跨領域數據的融合,實現數據資源的深度分析、挖掘、應用。支持數據標簽管理,可為各類數據打上豐富的業務標簽,基于標簽定期生成標簽數據,支持群體定義和群體數據分析展示,基于群體用戶畫像支持各類精準服務場景。
提供多源異構數據的匯聚、轉換、加工、治理等一站式數據管理功能,形成數據資產,對數據的產生、轉換、應用進行全流程的監控,建立數據安全管理機制,保證數據和中臺的雙安全。
基于國產GBase8A分布式數據庫,支持TB級至PB級數據的存儲,支持彈性伸縮,最高支持128個節點;支持智能索引、雙向并行、高速數據加載,自動管理內存和語義優化,比一般通用型數據庫在海量數據分析處理方面10-200倍的速度。
支持數據資產的開放共享,提供智能經辦、精準服務、決策支持、智能監管等數據應用服務,支持服務定制化;針對行業特點,定義和生成主題數據和標簽數據,解決各業務系統的各種數據應用需求。