這裏有(yǒu)
強大的數據治理(lǐ)
華傲智能(néng)數據中(zhōng)台
1.合作(zuò)背景
深圳市華傲數據技(jì )術有(yǒu)限公(gōng)司(以下簡稱“華傲”)此次聯合華為(wèi)打造基于鲲鵬IaaS底座面向數字政府業務(wù)的完整解決方案。其中(zhōng)數據共享交換平台功能(néng)模塊包括資源編目管理(lǐ)、交換任務(wù)管理(lǐ)、服務(wù)目錄管理(lǐ)和平台配置管理(lǐ),可(kě)以實現政務(wù)信息資源的編目、訂閱以及在各部門之間的共享交換;數據治理(lǐ)平台利用(yòng)數據标準、質(zhì)量、監管保護、元數據等工(gōng)具(jù),提升數據資産(chǎn)管控和服務(wù)的能(néng)力,建設數據質(zhì)量可(kě)靠、數據管理(lǐ)規範、數據服務(wù)準确的高效數字政府;清洗融合平台通過GLDM模型實現對城市數據的歸集彙聚,支持政府數據倉庫建設和專題應用(yòng)。
1.1解決方案介紹
華傲大數據服務(wù)解決方案中(zhōng)的數據共享交換平台、數據融合平台、數據治理(lǐ)平台業務(wù)系統部署在華為(wèi)鲲鵬雲上。可(kě)現政務(wù)信息資源的編目、訂閱以及在各部門之間的共享交換,從而提升數據資産(chǎn)管控和服務(wù)的能(néng)力,從而助力建設數據質(zhì)量可(kě)靠、數據管理(lǐ)規範、數據服務(wù)準确的高效數字政府。
如圖所示:
1.2 實踐準備
經過華為(wèi)多(duō)年的研發投入,目前市場上主流的操作(zuò)系統,計算框架,數據庫都已兼容鲲鵬計算架構。華傲數據基于CentOS 7.6的操作(zuò)系統,采用(yòng)java作(zuò)為(wèi)開發語言,計算框架使用(yòng)Spark,數倉使用(yòng)Hive等,其使用(yòng)的組件皆為(wèi)主流軟件,經過鲲鵬專家評估技(jì )術棧符合鲲鵬适配要求。
類别 |
名(míng)稱 |
版本 |
操作(zuò)系統 |
CentOS for ARM64 |
7.6 aarch64 |
數據倉庫 |
Hive |
3.1.0 |
分(fēn)布式計算框架 |
Spark2x |
2.3.2 |
數據庫 |
GaussDB 200 |
6.5.1 |
編碼語言 |
Java |
2.0 |
應用(yòng)開發工(gōng)具(jù)及庫 |
openjdk |
1.8 |
在華傲數據移植适配到鲲鵬架構過程中(zhōng),鲲鵬産(chǎn)業源頭創新(xīn)中(zhōng)心提供高性價比的鲲鵬雲上資源,并在移植過程中(zhōng)為(wèi)夥伴提供全方位的即時響應咨詢服務(wù),提供優質(zhì)的雲上解決方案,快速為(wèi)夥伴搭建業務(wù)環境,助力夥伴成功适配并遷移上鲲鵬。
1.3 測試驗證
1.測試環境資源皆由華為(wèi)鲲鵬雲提供,清單如下:
業務(wù)名(míng)稱 |
相關說明 |
數量 |
配置參數 |
華傲大數據服務(wù)解決方案 |
數據共享交換平台 |
2 |
系統版本:CentOS 7.6 aarch64 規格:16核 | 16GB 硬盤:500G 帶寬:5M |
2 |
系統版本:CentOS 7.6 aarch64 規格:16核 | 32GB 硬盤:500G 帶寬:5M |
||
數據融合平台 |
3 |
系統版本:CentOS 7.6 aarch64 規格:4核 | 16GB 硬盤:500G 帶寬:5M |
|
數據治理(lǐ)平台 |
2 |
系統版本:CentOS 7.6 aarch64 規格:8核 | 16GB 硬盤:500G 帶寬:5M |
2.測試環境邏輯組網圖
2.合作(zuò)價值
華傲數據根據多(duō)年的行業數據治理(lǐ)工(gōng)作(zuò)實踐,在華為(wèi)鲲鵬雲上提供更契合客戶需求的功能(néng)模塊,如标準版本管理(lǐ)以及數據質(zhì)量規則制定,都是根據原有(yǒu)實踐中(zhōng)客戶痛點,通過解決客戶的痛點,讓鲲鵬雲上數據治理(lǐ)方案更加切實可(kě)行。
華傲數據清洗融合系統基于 GLDM 模型設計,結合華為(wèi)鲲鵬雲大數據底層架構和數據倉庫技(jì )術,自動化集成數據加工(gōng)處理(lǐ)流程,縮短融合建庫實施周期,大幅提升效率,通過抽象和具(jù)體(tǐ)結合的手段,形成多(duō)庫關聯、統一管理(lǐ)的思路,構建了人口庫、法人庫、宏觀經濟庫、房屋庫、事件庫等。
華傲數據平台産(chǎn)品基于華為(wèi)鲲鵬雲大數據計算架構,充分(fēn)利用(yòng)鲲鵬多(duō)核整形算力的優勢,以及高帶寬的雲基礎資源。相同成本下,鲲鵬相比X86架構利用(yòng)多(duō)核優勢,整體(tǐ)發揮性能(néng)提升25%。
華傲數據數據平台産(chǎn)品基于鲲鵬雲進行深度優化,相比傳統的計算存儲合一方案,通過華為(wèi)鲲鵬雲提供的OBS存算分(fēn)離方案,計算和存儲可(kě)獨立彈性伸縮使得整體(tǐ)性價比大幅度提升。OBS通過替換ECS3副本本地存儲存儲利用(yòng)率提升50%,OBS分(fēn)級存儲對超過6個月的數據成本下降80%。大幅度降低建設成本投入,提高整體(tǐ)解決方案性價比。
華傲數據深度融合華為(wèi)鲲鵬雲打造針對政務(wù)數據管理(lǐ)的高安(ān)全解決方案。企業細粒度管理(lǐ),按照項目維度進行集群操作(zuò)權限管理(lǐ);大數據平台統一支持kerberos認證,支持單點登錄;支持數據表、列級别的加密存儲,業務(wù)無感知,确保敏感數據安(ān)全性;支持數據傳輸通道加密;支持審計,所有(yǒu)用(yòng)戶行為(wèi)可(kě)溯源。
華傲數據深度融合華為(wèi)鲲鵬雲打造針對政務(wù)數據管理(lǐ)方案在滿足客戶構建多(duō)庫及多(duō)庫關聯等基礎功能(néng)的同時,還可(kě)以給予客戶在相同成本下更高的運算性能(néng)。在數據存儲方面相比傳統Hadoop提供更經濟的存儲模式,且可(kě)以完全滿足政企類用(yòng)戶對數據訪問管理(lǐ)、數據權限管理(lǐ)、數據安(ān)全、關鍵數據加密管理(lǐ)的管理(lǐ)需求,從而形成高性價比的低管理(lǐ)成本的數據解決方案。