高性能分布式数据仓库建设方案


分布式数据仓库特色功能

高可扩展性

? 可支持10000个以上的数据节点,PB级别的数据
? 在不影响业务运行的情况下在线扩展
? 计算、批处理性能随节点数线性增长

高可用性

? 多维度冗余机制:控制节点mirror,数据节点实例互为主备

表结构自动升级

? 利用爬虫技术主动获取表结构变更通知、表结构元数据信息 
? 解析表结构元数据变化
? 自动生成表结构升级处理任务

丰富的ETL调度模式

? 串型调度
? 并行调度
? 串并结合调度

高开放及兼容性

? 兼容性:兼容客户已有应用系统数据,及未来其他业务系统数据
? 开放性:能很好的兼容现有的主流ETL、商业智能分析工具如DataStageCognosFineReport