Greenplum数据库
    发布时间: 2016-08-08 16:44    

Greenplum是一个大规模并行处理(MPP, massively parallel processing)数据库,一种基于PostgreSQL的分布式数据库,采用shared-nothing架构,具有大规模并发任务处理能力。

Greenplum数据库

1. 发展历程


Greenplum于2008年12月进入中国市场,经过一年多的开拓,2010年1月1日Pivotal Greenplum正式宣布在中国独立运营。2019年8月14日,VMware以27亿美元完成对Pivotal收购,从此更名为VMware Greenplum。

Greenplum中国公司拥有一支具备丰富行业经验的销售和技术团队,具备金融、电信、政府、互联网等等行业的数据仓库项目行业经验,专注于推动Greenplum在数据仓库分析领域的应用,为客户实现投资回报、价值增长。

 

2. 产品介绍


Greenplum基于OLAP系统数据引擎开发,有世界级的研发团队进行高性能计算和数据库系统的前沿开发工作,宗旨是向客户提供高性能的超级数据引擎,并将强大的并行计算能力融入到大规模数据仓库分析领域中,是数据仓库、数据集市首选的MPP数据库。

Greenplum是一个大规模并行处理(MPP, massively parallel processing)数据库,一种基于PostgreSQL的分布式数据库,采用shared-nothing架构,其每个节点都有自己的操作系统、内存和硬盘,即各节点之间不共享任何资源(shared-nothing),它可通过线性扩展提高系统的存储容量和并行处理能力。 Greenplum对操作系统,硬件兼容非常好,软件可以在公有云、私有云、虚拟机、x86物理机等服务器上运行。


 


3. 应用场景


Greenplum在国内金融业的典型客户包括:中国建设银行、中信银行、浦发银行、光大银行、交通银行、广发银行、北京银行、南京银行、武汉农商、陕西农信、郑州银行、深交所、上交所、大家保险、中保信等。


 

 

4. 产品特征


1. 数据存储 

当今是个数据不断膨胀的时代,采取MPP架构的数据库系统才能对海量数据进行管理。Greenplum支持50PB(1PB=1000TB)级海量数据的存储和处理,Greenplum将来自不同源系统的、不同部门、不同平台的数据集成数据库中集中存放,并且存放详尽历史的数据轨迹,业务用户不用再面对一个又一个信息孤岛,也不再困惑于不同版本数据导致的偏差,同时对于IT人员也降低管理维护工作的复杂度。

2. 高并发

随着商业智能在企业内的快速发展,BI 用户对信息分析平台的访问频率和查询复杂度也快速提升,因此要求相应的数据库系统对高并发查询进行支持。Greenplum利用强大并行处理能力提供并发支持。

Greenplum提供资源管理功能(workload managemnt)来管理数据库资源,利用资源队列管理可实现按用户组的进行资源分配,如Session同时激活数、最大资源值等。通过资源管理功能,可以按用户级别进行资源分配和管理用户SQL查询优先级别,同时也能防止低质量SQL(如没有条件的多表join等)对系统资源的消耗。

3. 线性扩展

Greenplum与其他分布式大数据产品如Yonghong Z-DataMart一样采用了通用的MPP并行处理架构,在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力。Greenplum在扩展节点时操作简单,在很短时间内就能完成数据的重新分布。

Greenplum线性扩展支持为数据分析系统将来的拓展给予了技术上的保障,用户可根据实施需要进行容量和性能的扩展。

4. 高性价比

Greenplum数据库软件系统节点基于业界各种开放式硬件平台,如SUN/HP/DELL等厂商的PC Server等,在普通的x86 Server上就能达到很高的性能,因此性价比很高,相比于其他封闭式数据仓库专用系统,Greenplum每TB的投资是前者的1/5甚至更低。同样,Greenplum产品的维护成本相比同类厂商也低许多。

5. 反应速度

我们面对的是一个瞬息变化的市场,谁能首先感知到市场的需求和变化,就能在竞争中先行一步,获得主动权,在竞争中立于不败之地。

Greenplum通过准实时、实时的数据加载方式,实现数据仓库的实时更新,进而实现动态数据仓库(ADW)。基于动态数据仓库,业务用户能对当前业务数据进行BI实时分析“Just In Time BI”,能够让企业敏锐感知市场的变化,加快决策支持反应速度。

6. 高可用性

Greenplum是高可用的系统,在已有案例中Finra美国金融综合监管局金融合规分析和欺诈分析系统使用了352台机器的集群MPP环境。除了硬件级的Raid技术外,Greenplum还提供数据库层Mirror机制保护,即每个节点数据在另外的节点中同步镜像,单个节点的错误不影响整个系统的使用。

对于主节点,Greenplum提供Master/Stand by机制进行主节点容错,当主节点发生错误时,可以切换到Stand by节点继续服务。

7. 系统易用

Greenplum产品是基于流行的PostgreSQL之上开发,几乎所有的PostgreSQL客户端工具及PostgreSQL应用都能运行在Greenplum平台上,在Internet上有着丰富的PostgreSQL资源供用户参考。


5. 典型案例

华毅软件多年以来一直是Greenplum中国区总代,公司参与实施了国内大多数基于Greenplum构建的传统数仓、实时数仓以及数据集市建设项目,公司拥有Greenplum认证工程师多名,他们拥有丰富的Greenplum数据库规划、调优、开发、运行维护的经验,同时公司拥有大量从Oracle、DB2、Teradata及Hadoop迁移到Greenplum上的成功案例。

华毅软件主要客户包括民生、光大、北京银行、甘肃农信、外汇交易所、中国人保等金融机构,以及中国移动、三一重工、宁德时代、李宁、四川高速等行业客户。