欢迎,游客

大数据分析库—PetaBase

定位于管理大规模结构化数据

PetaBase是基于开源平台基础上开发的、具有软件著作权的国产分布式数据库软件产品。PetaBase被设计为全新的SQL on Hadoop解决方案,在开源SQL引擎之上进行了大量SQL功能增强和性能优化,性能提升数倍甚至上百倍,使其更适合在Hadoop上进行大规模数据分析、检索、查询。

PetaBase定位于管理大规模结构化数据(从TB到PB级),是分布式的分析型数据库系统,适用于批量写操作,大规模随机查询的数据集市、数据仓库等。PetaBase是我公司大数据BI解决方案的组成部分。

PetaBase已于2014年成功申请并获得国家版权局计算机软件著作权登记证书,具有源代码级的安全可控技术,是同类数据库产品的国产化替代方案。

产品优势
性能高效
TB级数据查询秒级响应 可轻松扩展到上千台集群规模 满足TB到PB级数据存储及查询
功能全面
SQL标准兼容,ETL友好, 提供丰富的应用程序接口,支持第三方ETL工具。
快速交付
一键安装,集成Hadoop基础组件 负载均衡、可视化监控管理、 数据迁移工具,快速工程化部署
产品功能

高可用、高容错

双主热备,瞬时切换,可动态添加节点,采用多副本存储,数据不丢失

列式存储

默认采用列式存储,同时支持多种常见的Hadoop文件格式和压缩编码

负载均衡

提供查询负载均衡功能,将查询请求分摊到不同的集群节点上执行,达到负载均衡的目的。支持多种负载均衡策略,如轮询

范式模型

支持三范式模型和星形模型,范式模型与量型模型互相转化

海量数据查询

亿级数据规模下,性能全面超越商业的RDBMS数据库,TB级数据查询秒级响应

SQL标准兼容

兼容SQL-99标准,支持大部分SQL-2003标准,同时与Hive SQL兼容,语法上同其它数据库SQL语法大体一致

ETL支持

PetaBase提供了JDBC/ODBC接口,能支持几乎所有的ETL工具产品

可视化管理

图形化Web控制台提供监控仪表盘界面,对PetaBase数据库、集群CPU、内存、磁盘空间、数据库会话以及节点状态进行实时监控

产品架构


想了解更多?请查看技术白皮书
产品资料