当前位置:首页 > GreenPlum使用手册
GreenPlum数据库集群 安装说明及使用手册
开心十二月总结 ****年**月**日
目录
1 2
体系结构介绍 ................................................................................................................... 4 安装 ................................................................................................................................. 10 2.1
安装 .......................................................................................................................... 10
安装准备 .......................................................................................................... 10 安装gp-db ........................................................................................................ 11 配置通讯 .......................................................................................................... 13 建立数据存储池 .............................................................................................. 17 同步系统时间 .................................................................................................. 17 验证安装是否成功 .......................................................................................... 17 初始化 .............................................................................................................. 17 数据库的启停 .................................................................................................. 18
2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.1.6 2.1.7 2.1.8 2.2 2.3 3
Master双机热备 ..................................................................................................... 19 Segment节点互备 .................................................................................................. 20
GP数据库的使用 ........................................................................................................... 22 3.1
pgAdminIII工具 ....................................................................................................... 22
安装和第一次使用pgAdminIII ........................................................................ 22 主窗体 .............................................................................................................. 23 导航菜单 .......................................................................................................... 23 工具栏介绍 ...................................................................................................... 24 数据库与表的创建 .......................................................................................... 25 使用pgAdminIII备份数据库 ........................................................................... 25
3.1.1 3.1.2 3.1.3 3.1.4 3.1.5 3.1.6 3.2 3.3
JDBC配置 ................................................................................................................. 26 GP数据库两个重要概念 ........................................................................................ 27
什么是Schema ................................................................................................. 27
3.3.1
3.3.2 3.4
数据分布存储 .................................................................................................. 28
GP的SQL语法 ........................................................................................................ 28
数据加载 .......................................................................................................... 28 SQL并行查询 ................................................................................................... 32 聚合函数 .......................................................................................................... 32 索引 .................................................................................................................. 32 分区 .................................................................................................................. 34 函数 .................................................................................................................. 35
3.4.1 3.4.2 3.4.3 3.4.4 3.4.5 3.4.6 4
维护数据库 ..................................................................................................................... 39 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10
数据库启动gpstart ............................................................................................... 39 数据库停止gpstop ................................................................................................. 41 查看实例配置和状态 .............................................................................................. 41 查看数据库运行状态gpstate ............................................................................... 42 查看用户会话和提交的查询等信息 ...................................................................... 43 查看数据库、表占用空间 ...................................................................................... 43 查看数据分布情况 .................................................................................................. 44 实例恢复gprecoverseg ......................................................................................... 44 查看锁信息 .............................................................................................................. 44 数据库的备份与恢复 .......................................................................................... 44
5 6
调优、排错 ..................................................................................................................... 44 附件 ................................................................................................................................. 44 6.1
DBA常用命令 ........................................................................................................... 44
7 Q&A ................................................................................................................................... 45 7.1 7.2
不支持触发器 .......................................................................................................... 45 更新操作中的若干问题 .......................................................................................... 45
1 体系结构介绍
Greenplum数据库产品——下一代数据仓库引擎和分析方法
Greenplum公司是企业数据云计算解决方案的创始人,为客户提供灵活的数据商业智能和分析方法。能够以极低的成本代价,提供业界领先的计算性能。客户遍及美国知名企业:Nasdaq、NYSE、Ebay、Fox Interactive Media……等。
Greenplum公司的Greenplum数据库产品是用于建造下一代数据仓库和巨大规模分析系统的软件解决方案。支持SQL和MapReduce并行处理,更适合管理TB级~PB级的海量数据,并以极低的成本代价提供了业界领先的计算性能。使用独有的sharing-nothing MPP架构,服务器的集群工作起来,就像是一个独立的超级计算机!优化了BI和分析方法,自动化分区数据和并行查询,比传统数据库执行速度提高10倍~100倍!
Greenplum数据库的特色: ? 大规模地并行分析处理能力
Greenplum数据库可以跨越100~1000颗CPU,实现统一的并行操作引擎,让处理过程尽可能地靠近数据。Greenplum是业界最快的和最普及的高端数据仓库解决方案!用传统方式需花费数天才能完成的复杂查询,现在使用Greenplum只需要几分钟完成! ? 核心的MPP架构
Greenplum数据库提供数据和查询的自动化并行:数据被自动分区跨越集群中的所有节点;查询以高度协作的方式,在集群的所有节点上执行。 ? 高速PB级数据装载
利用独有的MPP Scatter/Gather Streaming技术,实现高速的数据装载。每增加1个节点,每小时装载吞吐量提高4TB! ? 数据库内部压缩
利用业界领先的压缩技术提高性能和降低存储空间。在有效较少1/3~1/10空间的同时,相应地提高了I/O性能。 ? 多级容错能力
Greenplum数据库利用多级冗余技术,在硬件或软件故障时,保障操作可以继续执行。 ? 在线系统扩展
共分享92篇相关文档