分区表学习笔记(一)
分区表学习笔记(一)Oracle提供了分区技术以支持VLDB(Very Large DataBase)。分区表通过对分区列的判断,把分区列不同的记录,放到不同的分区中。分区完全对应用透明。Oracle 的分区表可以包括多个分区,每个分区都是一个独立的段(SEGMENT),可以存放到不同的表空间中。查询时可以通过查询表来访问各个分区中的数据,也可以通过在查询时直接指定分区的方法来进行查询。--------------------------------------------------------------------------公共准则:1、如果选择的分区不能确保各分区内记录量的基本平均,则这种分区方式有可能是不恰当的。比如对于range分区,假设分了10个分区,而其中一个分区中的记录数占总记录数的90%,其它9个分区只占总记录数的10%,则这个分区方式就起不到数据平衡的作用。当然,如果你的目的并不是为了平衡,只是为了区分数据,ok,对于这种情况,我想说的是,你务必要意识到存在这个问题。2、对于分区的表或索引,其所涉及的所有分区,其块大小必须一致。最后,建议对于上面创建的表或建表脚本妥善保存并记忆,后面我们需要频繁用到,后续示例将均主要依赖前文中创建的表进行:)-------------------------------------------------------------------------1、什么时候需要分区表,官网的2个建议如下:When to Partition a Table(1)Tables greater than 2GB should always be considered for partitioning.(2)Tables containing historical data, in which new data is added into the newest partition. A typical example is a historical table where only the current month's data is updatable and the other 11 months are read only.在oracle 10g中最多支持:1024k-1个分区:Tables can be partitioned into up to 1024K-1 separate partitions联机文档上有关分区表和索引的说明:Partitioned Tables and Indexeshttp://download.oracle.com/docs/cd/B19306_01/server.102/b14220/partconc.htm#sthref26042、分区提供以下优点:(1)由于将数据分散到各个分区中,减少了数据损坏的可能性;(2)可以对单独的分区进行备份和恢复;(3)可以将分区映射到不同的物理磁盘上,来分散IO;(4)提高可管理性、可用性和性能。3、分区表提供的视图(1)user_tab_partitions /dba_tab_partitions视图记录表的分区的信息例子:create table pdba (id,time) partition by range(time)(partition p1 values less than (to_date('2005-5-1','yyyy-mm-dd')),partition p2 values less than (to_date('2005-7-1','yyyy-mm-dd')),partition p3 values less than (to_date('2005-9-1','yyyy-mm-dd')),partition p4 values less than (maxvalue)) as select rownum,created from dba_objects;SQL> select table_name,partition_name from user_tab_partitions where table_name='PDBA';TABLE_NAME PARTITION_NAME------------------------------ ------------------------------PDBA P1PDBA P2PDBA P3PDBA P4(2) user_part_tables:记录分区的表的信息;SQL> select table_name,partitioning_type,PARTITION_COUNT,status from user_part_tables where table_name='PDBA';TABLE_NAME PARTITION PARTITION_COUNT STATUS------------------------------ --------- --------------- --------PDBA RANGE 5 VALID4、Oracle 10g提供了以下几种分区类型:(1)范围分区(range);(2)哈希分区(hash);(3)列表分区(list);(4)范围-哈希复合分区(range-hash);(5)范围-列表复合分区(range-list)。(1)Range分区:Range分区是应用范围比较广的表分区方式,它是以列的值的范围来做为分区的划分条件,将记录存放到列值所在的range分区中。如按照时间划分,2010年1月的数据放到a分区,2月的数据放到b分区,在创建的时候,需要指定基于的列,以及分区的范围值。在按时间分区时,如果某些记录暂无法预测范围,可以创建maxvalue分区,所有不在指定范围内的记录都会被存储到maxvalue所在分区中。如:create table pdba (id number, time date) partition by range (time)(partition p1 values less than (to_date('2010-10-1', 'yyyy-mm-dd')),partition p2 values less than (to_date('2010-11-1', 'yyyy-mm-dd')),partition p3 values less than (to_date('2010-12-1', 'yyyy-mm-dd')),partition p4 values less than (maxvalue))(2)Hash分区:对于那些无法有效划分范围的表,可以使用hash分区,这样对于提高性能还是会有一定的帮助。hash 分区会将表中的数据平均分配到你指定的几个分区中,列所在分区是依据分区列的hash值自动分配,因此你并不能控制也不知道哪条记录会被放到哪个分区中,hash分区也可以支持多个依赖列。如:create table test(transaction_id number primary key,item_id number(8) not null)partition by hash(transaction_id)(partition part_01 tablespace tablespace01,partition part_02 tablespace tablespace02,partition part_03 tablespace tablespace03);在这里,我们指定了每个分区的表空间。(3)List分区:List分区也需要指定列的值,其分区值必须明确指定,该分区列只能有一个,不能像range或者hash分区那样同时指定多个列做为分区依赖列,但它的单个分区对应值可以是多个。在分区时必须确定分区列可能存在的值,一旦插入的列值不在分区范上一个:分区表学习笔记(二)--分区管理
下一个:oracle时间大小比较