当前位置:操作系统 > Unix/Linux >>

分区表学习笔记(一)

分区表学习笔记(一)
 
Oracle提供了分区技术以支持VLDB(Very Large DataBase)。分区表通过对分区列的判断,把分区列不同的记录,放到不同的分区中。分区完全对应用透明。 
       Oracle 的分区表可以包括多个分区,每个分区都是一个独立的段(SEGMENT),可以存放到不同的表空间中。查询时可以通过查询表来访问各个分区中的数据,也可以通过在查询时直接指定分区的方法来进行查询。
 
--------------------------------------------------------------------------
 
公共准则:
 
1、如果选择的分区不能确保各分区内记录量的基本平均,则这种分区方式有可能是不恰当的。比如对于range分区,假设分了10个分区,而其中一个分区中的记录数占总记录数的90%,其它9个分区只占总记录数的10%,则这个分区方式就起不到数据平衡的作用。当然,如果你的目的并不是为了平衡,只是为了区分数据,ok,对于这种情况,我想说的是,你务必要意识到存在这个问题。
 
2、对于分区的表或索引,其所涉及的所有分区,其块大小必须一致。最后,建议对于上面创建的表或建表脚本妥善保存并记忆,后面我们需要频繁用到,后续示例将均主要依赖前文中创建的表进行:)
 
-------------------------------------------------------------------------
 
1、什么时候需要分区表,官网的2个建议如下:When to Partition a Table
 
(1)Tables greater than 2GB should always be considered for partitioning.
 
(2)Tables  containing  historical  data,  in  which  new  data  is  added  into  the  newest partition. A typical example is a historical table where only the current month's data is updatable and the other 11 months are read only.
 
在oracle 10g中最多支持:1024k-1个分区:
 
  Tables can be partitioned into up to 1024K-1 separate partitions
 
联机文档上有关分区表和索引的说明:
 
  Partitioned Tables and Indexes
 
  http://download.oracle.com/docs/cd/B19306_01/server.102/b14220/partconc.htm#sthref2604
 
 
 
2、分区提供以下优点:  
 
  (1)由于将数据分散到各个分区中,减少了数据损坏的可能性; 
 
  (2)可以对单独的分区进行备份和恢复; 
 
  (3)可以将分区映射到不同的物理磁盘上,来分散IO;  
 
  (4)提高可管理性、可用性和性能。 
 
 
 
3、分区表提供的视图
 
   (1)user_tab_partitions /dba_tab_partitions视图记录表的分区的信息
 
例子:
 
create table pdba (id,time) partition by range(time)
 
(partition p1 values less than (to_date('2005-5-1','yyyy-mm-dd')),
 
partition p2 values less than (to_date('2005-7-1','yyyy-mm-dd')),
 
partition p3 values less than (to_date('2005-9-1','yyyy-mm-dd')),
 
partition p4 values less than (maxvalue)) as select rownum,created from dba_objects;
 
 
 
SQL> select  table_name,partition_name  from  user_tab_partitions  where table_name='PDBA';
 
TABLE_NAME                     PARTITION_NAME
 
------------------------------ ------------------------------
 
PDBA                           P1
 
PDBA                           P2
 
PDBA                           P3
 
PDBA                           P4
 
(2) user_part_tables:记录分区的表的信息;
 
SQL> select table_name,partitioning_type,PARTITION_COUNT,status from user_part_tables where table_name='PDBA';
 
TABLE_NAME                     PARTITION PARTITION_COUNT STATUS
 
------------------------------ --------- --------------- --------
 
PDBA                           RANGE                   5 VALID
 
4、Oracle 10g提供了以下几种分区类型: 
 
  (1)范围分区(range); 
 
  (2)哈希分区(hash); 
 
  (3)列表分区(list); 
 
  (4)范围-哈希复合分区(range-hash);  
 
  (5)范围-列表复合分区(range-list)。
 
(1)Range分区:  
 
       Range分区是应用范围比较广的表分区方式,它是以列的值的范围来做为分区的划分条件,将记录存放到列值所在的range分区中。如按照时间划分,2010年1月的数据放到a分区,2月的数据放到b分区,在创建的时候,需要指定基于的列,以及分区的范围值。在按时间分区时,如果某些记录暂无法预测范围,可以创建maxvalue分区,所有不在指定范围内的记录都会被存储到maxvalue所在分区中。
 
如:
 
create table pdba (id number, time date) partition by range (time)
 
(
 
partition p1 values less than (to_date('2010-10-1', 'yyyy-mm-dd')),
 
partition p2 values less than (to_date('2010-11-1', 'yyyy-mm-dd')),
 
partition p3 values less than (to_date('2010-12-1', 'yyyy-mm-dd')),
 
partition p4 values less than (maxvalue)
 
)
 
(2)Hash分区:  
 
       对于那些无法有效划分范围的表,可以使用hash分区,这样对于提高性能还是会有一定的帮助。hash 分区会将表中的数据平均分配到你指定的几个分区中,列所在分区是依据分区列的hash值自动分配,因此你并不能控制也不知道哪条记录会被放到哪个分区中,hash分区也可以支持多个依赖列。 
 
如:
 
create table test  
 
 
transaction_id number primary key,  
 
item_id number(8) not null
 
 
partition by hash(transaction_id) 
 
 
partition part_01 tablespace tablespace01, 
 
partition part_02 tablespace tablespace02, 
 
partition part_03 tablespace tablespace03 
 
);
 
在这里,我们指定了每个分区的表空间。
 
 
 
(3)List分区:  
 
       List分区也需要指定列的值,其分区值必须明确指定,该分区列只能有一个,不能像range或者hash分区那样同时指定多个列做为分区依赖列,但它的单个分区对应值可以是多个。 
 
       在分区时必须确定分区列可能存在的值,一旦插入的列值不在分区范
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,