database/oracle

CLUSTER

아이짱구 2009. 9. 16. 14:44

클러스터란 디스크로부터 데이터를 읽어오는 시간을 줄이기 위해서 조인이나 자주 사용되는 테이블의 데이터를 디스크의 같은 위치에 저장시키는 방법 입니다.

◈ 클러스터된 테이블과 클러스터 되지 않은 테이블의 차이
테이블이 처음 생성될 때 행은 일반적으로 세그먼트의 첫 익스텐트의 첫 블록부터 삽입됩니다. 정규 테이블로 저장될 경우 EMP와 DEPT은 서로 다른 세그먼트에 위치하게 됩니다. 이 말은 테이블이 자신들 고유의 블록을 사용한다는 뜻입니다.
즉, EMP 테이블의 행을 저장하는데 사용된 블록은 DEPT 테이블의 데이터를 저장하지 않는다는 말입니다. 그 반대의 경우도 마찬가지입니다.
테이블 EMP와 DEPT의 클러스터로 저장되면 동일 클러스터 세그먼트를 공유하게 됩니다. 이 세그먼트의 블록은 양 테이블의 행을 모두 저장할 수 있습니다. 테이블이 클러스터로 저장되면 클러스터는 물리적 저장 단위가 되고 테이블은 논리적 엔티티 즉, 클러스터의 일부분 가 됩니다.   

◈ 클러스터의 사용 장점
- 디스크 I/O를 줄여 줍니다. 그룹된 컬럼 데이터 행들이 같은 데이터 Block에 저장되기때문 입니다.
- 클러스터된 테이블 사이에 조인이 발생할 경우 그 처리 시간이 단축 됩니다.
- 클러스터키 열을 공유하여 한번만 저장하므로 저장 영역의 사용을 줄입니다.

◈ 테이블 클러스터링의 특징

⊙ 한 클러스터 키에 포함될 수 있는 컬럼의 최대 수는 16개 입니다.

⊙ 클러스터는 데이터 조회 성능을 향상 시키지만 데이터 저장, 수정, 삭제 또는 한 테이블 전체 Scan의 성능을 감소 시킵니다.

⊙ 클러스터 하기 좋은 테이블
- 주로 조회가 자주 발생하고 수정이 거의 발생하지 않는 테이블
- 컬럼안의 많은 중복 데이터를 가지는 테이블
- 자주 Join되는 테이블

⊙ 클러스터 Key가 되지 좋은 컬럼
- 데이터 값의 범위가 큰 컬럼
- 테이블 간의 조인에 사용되는 컬럼

⊙ 클러스터 key가 되기 나쁜 컬럼
- 특정 데이터 값이 적은 컬럼
- 자주 데이터 수정이 발생하는 컬럼
- LONG, LONG RAW 컬럼은 포함할 수 없습니다.

◈ 예제
SQL>
CREATE CLUSTER CLT_T1T2(ID NUMBER(3);

CREATE INDEX CLT_T1T2_IDX
    ON CLUSTER CLT_T1T2;

CREATE TABLE T1
       (
       ID  NUMBER(3),
       NM  VARCHAR2(10),
       IDT DATE
       ) CLUSTER CLT_T1T2(ID);

CREATE TABLE T2
       (
       ID   NUMBER(3),
       IDNM VARCHAR2(10)
       ) CLUSTER CLT_T1T2(ID);

SQL>
SELECT *
  FROM TAB;

TNAME      TABTYPE   CLUSTERID
------------------------------
CLT_T1T2   CLUSTER
T1         TABLE     1
T2         TABLE     2
------------------------------

SQL> -- 클러스터의 데이터 위치정보.
SELECT rowid
  FROM T1;

ROWID
------------------------------
AAAAAAABBBBBBBCCCCCAAA
------------------------------

SQL>
SELECT rowid
  FROM T2;

ROWID
------------------------------
AAAAAAABBBBBBBCCCCCAAA
------------------------------

출처 | 오라클클럽 : www.oracleclub.com