DB.DW



1. 개요

가. 정의

1) 기업내외의 산재한 데이터들을 주제별로 통합

2) 시계열적으로 저장된 통합 Data 관리시스템

나. 구축목적

1) 신속한 의사결정위한 통합된 정보의 요구

2) 경쟁우위 확보위한 정보인프라 구축

3) 데이터산재,불일치,상이한 정보시틈 체계적 관리방안



2. 특징 (주통불시)

가. 주제중심적

나. 통합적

다. 비휘발성

라. 시계열성



3. 구성요소

가. ODS

1) Operate Data Store

나. ETCL

1) Extract

2) Transform

3) Cleansing

4) Load

다. Metadata

라. OLAP

1) OnLine Analysis Processing

마. Data Mining

1) DataMart

2) 마이닝기법



4. 모델링

가. 구성

1) 사실(Fact)

2) 차원(Demension)

3) 속성(Attribute)

4) 속성계층(Hirecal)

나. 기법

1) Star Schema

가) 사실테이블만 정규화

2) Snowflake Schema

가) 사실과차원테이블 모두 정규화



5. 고려사항

가. 데이터통합

나. 데이터품질관리

다. 데이터 마이그레이션

라. 사용자 교육

마. 변화관리



http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 데이터웨어하우스, DW, Datawarehouse


정보관리기술사 신재용

Posted by 승당
l




DB.DataMining



1. 개요

가. 정의

1) 알려지지않은 새롭고 의미있는 정보를 발굴

2) 의사결정에 활용

나. 목적

1) 과거가 아닌 예측모델의 구현

2) 예상치 못한 패턴 지식검출이 목적

3) 상세한 세부데이터,기록데이터 요구=>지식집약적 작업

다. 등장배경

1) Mass 마케팅 -> Target 마케팅

2) What happen(Query) -> What will happen(Mining)

라. 외곽선만들기



2. 절차

가. DW/DM

나. Target  Data

다. Process Data

라. Pattern Data

마. 지식

바. 단계 (SEMMA)

1) Sample

2) Explore

3) Modify

4) Model

5) Access



3. 마이닝기법 (연연분군세)

가. 연관규칙

나. 연속규칙

다. 분류규칙

1) 과거데이터특성으로 결과값예측

2) 방법

가) 의사결정트리

나) 회구분석

다) 판별분석

라. 군집화

마. 세분화

바. 방법론

1) 예측적모델링

2) 탐색적모델링



4. 가치분석

가. 지지도 (Support)

1) 

2) 

3) 지지도가 높을수록 유의미

나. 신뢰도 (Confidence)

1) 

2) 

3) 신뢰도가 높을수록 유의미 (70~80%)

다. 향상도 (Lift)

1) 

2) 의미

가) 양수(>0)

(1) 향상도를 가짐

(2) 넥타이 & 셔츠

나) 0

(1) 독립적인 관계

(2) 넥타이 & 주전자

다) 음수(<0)

(1) 음의 향상도를 가짐

(2) 설사약 & 변비약


http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 데이터마이닝


정보관리기술사 신재용

Posted by 승당
l





DB.트랜잭션



1. 개요

가. 정의

1) 하나의 논리적 작업단위

2) 작업수행, 세부적 연산들의 집합

나. 중요성

1) DB에서 동시성과 회복의 기본단위

2) DB의 일관된 상태를 변경



2. 특성 (원일격영)

가. 원자성

1) 분해 불가능 최소단위

2) All or Nothing

나. 일관성

1) 모순없는 일관된 상태유지

다. 격리성

1) 실행중 다른 트랜잭션 접근불가

라. 영구성

1) 성공결과는 영구적으로 DB저장



3. 처리방법

가. Commit

1) 트랜잭션 완료, DB저장

나. Rollback

1) 트랜잭션 중지, 저장내용 복귀



4. 동시성제어

가. 필요성

1) Lost Update

2) Dirty Read

3) Inconsistency

4) Cascading rollback

나. 제어기법

1) Locking

2) Timestamp

3) Validation



5. 회복기법

가. Log 이용

나. Check point

다. Shadow Page

라. 2PC



6. 상태도

가. Active

1) 초기, 트랜잭션실행

나. Partially Commited

1) 마지막 명령문 실행이후

다. Commited

1) 트랜잭선 정상종료

라. Failed

1) 트랜잭선 진행불가

마. Aborted

1) 트랜잭션 취소, 이전상태 복귀


http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 트랜잭션


정보관리기술사 신재용

Posted by 승당
l