DB.OLAP



1. 개요

가. 정의

1) 다차원정보에 직접접근

2) 대화식으로 정보분석, 의사결정에 활용

나. 등장배경

1) 쿼리와 레포팅에 의한 복잡한 데이터분석 한계

2) DW에서의 효과적인 데이터분석및 리포팅



2. 구성

가. 



3. 핵심기능

가. Drilling

1) 차원에 있어서 단계를 위/아래로 조정하면서 분석

2) Drill Up

가) 상위합계로 분석

3) Drill Down

가) 상세단계로 분석

나. Pivoting

1) 데이터 참조를 위한 축을 변경하여 분석

2) 제품-지역판매량=>대리점-지역판매량

다. Slice

1) 다양한 시각에서 수치분석

2) 데이터큐브 특정값을 축으로 잘라낸 값

라. Dice

1) 큰 데이터 큐브의 일부분 큐브



4. 유형

가. MOLAP

1) 다차원DB에 기반한 OLAP

2) 고속, 다양한 기능이 가능하나 대용량에 부적합

나. ROLAP

1) 관계형DB에 기반한 OLAP

2) 사용자를 대신하여 SQL생성및 연산수행

3) 대용량에 적합하나, 속도가 느림

다. HOLAP

1) MDB와 RDB를 함계 사용

2) 요약된 데이터나 관계식에 의해 서로 계산된 데이터는 => MDB

3) 상세 데이터는 => RDB



5. 특징

가. 다차원성

1) 사용자들이 여러차원에서 정보분석

나. 직접접근

1) 사용자가 정보에 직접접근후 분석

다. 대화식분석

1) 시스템과의 상호작용

2) 원하는 정보까지 반복적분석

라. 의사결정지원


http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > OLAP


정보관리기술사 신재용

Posted by 승당
l



DB.MetaData



1. 개요

가. 정의

1) 데이터에 대한 구체적인 데이터

2) 자원을 기술하는 요소들의 구조화된 집합

나. 필요성

1) 다양한 데이터에 대한 명확한 이해

2) 정보검색의 용이성

3) 효율적인 사용/재사용

4) 데이터관리의 효율성

5) 데이터 공유 촉진



2. 구성

가. 정보자원의 내용

나. 다른 자원과의 관계

다. 자원의 지적속성

라. 자원식별 데이터 요소



3. 기본원칙

가. 간결성

나. 사용용이성

다. 일관성

라. 확장성

마. 상호운용성



4. 분류

가. 내용기반

1) 개체 내용기반

2) 사진, 얼굴특징

나. 내용기술

1) 사용자 인지 개체특징

2) 인상, 화나있음

다. 내용독립

1) 개체와 관련

2) 사진작가이름



5. 표준종류

가. 상이한 메타데이터통합

1) MARC21

2) MODS

나. 메타데이터 상이성 인정

1) Crosswolk

2) RDF

3) METS

다. 상호운영성

1) ISO11179 (MDR)



6. MDR

가. 개념

1) Meta Data Registry

2) 메타데이터의 생성,등록,관리 지원

3) 시스템간 조직간 정보공유 촉진

나. 체계

1) Part1

가) 전체 프레임워크

2) Part2

가) 분류체계 개념모델

3) Part3

가) MDR 개념모델

4) Part4

가) 데이터정의 형식,기술지침

5) Part5

가) 명명과 식별규칙, 지침

6) Part6

가) MDR등록 프로세스



http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 메타데이터, metadata


정보관리기술사 신재용

Posted by 승당
l




DB.DW



1. 개요

가. 정의

1) 기업내외의 산재한 데이터들을 주제별로 통합

2) 시계열적으로 저장된 통합 Data 관리시스템

나. 구축목적

1) 신속한 의사결정위한 통합된 정보의 요구

2) 경쟁우위 확보위한 정보인프라 구축

3) 데이터산재,불일치,상이한 정보시틈 체계적 관리방안



2. 특징 (주통불시)

가. 주제중심적

나. 통합적

다. 비휘발성

라. 시계열성



3. 구성요소

가. ODS

1) Operate Data Store

나. ETCL

1) Extract

2) Transform

3) Cleansing

4) Load

다. Metadata

라. OLAP

1) OnLine Analysis Processing

마. Data Mining

1) DataMart

2) 마이닝기법



4. 모델링

가. 구성

1) 사실(Fact)

2) 차원(Demension)

3) 속성(Attribute)

4) 속성계층(Hirecal)

나. 기법

1) Star Schema

가) 사실테이블만 정규화

2) Snowflake Schema

가) 사실과차원테이블 모두 정규화



5. 고려사항

가. 데이터통합

나. 데이터품질관리

다. 데이터 마이그레이션

라. 사용자 교육

마. 변화관리



http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 데이터웨어하우스, DW, Datawarehouse


정보관리기술사 신재용

Posted by 승당
l




DB.DataMining



1. 개요

가. 정의

1) 알려지지않은 새롭고 의미있는 정보를 발굴

2) 의사결정에 활용

나. 목적

1) 과거가 아닌 예측모델의 구현

2) 예상치 못한 패턴 지식검출이 목적

3) 상세한 세부데이터,기록데이터 요구=>지식집약적 작업

다. 등장배경

1) Mass 마케팅 -> Target 마케팅

2) What happen(Query) -> What will happen(Mining)

라. 외곽선만들기



2. 절차

가. DW/DM

나. Target  Data

다. Process Data

라. Pattern Data

마. 지식

바. 단계 (SEMMA)

1) Sample

2) Explore

3) Modify

4) Model

5) Access



3. 마이닝기법 (연연분군세)

가. 연관규칙

나. 연속규칙

다. 분류규칙

1) 과거데이터특성으로 결과값예측

2) 방법

가) 의사결정트리

나) 회구분석

다) 판별분석

라. 군집화

마. 세분화

바. 방법론

1) 예측적모델링

2) 탐색적모델링



4. 가치분석

가. 지지도 (Support)

1) 

2) 

3) 지지도가 높을수록 유의미

나. 신뢰도 (Confidence)

1) 

2) 

3) 신뢰도가 높을수록 유의미 (70~80%)

다. 향상도 (Lift)

1) 

2) 의미

가) 양수(>0)

(1) 향상도를 가짐

(2) 넥타이 & 셔츠

나) 0

(1) 독립적인 관계

(2) 넥타이 & 주전자

다) 음수(<0)

(1) 음의 향상도를 가짐

(2) 설사약 & 변비약


http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 데이터마이닝


정보관리기술사 신재용

Posted by 승당
l





DB.트랜잭션



1. 개요

가. 정의

1) 하나의 논리적 작업단위

2) 작업수행, 세부적 연산들의 집합

나. 중요성

1) DB에서 동시성과 회복의 기본단위

2) DB의 일관된 상태를 변경



2. 특성 (원일격영)

가. 원자성

1) 분해 불가능 최소단위

2) All or Nothing

나. 일관성

1) 모순없는 일관된 상태유지

다. 격리성

1) 실행중 다른 트랜잭션 접근불가

라. 영구성

1) 성공결과는 영구적으로 DB저장



3. 처리방법

가. Commit

1) 트랜잭션 완료, DB저장

나. Rollback

1) 트랜잭션 중지, 저장내용 복귀



4. 동시성제어

가. 필요성

1) Lost Update

2) Dirty Read

3) Inconsistency

4) Cascading rollback

나. 제어기법

1) Locking

2) Timestamp

3) Validation



5. 회복기법

가. Log 이용

나. Check point

다. Shadow Page

라. 2PC



6. 상태도

가. Active

1) 초기, 트랜잭션실행

나. Partially Commited

1) 마지막 명령문 실행이후

다. Commited

1) 트랜잭선 정상종료

라. Failed

1) 트랜잭선 진행불가

마. Aborted

1) 트랜잭션 취소, 이전상태 복귀


http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 트랜잭션


정보관리기술사 신재용

Posted by 승당
l



DB. 분산DB



1. 개요

가. 정의

1) NW를 이용 여러개의 지역 DB를 논리적으로 연관시킨 DB

나. 목적

1) 데이터 처리의 지역화

2) 데이터 운영및 관리의 지역화

3) 처리부하의 분산및 병렬처리

4) 가용성 향상및 신뢰성 증가



2. 특성 (투명성)

가. 위치투명성

1) 접근할 Data 위치정보 알 필요없음

나. 병행투명성

1) 분산DB의 동시트랜잭션 이상없음

다. 복제투명성

1) 접근 Data 복사/복제 여부 알 필요없음

라. 분할투명성

1) Data 분할 알 필요없음

마. 장애투명성

1) 특정 노드 장애발생시 무결성 보장



3. 구성

가. 스키마

1) 전역스키마

가) 분할스키마

(1) 할당스키마

(가) 지역스키마

(나) Local DB와 물리적 이미지맵핑

(2) Flagment 할당지역사이드

나) 전역과할당사이 관계정의

2) DB내 모든데이터정의

나. 구성도



4. 유형

가. 동질분산DB

1) 모든 지역에 동일 DB사용

2) 전역스키마 이용

3) 분할스키마,할당스키마 적용

4) 전역->지역 하향식

나. 이질분산DB

1) 지역간 이기종 DB사용

가) 분산 DBMS가 이들 DB관리

2) 지역 사용자들이 존재

3) 지역DB는 전역스키마에 포함될 내용 자치적으로 결정

4) 지역->전역 상향식



5. 할당기법

가. 중앙집중식할당

1) 모든데이터를 한노드에 집중

2) 노드 부하 집중

나. 분산할당

1) 지역DB에 분할된 테이블을 위치

2) 지역참조성

3) 신뢰성 저하

다. 중복할당

1) 여러노드에 동일한 데이터 저장

2) 신뢰성 향상

3) 효율성 감소

라. 선택결정

1) 질의처리를 위한 통신비용

2) 자료 갱신을 위한 통신비용

3) 데이터처리비용/저장비용

4) 데이터 가용성



6. 고려사항

가. 동시성제어

1) 2PC (2 Phase Commit)

2) 분산DB 일관성 유지

나. 네트워크 속도

1) 광대역 NW구축

2) 분산DB정보 신속제공

다. 보안문제

1) 분산DB 전체통제가능

2) 통합보안시스템 구축

라. 백업/복구

1) 장애에 대비한 광전송 백업시스템

2) 장애시 신속한 복구가능시스템



7. 설계기법

가. 데이터분할

1) 논리적단위로 분할

2) 분할조건

가) 완전성

나) 재구성

다) 별개성

3) 분할방법

가) 수평

나) 수직

다) 혼합

나. 데이터복제

1) 데이터를 여러개의 복제로 중복

2) 결과

가) 가용성증대

나) 질의처리속도증대

다) 갱신오버헤드

다. 데이터할당

1) 데이터의 단편을 지역에 할당


http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 분산DB


정보관리기술사 신재용

Posted by 승당
l



DB.데이터모델링



1. 개요

가. 정의

1) 현실세계의 개체와 관계를 도출

2) 데이터베이스 구조를 설계하는 과정

나. 중요성

1) 데이터중심의 업무분석

2) 아키텍트, 디자이너, 개발자, 사용자간의 의사소통수단

3) 정확한 모델링을 기준으로 시스템 구현가능



2. 과정

가. 요구사항분석및정의

1) 데이터관리항목파악

2) 업무프로세스정의

3) 현업담당자생각인지, 경우의수도출

4) 서류중심분석 마무리후 진행

나. 개념적모델링

1) ER모델

2) 요구사항기준 정보구조표현

3) 엔티티속성정의, 관계표현

4) 중복및 불일치점 제거

다. 논리적모델링

1) 조직전체 관점 DB구조

2) DB내의 개체와 개체들간의 관계,제약조건 명세화

3) DBMS특성에 맞는 데이터구조 설계

라. 물리적모델링

1) DBMS,운영체제 특성

2) 레코드 속성별, 데이터 크기, 타입정의, 제약조건정의

3) 인덱스정의, 역정규화, 무결성 확보

마. 물리적DB구조



3. 절차

가. 엔티티도출

1) 명사위주 실체도출

2) 정보관리단위

나. 엔티티간 관계설정

1) 상호관계파악

다. 속성결정

1) 엔티티에 속할 속성결정

라. 유일키/외래키결정

1) 키결정

마. 정규화

1) 중복성제거

2) 무결성유지

4. 개념모델->논리모델 변환

가. 개체집합

1) 릴레이션

나. 관계집합

다. 다중값속성

1) 신규릴레이션

라. 키속성

1) 기본키

2) 보조키




http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 데이터 모델링


정보관리기술사 신재용

Posted by 승당
l



DB. 데이터독립성



1. 개요

가. 정의

1) 하위 단계의 데이터 구조의 변화가 상위 단계에 영향을 미치지 않는 속성

2) 하위 단계 구현내용을 추상화하여 상위단계에서는 모르도록 하는 속성

나. 유형

1) 논리적 독립성

가) 개념단계의 스키마 변경이

(1) 응용 인터페이스

나) 외부단계의 스키마에 변경없음

2) 물리적 독립성

가) 내부단계의 스키마 변경이

(1) 저장 인터페이스

나) 외부,개념단계의 스키마에 변경없음



2. 구조

가. 외부스키마

1) External Schema

2) View 단계

3) 사용자, 개발자가 접근하는 DB

나. 개념스키마

1) Conceptual Schema

2) 개념단계, 조직전체의 DB

3) DB저장 Data, 그들간의 관계

다. 내부스키마

1) Internal Schema

2) 내부단계, DB가 물리적 저장형식

3) Data가 실제 저장되는 방법 필요



3. 구현

가. 외부/개념 사상

1) 논리적독립성

2) 응용 인터페이스

3) 특정 외부스키마와 개념스키마의 대응관계 정의

나. 개념/내부 사상

1) 물리적독립성

2) 저장 인터페이스

3) 개념 스키마와 내부스키마의 대응관계 정의



http://digilogmap.tistory.com


정보관리기술사 준비를 위한 마인드맵

데이터베이스 > 데이터 독립성


정보관리기술사 신재용


Posted by 승당
l