정보관리 기술사 공부
주요 토픽 정리 541~570 [DB, IT경영]
장술사
2023. 7. 27. 09:15
반응형
토픽 | 키워드 | 두음신공 | 주요 내용 |
연결함정(Connection Trap) |
관계성 모호, 부채꼴/균열 함정
|
(정의) 데이터 모델링 시 개체 간의 관계성이 모호하거나 미존재하여 향후 업무처리에 영향을 미치게 되는 ER모델의 문제점, 정규화 과정에서 무손실 분해의 원칙이 지켜지지 않아 원래 있던 관계성을 잃어버리는 현상
(유형) . 부채꼴 함정 : 관계성 모호, 한 개체 집합이 둘 이상의 1 : n 관계를 갖는 경우, 관계 중 한쪽을 n : 1로 변환하여 해결 . 균열 함정 : 관계성 미존재, 개체 집합들이 부분 관계성 집합으로 연결된 경우, 균열 발생한 엔티티 간 관계를 추가하여 해결 |
|
Data Profiling |
데이터 품질 향상
|
(정의) 데이터에 기반한 정합성을 체크하여 데이터를 구조화하고 보정(데이터 클린징)하는 분석 기법
(절차) 데이터 선정→데이터 탐색(완전성/유효성)→구조 탐색(무결성)→관계 탐색(상관성)→결과 리포트(오류는 사용자 및 클린징 모듈에 전달) |
|
MMDB(Main Memory DB) |
주기억장치 상주
|
(정의) DB 전체를 주기억장치에 상주시켜 관리 및 운영하는 DB
(등장배경) 실시간 데이터 처리 요구 증가, 기존 DBMS 성능 한계, 메모리 가격 하락, 64bit 운영체제 (특징) 해싱 혹은 T-Tree 인덱싱 이용하여 주소 파악후 주소영역 접근, 로그는 디스크에 기록, 디스크 대비 10~50배 빠름 (로깅 규칙) . WAL(Write Ahead Logging) : DB 반영전에 로그 먼저 기록 . Commit Rule : Commit 완료되면 failure 관계 없이 DB에 영구 반영되어야 함 . LAW(Logging After Write) : 변경된 데이터의 사후 이미지(After Image)는 DB 반영 후 로그에 기록 (활용 현황) 차세대 빌링(이통사 사용자 인증/빌링), 증권사(실시간 주식 시세 분석), 유선통신(대용량 트랜잭션 처리) * Hybrid MMDB : 성능을 요하는 일부 데이터는 메모리에 상주, 대용량은 디스크 사용 |
|
NoSQL(Not only SQL) |
수평적 확장, 대용량 데이터 처리, BASE 특성
|
(정의) 관계형 DB 한계를 벗어나, 비정형 초고용량 데이터 처리를 위해 데이터의 읽기보다 쓰기에 중점을 둔, 수평적 확장이 가능하며 데이터 복제 및 분산 저장이 가능한 DBMS
(특징) 확장성, 가용성, 대용량 데이터, Schema-less, 저렴한 클러스터 구성, 병목 현상 제거, 필요한 만큼의 무결성, BASE 특성 추구 (데이터 모델) . KVS(Key-Value Storage) : 키와 값의 쌍으로 관리, Amazon SimpleDB, Azure Table Storage, DynamoDB . Document : JSON, XML 형태의 구조적 문서 저장, 조인 미지원, CouchDB, MongoDB . Graph : 그래프 형식으로 데이터 저장 및 표현, Bigdata, DEX, NeoJ *BASE : Basically Available(언제든 접근 가능), Soft state(특정 시점 일관성 보장 안함), Eventually consistent(최종적으로는 일관성 유지) |
|
SQL | DDL,DML,DCL |
(정의) RDBMS에서 사용자 질의에 대해 DB를 제어, 관리할 수 있도록 해주는 표준 언어
(주요 기능) 데이터 정의(DDL, CREATE, ALTER, DROP), 데이터 조작(DML, SELECT, INSERT, DELETE, UPDATE), 데이터 제어(DCL, GRANT, REVOKE) |
|
CAP 이론 |
일관성/가용성/단절내성, 두가지 선택
|
(정의) 대용량 분산 DB는 데이터 일관성, 가용성, 단절내성을 모두 만족시키는 것이 불가능하므로 두 가지만 전략적으로 선택해야 한다는 이론
(CAP) . Consistency(일관성) : 분산 노드간 항상 같은 데이터 유지 . Availability(가용성) : 일부 노드 장애 시에도 다른 노드는 정상 동작 . Partition Tolerance(부분 결함 허용) : 노드 간 네트워크 장애에도 시스템은 정상 동작 |
|
샤딩(Sharding) |
데이터 분할, 개별 파티션, 샤드, 수평/수직
|
(정의) RDB에서 대용량 데이터 처리를 위해 데이터를 분할하여 저장/조회 하는 기술, 샤드라고 부르는 각각의 개별 파티션으로 분할됨
(장점) 성능 개선, 신뢰성 개선, 위치 추상화 (DB 분할 방법) . Vertical Partitioning : 수직 파티셔닝, 테이블 별로 서버 분할 / Horizontal Partitioning : 수평 파티셔닝 . Range based Partitioning : 하나의 feature나 table이 점점 거대해지는 경우 서버를 분리하는 방식 . Key or Hash Based Partitioning : 엔티티의 해시값을 이용해서 서버를 정하는 방식 |
|
카산드라(Cassandra) |
컬럼형 NoSQL DB, 컬럼 패밀리, Consistency level
|
(정의) Row key를 인덱스로 가지는 key-value형 스토어이며, 컬럼을 기본으로 데이터를 다루는 컬럼형 NoSQL 데이터베이스
(특징 및 장단점) . 읽기 및 쓰기에 대한 각각의 Consistency Level을 지정하여 성능과 신뢰도 수준을 조정하도록 하고 있음 . 대량으로 쓰기가 발생하는 서비스에 적합 . 데이터는 일단 메모리에 쓰여지며 일정 크기가 되면 디스크로 옮김 . 복잡한 조건의 검색 불가, 데이터는 대량이지만 검색 조건은 단순한 서비스에 적합(페이스북, 트위터. . ) |
|
Tiny DB |
센서DB, Tiny OS
|
(정의) Tiny OS에서 구동되는 센서 네트워크(USN)로부터 정보를 얻어내기 위한 센서 데이터베이스 질의 시스템
|
|
DB 튜닝 | 지속적 튜닝 |
(성능개선 주요 항목 / 사례)
. 설계 관점 : 데이터 모델링, 인덱스 설계, 용량 산정 / 반정규화, 효율적 인덱스 전략(분포도 15% 이하) . DBMS 관점 : CPU, 메모리 I/O 관한 관점 . SQL 관점 : join, 인덱싱, SQL 실행 계획 / 옵티마이저 선택.변경, 힌트 사용, 인텍스 활용, 조인방식.순서, static SQL 지향 . H/W 관점 : CPU, 메모리, 네트워크, 디스크 (절차) 분석(자료수집/목표설정)→이행(방안 수립, 적용)→평가→2차 튜닝→3차 튜닝(목표까지 지속 반복적 튜닝 중요) |
|
DB 리펙토링(Refactoring) |
DB smell, 반드시 DB 회귀 테스트
|
(정의) DB 의미(정보) 변화 없이 디자인을 개선하는 작업, DB Smell 근거 수행, 데이터 및 어플리케이션 최적화, 반드시 DB 회귀 테스트 수행
(DB 리펙토링 유형) 구조, 데이터 품질, 참조 무결성, 아키텍처, 기능 리팩토링 (DB Smell) . Multi-purpose column/table, Tables with many column/rows . 중복 data, smart columns(하나 컬럼이 다기능 목적 수행, 주민번호), Fear of change . DB smell은 대부분 DB와 관계된 요소(다른 DB, 다른 어플리케이션, 프레임워크, 파일)와의 결합에 의해 발생 |
|
OR Mapping(Object Relational) |
Class 모델→RDB 모델
|
(정의) RDB가 상용되고 있는 상황에서 OODB로 전환되지 못하여, 객체지향 프로그래밍 설계 시 클래스 모델을 RDBMS 모델로 전환하기 위한 Mapping 기법
(절차) Class ↔ Table, Attribute ↔ Column, Class Relationship ↔ Relational DB Relationship (클래스 관계 유형) Association(일반적 협력 관계), Aggregation(전체 - 부분, 마름모), Generalization(일반화 - 특수화, 화살표) |
|
데이터베이스 백업 |
전체/차등/증분 백업, Hot/Cold 백업, Achive Log
|
(백업 유형)
. 전체 백업, 차등 백업(변경 사항 누적 백업), 증분 백업(변경된 것만 백업) . Achive Log : 주기적 또는 일정한 양의 데이터 간격 마다 . Hot backup : Online 백업, DB 서비스 중에도 백업 가능 / Cold backup : Offline 백업, DB 서비스 shutdown 되야 가능 (백업 기술) . VTL(Virtual Tape Library) : 고속, 가상화 통한 백업 단순화 . CDP(Continuous Data Protection) : 지속/주기적, 임의시점복구, 실시간 복구 . De-Duplication : 중복데이터 최소화, 중복 패던 제거하고 원본 데이터의 목록을 별도 보관 |
|
공간 DB(Spatial) |
래스터/벡터 모델
|
(정의) 비공간 데이터와 공간 데이터의 집합
(구성요소) 공간 질의 처리기, 공간 연산자, 공간 색인, 공간 파일 시스템 (표현 방법) . 래스터(Raster) 모델 : 직사각형 격자 화소, 비트맵, 구현 단순, 많은 저장 공간과 처리 시간, 확대 축소 시 이미지 손상, 사진 합성, 특수효과에 적합 . 벡터(Vector) 모델 : 점,선,다각형으로 구성, 크기와 방향의 수학적 데이터만 저장, 구현 복잡, 작은 저장 공간과 처리 시간, 래스터 모델보다 많이 사용, 확대 축소 시 무 변화, 3D 표현에 적합 |
|
분산 DB | 투명성, 2PC | 위장복병분 |
(정의) 네트워크를 통해 물리적으로 분산되어 존재하지만 하나의 논리적인 통합구조로 관리되는 데이터베이스
(목적) 지역화, 부하 분산, 병렬 데이터 처리, 가용성, 신뢰성 향상 (특징 : 투명성, Transparency) . 위치 투명성 : 물리적 위치 투명성(Distributed Data Dictionary Directory 필요) . 장애 투명성 : 장애 시 데이터 무결성 보존(2PC 활용) / 복제 투명성 : 물리적 복제 여부 투명성(DR 복제) . 병행 투명성 : 동시 수행 트랜잭션 결과의 일관성 유지(Locking, TS ordering) . 분할 투명성 : 한 릴레이션의 분할 단편 저장 여부 투명성(성능 향상, Fragmentation 설계 필요) (설계 방식) Top-Down, Bottom-Up, Hybrid (구성 방법) 복제(Replication), 수평분할, 수직분할, 혼합(Hybird) 방식 (장점) 지역자치성, 대용량 및 점진적 증가 용이, 신뢰성, 가용성, 효율성, 융통성 (단점) 복잡도, 비용, 통신망 속도 의존, 완전한 무결성 보장 어려움, 처리 오버헤드 증가, 보안 통제 어려움 (구축 시 고려사항) 동시성 제어, 네트워크 속도, 보안기술, 백업 및 복구 기술, 클러스터링 기술 |
Streaming DBMS |
실시간 데이터 처리, CQL, CEP, DDS, DSMS
|
(정의) 고정된 형태가 아닌 실시간으로 변하는 데이터를 처리하는 시스템
(주요 기술) . CQL (Continuous Query) : 일정 기간 동안 지속적으로 사용될 수 있는 질의 . CEP (Complex Event Processing) : 다양한 이벤트 중 복잡한 패턴 등을 분석하여 의미 있는 이벤트를 구분 . DDS(Distribute Data Service) : 분산환경에서의 실시간 데이터 전송 표준 . DSMS(Data Stream Management System) |
|
BABOK(Business Analysis Body of Knowledge) | 분석기법 |
(정의) IIBA에서 비즈니스 분석 업무에 대해 정리한 표준지식체계
(분석기법) . RACI Matrix : R&R을 정의 시 사용 - 태스크별로 역할을 Responsible, Accountable, Consulted, Informed로 구분 . MoSCow Analysis : 요구사항의 우선순위를 메길 때, Must Have (무조건 해야), Should Have (우선순위 높음), Could Have (우선순위 낮음), Would Not Have (안하기로) 등으로 분류 . 인터뷰, 브레인스토밍, 설문조사, SWOT 등. . . |
|
PI(Process Innovation)
|
(정의) 전사 차원에서 불필요 요소를 제거하고 업무 프로세스를 재구축(고객지향)하는 경영개선 활동
(추진 3요소) 프로세스, 정보기술, 조직 |
||
BPR(Biz Process Re - engineering)
|
(정의) 비즈니스 시스템을 근복적으로 재설계하는 경영기법
|
||
BPM(Biz Process Mgmt)
|
(정의) 비즈니스 프로세스의 자동화(BPMS), 통합화, 최적화를 통해 기업의 프로세스를 관리하는 활동
|
||
BPI(업무 성과 지표 : Biz Performance Indicator)
|
|||
EA(Enterprise Architecture)/ITA(Information Technology Architecture) |
ITA, 프레임워크, 개념, 필요성, 구성
|
(정의) 기업의 비전과 전략 목표 달성을 위한, 기업 정보시스템 구성요소(비지니스, 응용, 데이터, 기술)를 전체적 관점으로 배치, 요소 간 관계 표현한 전사적 청사진
|
|
EAP(Enterprise Architecture Planning)
|
(정의) EA의 산출물 정의 및 전환계획 수립을 위한 계획수립 방법론
(절차) 시작(계획수립)→현재위치(업무모델링, 현행 시스템 및 기술)→목표비전(데이터 아키텍처, 응용 아키텍처, 기술 아키텍처)→획득계획(이행계획) |
||
EAMS(Enterprise Architecture Mgmt System)
|
(정의) EA 산출물 작성, 관리, 활용 등을 지원하는 포괄적인 EA 관리 도구
|
||
EA 참조 모델 | 성업서데기 |
(정의) EA의 일관성, 통일성, 상호운용성 확보를 위해 공통의 기준을 정의한 메타모델
EA 구축을 위한 기업 내/외부의 사례 및 표준 문서 , 방법 (목적) 표준화, 참조, 재사용 (종류) . PRM(성과참조모델) : 조직 성과 측정 모델 . BRM(업무) : 업무를 기능 중심으로 분류 . SRM(서비스) : IT서비스요소 분류 . DRM(데이터) : 데이터를 유형별 분류 . TRM(기술) : 기술을 분류, 표준/규격 정리 |
|
ISO 9000 |
(정의) 품질 경영 시스템의 국제규격
|
||
6sigma |
(정의) 100만개의 업무요소에 서 3~4개의 결함을 목표하는 기법
|
||
옴니채널 |
O2O, O4O 설명/사례/기술
|
[옴니채널]
(정의) 온라인/오프라인 매장의 특성을 결합, 언제 어디서든 동일한 경험을 할 수 있도록 제공하는 마케팅 기법 (배경) IT발전에 따른 새로운 쇼핑 트렌드 등장, 크로스 쇼퍼(쇼루밍 : 오프라인 확인, 온라인 구매, 역쇼루밍 : 온라인 확인, 오프라인 구매, 옴니채널 쇼핑 : 동시 활용)의 증가 [O2O : Online to Offline] (정의) 온라인을 통해 고객 유치(구매, 결재), 오프라인으로 고객 유도(상품 수령, 구매)하는 방식, 수익성 저조, 경쟁 심화 (기술요소) 비콘(BLE 활용), 지오펜싱(GPS 활용), WIFI, BLE(블루투스 4. 0), LBS, NFC [O4O : Online for Offline] (정의) 온라인 기업이 고객 정보와 자산을 기반으로 오프라인으로 사업 영역을 확대하는 방식, 수익창출, 새로운 고객 경험 제공 (기술요소) 인식기술(RFID, NFC, 얼굴인식) ,위치기반기술(지오펜싱, 비콘, 매장트레킹), 분석기술(빅데이터, 인공지능), 체감기술(증강현실), 디지털사이니지 |
|
ERP | 전사 자원 관리 |
* Enterprise Resource Planning
(정의) 기업 효율성과 경쟁력 극대화를 위해 구매, 생산, 판매, 인사, 회계 관리 등 기업의 전반적인 업무 프로세스를 하나의 체계로 통합한 전사적 자원 관리 시스템 (구축 방식) BigBang (한번에 전부), 프로세스별, 사업장별 * XRP(eXtended) : ERP + SCM/CRM (기업 외부 : 영업, 마케팅, 협력사와 고객 관리 등) * ERP 2 = XRP ??? * 차세대 ERP : EA로 중심 이동 |
|
CRM |
고객 관리(기업 입장)
|
* Customer Relationship Management
(정의) 기업 매출 최적화를 위해 고객 이해를 바탕으로(고객 정보 분석) 원하는 제품과 서비스를 지속 제공하여 고객 생에 가치(LTV, Lift Time Value)를 극대화하고 고객을 관리하는 마케팅 관리 기법 및 지원 체계 (구성) . 운영 CRM : 고객접점에서 고객관리 지원, SFA(Sales Force Automationm, 대면활동 지원) . 협업 CRM : 고객과의 접촉 채널지원, 콜센터, IPCC, e-CRM . 분석 CRM : 운영 데이터로 마케팅 분석, 판매 분석, 전사 DM, DW, OLAP * CEM(Experience) : 고객경험을(제품 탐색, 구매, 사용) DB화 하여 관리 분석, 회사에 대한 고객의 생각 수집 * VRM(Vendor) : 고객(개인) 중심의 개인정보/선호도 관리/제안 * PRM(Partner) : 공급 업체와 파트너 관계 관리(영업, 마케팅, 서비스) |
반응형