정보관리 기술사 공부

주요 토픽 정리 541~570 [DB, IT경영]

장술사 2023. 7. 27. 09:15
반응형

 

토픽 키워드 두음신공 주요 내용
연결함정(Connection Trap)
관계성 모호, 부채꼴/균열 함정
 
(정의) 데이터 모델링 시 개체 간의 관계성이 모호하거나 미존재하여 향후 업무처리에 영향을 미치게 되는 ER모델의 문제점, 정규화 과정에서 무손실 분해의 원칙이 지켜지지 않아 원래 있던 관계성을 잃어버리는 현상
(유형)
. 부채꼴 함정 : 관계성 모호, 한 개체 집합이 둘 이상의 1 : n 관계를 갖는 경우, 관계 중 한쪽을 n : 1로 변환하여 해결
. 균열 함정 : 관계성 미존재, 개체 집합들이 부분 관계성 집합으로 연결된 경우, 균열 발생한 엔티티 간 관계를 추가하여 해결
Data Profiling
데이터 품질 향상
 
(정의) 데이터에 기반한 정합성을 체크하여 데이터를 구조화하고 보정(데이터 클린징)하는 분석 기법
(절차) 데이터 선정→데이터 탐색(완전성/유효성)→구조 탐색(무결성)→관계 탐색(상관성)→결과 리포트(오류는 사용자 및 클린징 모듈에 전달)
MMDB(Main Memory DB)
주기억장치 상주
 
(정의) DB 전체를 주기억장치에 상주시켜 관리 및 운영하는 DB
(등장배경) 실시간 데이터 처리 요구 증가, 기존 DBMS 성능 한계, 메모리 가격 하락, 64bit 운영체제
(특징) 해싱 혹은 T-Tree 인덱싱 이용하여 주소 파악후 주소영역 접근, 로그는 디스크에 기록, 디스크 대비 10~50배 빠름
(로깅 규칙)
. WAL(Write Ahead Logging) : DB 반영전에 로그 먼저 기록
. Commit Rule : Commit 완료되면 failure 관계 없이 DB에 영구 반영되어야 함
. LAW(Logging After Write) : 변경된 데이터의 사후 이미지(After Image)는 DB 반영 후 로그에 기록
(활용 현황) 차세대 빌링(이통사 사용자 인증/빌링), 증권사(실시간 주식 시세 분석), 유선통신(대용량 트랜잭션 처리)
* Hybrid MMDB : 성능을 요하는 일부 데이터는 메모리에 상주, 대용량은 디스크 사용
NoSQL(Not only SQL)
수평적 확장, 대용량 데이터 처리, BASE 특성
 
(정의) 관계형 DB 한계를 벗어나, 비정형 초고용량 데이터 처리를 위해 데이터의 읽기보다 쓰기에 중점을 둔, 수평적 확장이 가능하며 데이터 복제 및 분산 저장이 가능한 DBMS
(특징) 확장성, 가용성, 대용량 데이터, Schema-less, 저렴한 클러스터 구성, 병목 현상 제거, 필요한 만큼의 무결성, BASE 특성 추구
(데이터 모델)
. KVS(Key-Value Storage) : 키와 값의 쌍으로 관리, Amazon SimpleDB, Azure Table Storage, DynamoDB
. Document : JSON, XML 형태의 구조적 문서 저장, 조인 미지원, CouchDB, MongoDB
. Graph : 그래프 형식으로 데이터 저장 및 표현, Bigdata, DEX, NeoJ
*BASE : Basically Available(언제든 접근 가능), Soft state(특정 시점 일관성 보장 안함), Eventually consistent(최종적으로는 일관성 유지)
SQL DDL,DML,DCL  
(정의) RDBMS에서 사용자 질의에 대해 DB를 제어, 관리할 수 있도록 해주는 표준 언어
(주요 기능) 데이터 정의(DDL, CREATE, ALTER, DROP), 데이터 조작(DML, SELECT, INSERT, DELETE, UPDATE), 데이터 제어(DCL, GRANT, REVOKE)
CAP 이론
일관성/가용성/단절내성, 두가지 선택
 
(정의) 대용량 분산 DB는 데이터 일관성, 가용성, 단절내성을 모두 만족시키는 것이 불가능하므로 두 가지만 전략적으로 선택해야 한다는 이론
(CAP)
. Consistency(일관성) : 분산 노드간 항상 같은 데이터 유지
. Availability(가용성) : 일부 노드 장애 시에도 다른 노드는 정상 동작
. Partition Tolerance(부분 결함 허용) : 노드 간 네트워크 장애에도 시스템은 정상 동작
샤딩(Sharding)
데이터 분할, 개별 파티션, 샤드, 수평/수직
 
(정의) RDB에서 대용량 데이터 처리를 위해 데이터를 분할하여 저장/조회 하는 기술, 샤드라고 부르는 각각의 개별 파티션으로 분할됨
(장점) 성능 개선, 신뢰성 개선, 위치 추상화
(DB 분할 방법)
. Vertical Partitioning : 수직 파티셔닝, 테이블 별로 서버 분할 / Horizontal Partitioning : 수평 파티셔닝
. Range based Partitioning : 하나의 feature나 table이 점점 거대해지는 경우 서버를 분리하는 방식
. Key or Hash Based Partitioning : 엔티티의 해시값을 이용해서 서버를 정하는 방식
카산드라(Cassandra)
컬럼형 NoSQL DB, 컬럼 패밀리, Consistency level
 
(정의) Row key를 인덱스로 가지는 key-value형 스토어이며, 컬럼을 기본으로 데이터를 다루는 컬럼형 NoSQL 데이터베이스
(특징 및 장단점)
. 읽기 및 쓰기에 대한 각각의 Consistency Level을 지정하여 성능과 신뢰도 수준을 조정하도록 하고 있음
. 대량으로 쓰기가 발생하는 서비스에 적합
. 데이터는 일단 메모리에 쓰여지며 일정 크기가 되면 디스크로 옮김
. 복잡한 조건의 검색 불가, 데이터는 대량이지만 검색 조건은 단순한 서비스에 적합(페이스북, 트위터. . )
Tiny DB
센서DB, Tiny OS
 
(정의) Tiny OS에서 구동되는 센서 네트워크(USN)로부터 정보를 얻어내기 위한 센서 데이터베이스 질의 시스템
DB 튜닝 지속적 튜닝  
(성능개선 주요 항목 / 사례)
. 설계 관점 : 데이터 모델링, 인덱스 설계, 용량 산정 / 반정규화, 효율적 인덱스 전략(분포도 15% 이하)
. DBMS 관점 : CPU, 메모리 I/O 관한 관점
. SQL 관점 : join, 인덱싱, SQL 실행 계획 / 옵티마이저 선택.변경, 힌트 사용, 인텍스 활용, 조인방식.순서, static SQL 지향
. H/W 관점 : CPU, 메모리, 네트워크, 디스크
(절차) 분석(자료수집/목표설정)→이행(방안 수립, 적용)→평가→2차 튜닝→3차 튜닝(목표까지 지속 반복적 튜닝 중요)
DB 리펙토링(Refactoring)
DB smell, 반드시 DB 회귀 테스트
 
(정의) DB 의미(정보) 변화 없이 디자인을 개선하는 작업, DB Smell 근거 수행, 데이터 및 어플리케이션 최적화, 반드시 DB 회귀 테스트 수행
(DB 리펙토링 유형) 구조, 데이터 품질, 참조 무결성, 아키텍처, 기능 리팩토링
(DB Smell)
. Multi-purpose column/table, Tables with many column/rows
. 중복 data, smart columns(하나 컬럼이 다기능 목적 수행, 주민번호), Fear of change
. DB smell은 대부분 DB와 관계된 요소(다른 DB, 다른 어플리케이션, 프레임워크, 파일)와의 결합에 의해 발생
OR Mapping(Object Relational)
Class 모델→RDB 모델
 
(정의) RDB가 상용되고 있는 상황에서 OODB로 전환되지 못하여, 객체지향 프로그래밍 설계 시 클래스 모델을 RDBMS 모델로 전환하기 위한 Mapping 기법
(절차) Class ↔ Table, Attribute ↔ Column, Class Relationship ↔ Relational DB Relationship
(클래스 관계 유형) Association(일반적 협력 관계), Aggregation(전체 - 부분, 마름모), Generalization(일반화 - 특수화, 화살표)
데이터베이스 백업
전체/차등/증분 백업, Hot/Cold 백업, Achive Log
 
(백업 유형)
. 전체 백업, 차등 백업(변경 사항 누적 백업), 증분 백업(변경된 것만 백업)
. Achive Log : 주기적 또는 일정한 양의 데이터 간격 마다
. Hot backup : Online 백업, DB 서비스 중에도 백업 가능 / Cold backup : Offline 백업, DB 서비스 shutdown 되야 가능
(백업 기술)
. VTL(Virtual Tape Library) : 고속, 가상화 통한 백업 단순화
. CDP(Continuous Data Protection) : 지속/주기적, 임의시점복구, 실시간 복구
. De-Duplication : 중복데이터 최소화, 중복 패던 제거하고 원본 데이터의 목록을 별도 보관
공간 DB(Spatial)
래스터/벡터 모델
 
(정의) 비공간 데이터와 공간 데이터의 집합
(구성요소) 공간 질의 처리기, 공간 연산자, 공간 색인, 공간 파일 시스템
(표현 방법)
. 래스터(Raster) 모델 : 직사각형 격자 화소, 비트맵, 구현 단순, 많은 저장 공간과 처리 시간, 확대 축소 시 이미지 손상, 사진 합성, 특수효과에 적합
. 벡터(Vector) 모델 : 점,선,다각형으로 구성, 크기와 방향의 수학적 데이터만 저장, 구현 복잡, 작은 저장 공간과 처리 시간, 래스터 모델보다 많이 사용, 확대 축소 시 무 변화, 3D 표현에 적합
분산 DB 투명성, 2PC 위장복병분
(정의) 네트워크를 통해 물리적으로 분산되어 존재하지만 하나의 논리적인 통합구조로 관리되는 데이터베이스
(목적) 지역화, 부하 분산, 병렬 데이터 처리, 가용성, 신뢰성 향상
(특징 : 투명성, Transparency)
. 위치 투명성 : 물리적 위치 투명성(Distributed Data Dictionary Directory 필요)
. 장애 투명성 : 장애 시 데이터 무결성 보존(2PC 활용) / 복제 투명성 : 물리적 복제 여부 투명성(DR 복제)
. 병행 투명성 : 동시 수행 트랜잭션 결과의 일관성 유지(Locking, TS ordering)
. 분할 투명성 : 한 릴레이션의 분할 단편 저장 여부 투명성(성능 향상, Fragmentation 설계 필요)
(설계 방식) Top-Down, Bottom-Up, Hybrid
(구성 방법) 복제(Replication), 수평분할, 수직분할, 혼합(Hybird) 방식
(장점) 지역자치성, 대용량 및 점진적 증가 용이, 신뢰성, 가용성, 효율성, 융통성
(단점) 복잡도, 비용, 통신망 속도 의존, 완전한 무결성 보장 어려움, 처리 오버헤드 증가, 보안 통제 어려움
(구축 시 고려사항) 동시성 제어, 네트워크 속도, 보안기술, 백업 및 복구 기술, 클러스터링 기술
Streaming DBMS
실시간 데이터 처리, CQL, CEP, DDS, DSMS
 
(정의) 고정된 형태가 아닌 실시간으로 변하는 데이터를 처리하는 시스템
(주요 기술)
. CQL (Continuous Query) : 일정 기간 동안 지속적으로 사용될 수 있는 질의
. CEP (Complex Event Processing) : 다양한 이벤트 중 복잡한 패턴 등을 분석하여 의미 있는 이벤트를 구분
. DDS(Distribute Data Service) : 분산환경에서의 실시간 데이터 전송 표준
. DSMS(Data Stream Management System)
BABOK(Business Analysis Body of Knowledge) 분석기법  
(정의) IIBA에서 비즈니스 분석 업무에 대해 정리한 표준지식체계
(분석기법)
. RACI Matrix : R&R을 정의 시 사용 - 태스크별로 역할을 Responsible, Accountable, Consulted, Informed로 구분
. MoSCow Analysis : 요구사항의 우선순위를 메길 때, Must Have (무조건 해야), Should Have (우선순위 높음), Could Have (우선순위 낮음), Would Not Have (안하기로) 등으로 분류
. 인터뷰, 브레인스토밍, 설문조사, SWOT 등. . .
PI(Process Innovation)
   
(정의) 전사 차원에서 불필요 요소를 제거하고 업무 프로세스를 재구축(고객지향)하는 경영개선 활동
(추진 3요소) 프로세스, 정보기술, 조직
BPR(Biz Process Re - engineering)
   
(정의) 비즈니스 시스템을 근복적으로 재설계하는 경영기법
BPM(Biz Process Mgmt)
   
(정의) 비즈니스 프로세스의 자동화(BPMS), 통합화, 최적화를 통해 기업의 프로세스를 관리하는 활동
BPI(업무 성과 지표 : Biz Performance Indicator)
     
EA(Enterprise Architecture)/ITA(Information Technology Architecture)
ITA, 프레임워크, 개념, 필요성, 구성
 
(정의) 기업의 비전과 전략 목표 달성을 위한, 기업 정보시스템 구성요소(비지니스, 응용, 데이터, 기술)를 전체적 관점으로 배치, 요소 간 관계 표현한 전사적 청사진
EAP(Enterprise Architecture Planning)
   
(정의) EA의 산출물 정의 및 전환계획 수립을 위한 계획수립 방법론
(절차) 시작(계획수립)→현재위치(업무모델링, 현행 시스템 및 기술)→목표비전(데이터 아키텍처, 응용 아키텍처, 기술 아키텍처)→획득계획(이행계획)
EAMS(Enterprise Architecture Mgmt System)
   
(정의) EA 산출물 작성, 관리, 활용 등을 지원하는 포괄적인 EA 관리 도구
EA 참조 모델 성업서데기  
(정의) EA의 일관성, 통일성, 상호운용성 확보를 위해 공통의 기준을 정의한 메타모델
EA 구축을 위한 기업 내/외부의 사례 및 표준 문서 , 방법
(목적) 표준화, 참조, 재사용
(종류)
. PRM(성과참조모델) : 조직 성과 측정 모델
. BRM(업무) : 업무를 기능 중심으로 분류
. SRM(서비스) : IT서비스요소 분류
. DRM(데이터) : 데이터를 유형별 분류
. TRM(기술) : 기술을 분류, 표준/규격 정리
ISO 9000    
(정의) 품질 경영 시스템의 국제규격
6sigma    
(정의) 100만개의 업무요소에 서 3~4개의 결함을 목표하는 기법
옴니채널
O2O, O4O 설명/사례/기술
 
[옴니채널]
(정의) 온라인/오프라인 매장의 특성을 결합, 언제 어디서든 동일한 경험을 할 수 있도록 제공하는 마케팅 기법
(배경) IT발전에 따른 새로운 쇼핑 트렌드 등장, 크로스 쇼퍼(쇼루밍 : 오프라인 확인, 온라인 구매, 역쇼루밍 : 온라인 확인, 오프라인 구매, 옴니채널 쇼핑 : 동시 활용)의 증가
[O2O : Online to Offline]
(정의) 온라인을 통해 고객 유치(구매, 결재), 오프라인으로 고객 유도(상품 수령, 구매)하는 방식, 수익성 저조, 경쟁 심화
(기술요소) 비콘(BLE 활용), 지오펜싱(GPS 활용), WIFI, BLE(블루투스 4. 0), LBS, NFC
[O4O : Online for Offline]
(정의) 온라인 기업이 고객 정보와 자산을 기반으로 오프라인으로 사업 영역을 확대하는 방식, 수익창출, 새로운 고객 경험 제공
(기술요소) 인식기술(RFID, NFC, 얼굴인식) ,위치기반기술(지오펜싱, 비콘, 매장트레킹), 분석기술(빅데이터, 인공지능), 체감기술(증강현실), 디지털사이니지
ERP 전사 자원 관리  
* Enterprise Resource Planning
(정의) 기업 효율성과 경쟁력 극대화를 위해 구매, 생산, 판매, 인사, 회계 관리 등 기업의 전반적인 업무 프로세스를 하나의 체계로 통합한 전사적 자원 관리 시스템
(구축 방식) BigBang (한번에 전부), 프로세스별, 사업장별
* XRP(eXtended) : ERP + SCM/CRM (기업 외부 : 영업, 마케팅, 협력사와 고객 관리 등)
* ERP 2 = XRP ???
* 차세대 ERP : EA로 중심 이동
CRM
고객 관리(기업 입장)
 
* Customer Relationship Management
(정의) 기업 매출 최적화를 위해 고객 이해를 바탕으로(고객 정보 분석) 원하는 제품과 서비스를 지속 제공하여 고객 생에 가치(LTV, Lift Time Value)를 극대화하고 고객을 관리하는 마케팅 관리 기법 및 지원 체계
(구성)
. 운영 CRM : 고객접점에서 고객관리 지원, SFA(Sales Force Automationm, 대면활동 지원)
. 협업 CRM : 고객과의 접촉 채널지원, 콜센터, IPCC, e-CRM
. 분석 CRM : 운영 데이터로 마케팅 분석, 판매 분석, 전사 DM, DW, OLAP
* CEM(Experience) : 고객경험을(제품 탐색, 구매, 사용) DB화 하여 관리 분석, 회사에 대한 고객의 생각 수집
* VRM(Vendor) : 고객(개인) 중심의 개인정보/선호도 관리/제안
* PRM(Partner) : 공급 업체와 파트너 관계 관리(영업, 마케팅, 서비스)
반응형