개발/자격증 공부

정보처리기사 오답 정리(6. 논리, 물리 데이터 저장소)

잠수돌침대 2022. 12. 25. 18:00

관계 대수의 종류

1. 셀렉트(Select)

  • 연산자 : σ
  • 릴레이션 R에서 조건을 만족하는 튜플 반환

2. 프로젝트(Project)

  • 연산자 : π
  • 릴레이션 R에서 주어진 속성들의 값으로만 구성된 튜플 반환

3. 조인(Join)

  • 연산자 :
  • 공통 속성을 이용해 R과 S의 튜플들을 연결해 만들어진 튜플 반환

4. 디비전(Division)

  • 연산자 : ÷
  • 릴레이션 S의 모든 튜플과 관련 있는 R의 튜플 반환

데이터베이스 이상

  • 데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 비합리적 현상
  • 삽입 이상, 삭제 이상, 갱신 이상이 존재함

정규화(Normalization)

  • 관계형 데이터 모델에서 데이터의 중복성을 제거하여 이상 현상을 방지하고, 데이터의 일관성과 정확성을 유지하기 위해 무손실 분해하는 과정
  • 함수적 종속성을 이용해서 연관성 있는 속성들을 분류하고, 각 릴레이션의 이상 현상이 생기지 않도록 하는 과정
  • 잘못 설계된 관계형 스키마를 작은 속성의 세트로 쪼개어 바람직하게 만드는 것

비정규화(De-Normalization) = 반정 규화

  • 정규화된 엔티티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링 기법
  • 높은 규모 확장성을 위해 사용되며, 자주 사용되는 Join의 반복을 줄일 수 있다.
  • 의도적으로 정규화 원칙을 위배하는 행위

논리 데이터 모델링의 속성

개체, 속성, 관계

개체-관계 모델(ER Model)

  • 현실 세계에 존재하는 데이터와 그들 간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현하기 위해서 가장 널리 사용되고 있는 모델
  • 요구사항으로부터 얻어낸 정보들을 개체, 속성, 관계로 기술한 모델
  • 개체 : 사각형 / 관계 : 마름모 / 속성 : 타원

물리 데이터 모델링

  • 논리 모델을 적용하고자 하는 기술에 맞도록 상세화해 가는 과정

인덱스 칼럼 선정 기준

  • 분포도가 좋은 칼럼은 단독적으로 생산한다.
  • 자주 조합되어 사용되는 컬럼은 결합 인덱스로 생성한다.

파티셔닝 기법의 종류

1. 레인지 파티셔닝

  • 연속적인 숫자나 날짜를 기준으로 하는 파티셔닝
  • 손쉬운 관리 기법을 제공하여 관리 시간의 단축이 가능

2. 해시 파티셔닝

  • 파티션 키의 해시 함숫값에 의한 파티셔닝 기법
  • 균등한 데이터 분할이 가능하고 질적 향상을 불러옴

3. 리스트 파티셔닝

  • 특정 파티션에 저장될 데이터에 대한 명시적 제어가 가능한 파티셔닝 기법
  • 분포도가 비슷하고 데이터가 많은 SQL에서 칼럼의 조건이 많이 들어오는 경우 유용

4. 컴포지트 파티셔닝

  • 범위 분할 이후 해시 함수를 적용하여 재분할하는 파티셔닝 기법
  • 큰 파티션에 대한 I/O 요청을 여러 파티션으로 분할할 수 있음

데이터 모델에 표시할 요소

구조(Structure)

  • 논리적으로 표현된 개체/타입 간 관계

연산(Operation)

  • 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세

제약조건(Constraint)

  • 데이터베이스에 저장될 수 있는 실제 데이터의 논리적 제약조건