book_lover 2024. 6. 19. 00:41

RDS는 관계형 데이터베이스 서비스이다.  관계형 데이터베이스는 행과 열로 이루어져 있는 2차원 공간이다. 

데이터베이스는 관계형과 비관계형 데이터베이스가 있다. 

https://velog.io/@keywookim/We.TIL-40-%EA%B4%80%EA%B3%84%ED%98%95DB-vs-%EB%B9%84%EA%B4%80%EA%B3%84%ED%98%95DB

 

관계형 데이터베이스는 행과 열로 이루어져 있는 2차원 공간이다. 그 공간에서 데이터를 넣고, 꺼내고, 지우고, 업데이트하는 등 수많은 일처리를 한다. AWS RDS에서 제공하는 데이터베이스 종류는 다음과 같다.

  • Microsoft SQL Server, Oracle, MySQL, PostgreSQL, Amazon Aurora, MariaDB 등.

https://hongong.hanbit.co.kr/%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0-databasedb-dbms-sql%EC%9D%98-%EA%B0%9C%EB%85%90/

데이터 웨어하우스

웨어하우스는 '데이터를 보관하고 사용하는 저장 창고"이다. 데이터베이스는 데이터를 담고 있는 테이블을 물리적으로 보관하고 있는 장소이며, 데이 웨어하우스는 하나 혹은 여러 개의 소스로부터 데이터를 수집하고, 보관하며, 궁극적으로 규모가 큰 데이터를 불러오는 시스템이다.

 

요약하자면, 데이터베이스는 운영 목적으로 트랜잭션 데이터를 관리하는 데 사용되는 반면, 데이터 웨어하우스는 전략적 의사 결정을 위해 대량의 데이터를 저장하고 분석하는 데 사용

데이터 웨어하우스와 데이터베이스 비교 차트

매개 변수 데이터베이스 데이터 웨어하우스
용처 데이터 기록 데이터 분석
처리 방법 OLTP OLAP
동시 사용자 수 수천 명  제한적
사용 사례 소규모 트랜잭션 복잡한 분석
다운타임 항시 사용 가능  일부 예정된 다운타임
최적화 CRUD 작업 기준 복잡한 분석 기준
데이터 유형 실시간 상세 데이터
요약형 기록 데이터
  • OLTP, online transaction processing, 트랜잭션 중심의 데이터 처리 시스
    작은 규모의 데이터를 불러올 때 사용, 실시간으로 데이터를 데이터베이스에 보관하고 즉시 꺼내서 프로세싱할 때 필요. 동시에 대량의 데이터가 만들어지고 핖ㄹ요에 따라 데이터를 꺼내야 하는 일이 생길 때 OLTP가 사용
  • OLAP, online analytical processing, 데이터 분석 및 의사 결정에 초점을 맞춘 데이터 처리 시스
    다차원적 데이터 분석을 할 때 유용, 큰 데이터를 한 번에 불러올 때 사용되고, 실시간이 아닌 쌓인 데이터를 불러올 때 사용. 데이터를 분석하여 가치를 찾아내는 일을 한다. 

참조 사이트 : https://www.integrate.io/ko/blog/data-warehouse-vs-database-what-are-the-key-differences-ko/

 

데이터 웨어하우스와 데이터베이스의 비교: 7가지 주요 차이점

데이터 마트 및 데이터 레이크에 대한 몇 가지 중요한 통찰력을 포함하여 데이터 웨어하우스와 데이터베이스 간의 주요 차이점을 분석합니다.

www.integrate.io

데이터베이스 백업

  • RDS에서 데이터베이스를 만들 때 디폴트로 활성화되는 자동 백업은 1~35일의 보유 기간 내에 특정 시간으로 데이터베이스 상태를 복원할 수 있다. 디폴트 값은 7일, 최대 35일까지 설정 가능 
    백업 정보를 S3 버킷에 저장한다. S3 공간은 RDS의 크기에 따라 책정된다 RDS가 10GB면 S3 버킷은 최대 10GB까지 무료로 사용 가능. 단점으로는 입출력시 지연이, 원본 RDS 인스턴스를 삭제하면 백업 정보도 모두 사라진다. 
  • 스냅샷은 데이터베이스 인스턴스를 통째로 복사한다. 볼륨 정보, 파일의 크기, 스냡샷이 만들어진 시간 등 많은 정보를 담고 있다. 수동으로 스냡샷은 실행해야 한다. 그래도 RDS를 삭제해도 스냡샨은 존재한다. 그래서 기존 인스턴스를 살릴 수 있다.

원본 인스턴스에서 백업을 생성할 경우 새로운 인스턴스가 생긴다. 이름, 엔드포인트가 다르게 생성되기 때문이다. 

다중 가용 영역과 읽기 전용

다양한 데이터베이스에서 어떤 이벤트가 일어날 때 원래 데이터베이스 인스턴스에 업데이트하는 동시에 존재하는 가용 영

역에 복제본이 만들어 진다. 이 복제본은 원본이 문제가 생기면 원본대신 역할을 수행해 재해 복구에 사용된다.

읽기 전용 복사본은 데이터를 "읽기" 위한 복제본이다. 읽기 작업만 수행한다. 읽기 전용 복제본의 개수는 최대 다섯 개이다. 

https://velog.io/@amoeba25/%EB%8B%A4%EC%A4%91-%EC%98%81%EC%97%ADMulti-AZ-%EC%9D%BD%EA%B8%B0-%EC%A0%84%EC%9A%A9Read-Replica-%EB%B3%B5%EC%A0%9C

 

다중 영역(Multi-AZ)& 읽기 전용(Read Replica) 복제

AWS RDS에는 가용성과 확장성을 위해 다중 영역 multi-az 이라는 기능과 읽기 전용 read replica이라는 기능이 있다.

velog.io