HBase?

Apache Hbase는 확장(Scale-out) 가능하며, 분산될 수 있는 대용량 Database.
랜덤 액세스 및 실시간 읽기/쓰기를 지원하는 비관계형 데이터베이스임.
Hadoop Ecosystem의 일부로 HDFS에서 동작.
읽기/쓰기에 일관성 보장

HBase 테이블의 구조

HBase의 Table은 Row, Column, Column Family, Column Qualifier, Cell, Timestamp로 이루어져 있다.
Table: Row의 집합
Row: Row Key + Columns, Row Key 기준 알파벳순으로 정렬됨 (연관된 Row끼리 가깝게 배치하려면 Row Key 설계 중요)
Column: Column Family + Column Qualifier
Column Family: CF내의 멤버는 물리적으로 같은 공간에 저장(한꺼번에 접근 시 빠른 처리 가능), Column Family 멤버는 동적으로 추가 가능
Column Qualifier: 문자로 구분되며 가변적이고 Row마다 크기가 다를 수 있음
Cell: 각 Column의 값, timestamp 포함, 이전의 값을 두고 저장되며, 일정 기간 그 값을 유지함
Timestamp: 데이터가 기록될때 Region Server의 시간, 주어진 값의 Version 식별자로 쓰임

Region은 테이블을 Start Row ~ End Row 까지 분할하고 묶은 것

Region Server는 이러한 Region들을 관리하는 서버를 말함.

Data Engineer 로드맵 (-ing...) (0)	2021.09.01
Hadoop 이란? (0)	2021.08.22