본문 바로가기
반응형

ETL3

정규화 단계별 실전 예제와 최적화 팁 데이터베이스 정규화(Database Normalization)는 관계형 데이터 설계의 근간으로, 데이터 중복을 줄이고 무결성을 보장하며 삽입·갱신·삭제 이상을 방지하기 위한 체계적인 분해 과정을 말합니다. 많은 조직이 OLTP 시스템에서 안정적인 트랜잭션 무결성을 원하지만, 한편으로는 분석(Analytics)과 리포팅에서 성능을 확보해야 하므로 정규화와 역정규화(denormalization)의 균형을 맞추는 일이 필수적입니다. 이 글에서는 핵심 개념, 정규형 단계, 함수적 종속성 분석 방법, 실무 적용 가이드라인, OLTP·OLAP 관점에서의 모범 사례와 함께 구체적인 설계 절차를 제시합니다. 왜 정규화가 중요한가정규화의 목적은 데이터 중복을 제거하고 데이터 일관성(consistency)과 무결성(int.. 2026. 5. 24.
(Data) REST API 호출 완전 정복: 메서드별 비교·장단점·부하 분석 REST API의 HTTP 메서드(GET, POST, PUT, DELETE 등)와 호출 패턴(동기·비동기·폴링·웹훅·스트리밍)을 이해하면 시스템 성능과 안정성을 모두 잡을 수 있습니다.1. HTTP 메서드 기본 이해REST API는 HTTP 메서드를 통해 자원을 조작합니다. 주요 메서드는 다음과 같습니다.GET: 서버에서 데이터를 조회장점: 멱등성(Idempotent) 지원, 캐시 활용 가능단점: 요청 본문(request body)을 지원하지 않아 복잡한 쿼리 처리 한계POST: 서버에 데이터를 생성 또는 서버 내부 프로세스 트리거장점: 요청 본문을 활용해 복잡한 데이터 전송 가능단점: 멱등성 미지원, 중복 요청 시 이중 생성 주의PUT: 기존 자원 전체 교체장점: 멱등성 보장, 자원 업데이트 명시적단점.. 2025. 10. 14.
(Data) ETL/ELT 증분 처리의 핵심: DELETE+INSERT부터 CDC까지 ETL과 ELT 파이프라인에서 데이터 증분 처리(Incremental Loading)는 성능과 효율성을 결정하는 핵심 요소입니다. 전체 데이터를 매번 처리하는 Full Load 방식과 달리, 증분 처리는 변경된 데이터만을 선별적으로 처리하여 시스템 자원을 최적화하고 실시간성을 확보합니다.주요 증분 처리 방식 Overview현대 데이터 웨어하우스 환경에서 사용되는 증분 처리 방식은 크게 7가지로 분류할 수 있습니다. 각 방식은 고유한 특성과 적용 시나리오를 가지고 있어, 데이터 특성과 비즈니스 요구사항에 따라 선택해야 합니다.MethodDescriptionSpeedData ConsistencyHistorical PreservationRollback PossibleUse CaseDELETE+INSERT기존 .. 2025. 10. 7.
반응형