본문 바로가기
● Data Insights/Data Visualization

(Power BI) 엔터프라이즈 데이터 모델링: Import·DirectQuery·Live Connection 선택 가이드

by DATA Canvas 2025. 10. 13.
반응형

Power BI의 데이터 연결 방식은 Import, DirectQuery, Live Connection(SSAS, Fabric) 세 가지로 나뉘며, 각 방식은 데이터 신선도, 쿼리 성능, 시스템 부하, 보안 및 관리 편의성 측면에서 뚜렷한 차이를 보입니다. 최적의 방식을 선택하려면 데이터 볼륨, 실시간성 요구, 원천 시스템 특성, 보안 정책 등을 종합적으로 고려해야 합니다.

 


1. 주요 연결 방식 개요

항목 Import Direct Query Live Connection (SSAS·Fabric)
데이터 저장 Power BI 내부 캐시 원천 데이터베이스에 직접 쿼리 SSAS·Fabric 엔진에 연결
실시간성 리프레시 스케줄 기반 쿼리 시점의 실시간 데이터 엔진에서 최적화된 실시간 응답
데이터 볼륨 수백만~수천만 행 캐시 가능 원천 DB 성능에 제약 엔진 규모에 따름
쿼리 성능 빠름(메모리 칼럼 저장소 활용) 원천 DB 부하 및 네트워크 영향을 받음 엔진 최적화 덕분에 우수
시스템 부하 Power BI 서비스/온프레미스 게이트웨이 부하 원천 DB CPU·I/O 부하 증가 SSAS·Fabric 서버에 부하 집중
보안 제어 Power BI 권한 관리 원천 DB 권한 및 게이트웨이 제어 엔진 보안 정책·역할 기반 보안(RLS) 활용
적용 사례 정형 BI 보고서, 대시보드 실시간 모니터링, 트랜잭션 보고 엔터프라이즈 큐브, 복잡한 모델 공유
반응형

2. Import 방식

Power BI가 데이터를 메모리 기반 컬럼 저장소에 적재해 쿼리 성능을 극대화하는 방식입니다.

  • 장점
    • 빠른 응답 속도: 고압축·인메모리 컬럼 최적화로 대화형 시각화에 적합
    • 오프라인 보고: 원천 시스템 가동 중지 시에도 데이터 조회 가능
    • 비용 효율적: 게이트웨이 호출 최소화
  • 단점
    • 실시간성 제한: 수동/스케줄 리프레시 주기에 종속
    • 메모리 제약: 대용량 모델의 경우 용량 한계 도달
    • 데이터 복제: 원천 시스템과 데이터 싱크 관리 필요
  • 시스템 부하
    • Power BI 서비스나 온프레미스 게이트웨이에 주로 부하 집중
    • 피크 시간대 리프레시 작업 시 네트워크 대역폭 사용 급증
  • 사용 가능한 원천
    • MSSQL, Oracle, SAP BW, Azure Synapse 등 거의 모든 지원 커넥터
    • FTP, CSV 등 파일 기반 원천도 가능

3. DirectQuery 방식

Power BI가 실시간 쿼리를 원천 데이터베이스에 전달해 결과만을 반환받는 방식입니다.

  • 장점
    • 실시간 데이터 반영: 데이터 변경 사항 즉시 대시보드에 반영
    • 메모리 부담 없음: 대규모 테이블도 캐시 없이 처리 가능
    • 데이터 거버넌스: 원천 DB 보안·정책 그대로 준수
  • 단점
    • 응답 속도 저하: 네트워크 레이턴시 및 원천 DB 부하에 민감
    • 기능 제약: 일부 복잡한 DAX 함수 및 파워 쿼리 기능 제한
    • 동시 사용자 제한: 많은 동시 쿼리 시 원천 DB 과부하 가능
  • 시스템 부하
    • 원천 DB 서버의 CPU·I/O 사용량 급증
    • 네트워크와 게이트웨이 대역폭에 부하
  • 사용 가능한 원천
    • Azure SQL Database, SQL Server, SAP HANA, Snowflake 등 실시간 쿼리 지원 DB
    • 커넥터별로 지원 쿼리 언어(T-SQL, MDX 등) 제한 존재

4. Live Connection 방식 (SSAS·MS Fabric)

Power BI가 SSAS Tabular/Multidimensional 또는 MS Fabric Lakehouse/Copilot+ 같은 외부 엔진에 직접 연결해 쿼리·시각화를 수행하는 방식입니다.

  • 장점
    • 엔터프라이즈급 성능: 대규모 멀티 테라바이트 모델 최적화
    • 복잡한 모델링: 계층·역할 기반 보안(RLS), 계산 그룹 등 고급 기능
    • 단일 모델 재사용: 중앙집중식 모델링·버전 관리
  • 단점
    • 인프라 관리 비용: 별도 엔진 구성·운영에 대한 추가 비용
    • 설정 복잡성: SSAS 배포·보안·성능 튜닝 경험 요구
    • Power BI 기능 제약: 보고서 아이템 생성 일부 제한
  • 시스템 부하
    • SSAS·Fabric 클러스터에 집중, Scale-Out/Azure 자동 스케일링으로 대응
    • Power BI는 렌더링 및 시각화 용도에만 부하
  • 사용 가능한 원천
    • SSAS Tabular, SSAS Multidimensional
    • MS Fabric Lakehouse, Power BI Semantic Model 서비스

5. 선택 가이드

  • 실시간성 최우선: DirectQuery 또는 Live Connection
  • 초고속 대화형 분석: Import
  • 중앙집중형 엔터프라이즈 모델: Live Connection
  • 원천 시스템 부하 최소화: Import(스케줄 리프레시)
  • 대용량·복잡 모델: Live Connection
  • 간편 도입 및 운영: Import
반응형