스노우플레이크가 기존 데이터웨어하우스와 다른 핵심 구조는 무엇인가?


스노우플레이크가 기존 데이터웨어하우스와 가장 크게 다른 점은 저장(스토리지)과 처리(컴퓨팅)을 완전히 분리한 구조를 갖고 있다는 거예요.
이 한 가지가 단순한 기술 차이를 넘어서, 비용·성능·운영 방식 전부를 바꿔놓는 핵심 포인트라서 조금 풀어서 설명해볼게요.

기존 데이터웨어하우스는 보통 스토리지와 컴퓨팅이 한 덩어리로 묶여 있어요. 저장공간을 늘리면 컴퓨팅도 따라 늘어야 하고, 계산량이 필요해도 저장공간이 함께 늘어나야 하는 구조죠. 결국 자원을 “따로” 관리할 수 없기 때문에 비효율이 생기곤 했어요.

스노우플레이크는 이 구조를 완전히 뒤집어서 데이터는 하나의 중앙 저장소에 고정해두고, 실제 작업을 실행하는 컴퓨팅은 ‘가상 웨어하우스’라는 독립된 단위로 분리했어요. 그래서 저장공간은 저장공간대로, 컴퓨팅은 컴퓨팅대로 각각 독립적으로 확장하거나 줄일 수 있어요.

예를 들어 데이터 분석팀은 큰 컴퓨팅을 잠깐 켰다가 끌 수 있고, BI팀이나 개발팀은 그와 별개로 다른 컴퓨팅을 돌려도 서로 간섭이 없어요. 같은 데이터를 여러 팀이 동시에 써도 경합이 적어요. 예전에는 한 팀이 무거운 쿼리 돌리면 다른 팀이 대기해야 했는데, 스노우플레이크에서는 가상 웨어하우스를 여러 개 만들면 끝나는 구조라 병목이 거의 없죠.

이 구조 덕분에 비용도 원하는 만큼 조절하기 쉬워요. 작업 안 할 때는 컴퓨팅을 ‘꺼두기’만 하면 비용이 거의 들지 않고, 필요하면 바로 확장해서 빠르게 처리할 수도 있어요. 기존 시스템처럼 “미리 큰 서버를 확보해놓는 방식”과 완전히 달라진 셈이에요.

정리하면 스노우플레이크의 핵심 구조는
하나의 중앙 스토리지 + 여러 개의 독립적인 컴퓨팅 레이어
이 조합이에요. 이 단순한 구조 변화가 확장성, 동시성, 비용 효율, 운영 편의성까지 전부 달라지게 만든 원리라고 보면 돼요.


댓글 남기기