50
Redshift Spectrum은 로딩이나 ETL 없이 Amazon S3에 있는 엑사바이트 규모의 비정형 데이터에 대해 쿼리를 실행할 수 있는 Amazon Redshift의 기능입니다. 쿼리를 발행하면, Amazon Redshift SQL 엔드포인트로 전달되고 여기에서 쿼리 플랜을 생성하고 최적화합니다. Amazon Redshift는 로컬에 있는 데이터와 Amazon S3에 있는 데이터가 무엇인지 파악하고, 읽어와야 하는 Amazon S3 데이터 양을 최소화하기 위한 플랜을 생성하고, 공유 리소스 풀의 Amazon Redshift Spectrum 작업자에 Amazon S3에서 데이터를 읽고 처리하도록 요청합니다.
Redshift Spectrum은 필요한 경우 수천 개의 인스턴스로 확장되므로 데이터 크기와 관계없이 쿼리가 빠르게 실행됩니다. 또한, Amazon S3 데이터에 대해 Amazon Redshift 쿼리에서 사용하는 것과 정확히 동일한 SQL을 사용하고, 동일한 BI 도구를 사용해 동일한 Amazon Redshift 엔드포인트에 연결할 수 있습니다. Redshift Spectrum을 사용하면 스토리지와 컴퓨팅을 분리할 수 있으므로 개별적으로 확장이 가능합니다. Amazon S3 데이터 레이크를 쿼리하는 데 필요한 수만큼 Amazon Redshift 클러스터를 설정할 수 있으므로, 고가용성과 제한 없는 동시성이 제공됩니다. Redshift Spectrum은 원하는 장소에 원하는 형식으로 데이터를 저장하고 필요할 때 처리할 수 있습니다.