亞馬遜云科技近日宣布,完全托管的PB級云數據倉庫服務Amazon Redshift的數據共享功能現已在由亞馬遜云科技中國(北京)和(寧夏)區域推出。該功能可以讓客戶安全、方便地在Amazon Redshift集群之間實時共享數據,助力客戶邁向一個 “Zero-ETL” 的未來。
亞馬遜云科技一直致力于為客戶消除數據 ETL(提取、轉換和加載)和其它數據遷移任務所帶來的繁重壓力,幫助客戶專注于分析數據,幫助業務獲取新的洞察。此次推出的Amazon Redshift數據共享功能是在Amazon Redshift數據倉庫之間共享數據的簡單直接的方式。
此前,當需要在兩個集群環境運行不同業務負載時,客戶不得不復制和移動同一套數據才能實現數據共享,這一過程不僅提高了使用成本,也大大增加了數據維護和保證數據一致性的難度。
如今借助數據共享功能,客戶可以實現即時、精細和高性能的數據訪問,為所有數據使用者提供實時、一致的數據視圖,從而在組織內和組織之間、以及與外部相關方進行安全受控的協作。利用該項功能,客戶還可以將數據倉庫的數據與多個BI 和分析集群共享;多個業務組之間可以方便地協作開展更廣泛的分析和數據科學研究;組織內以及跨組織的協作也可以共享數據服務,以各種精度共享數據。
數據共享可以在同一賬戶內進行,也可以跨不同賬戶,只要賬戶在同一區域即可。在Amazon Redshift集群上使用數據共享不會產生額外成本,RA3節點類型的Amazon Redshift集群可以直接使用該功能。
在 “Zero-ETL” 技術領域,亞馬遜云科技很早就在Amazon Redshift上推出聯邦查詢(Federated Query)功能,讓用戶可以對跨數據庫、數據倉庫和數據湖的數據進行查詢和分析,而無需移動數據。聯邦查詢功能可實現實時數據集成并簡化 ETL 處理流程。
2022年底,亞馬遜云科技進一步發布兩項功能,分別助力客戶使用 Amazon Redshift 近乎實時地分析 Amazon Aurora 中的數據,無需在不同服務之間進行數據 ETL;以及幫助客戶可以在 Amazon Redshift 的數據上輕松運行 Apache Spark 應用程序。通過這些新功能的陸續發布,亞馬遜云科技幫助客戶逐漸邁入一個 “Zero-ETL” 的未來。