728x90 반응형 PySpark의 AWS Glue ETL 란?1 PySpark(파이스파크)의 AWS Glue(글루) ETL 란? AWS Glue(글루) 란? AWS Glue는 데이터를 추출, 변환, 로드(ETL)하기 위한 완전 관리형 서비스입니다. Glue를 사용하면 데이터 웨어하우스, 데이터 레이크, 분석용 데이터베이스 등 다양한 데이터 저장소 간에 데이터를 이동하고 변환할 수 있습니다. PySpark 란? Glue의 PySpark는 Python API인 PySpark를 사용하여 데이터 변환 작업을 수행하는 기능을 의미합니다. PySpark는 Apache Spark의 Python API로, 분산형 데이터 처리 및 분석을 위한 강력한 도구입니다. Glue의 PySpark를 사용하면 Python을 사용하여 데이터 처리 작업을 구현할 수 있습니다. Glue의 PySpark 주요 기능 데이터 추출(Extract): Glue의 PySpa.. 2024. 2. 19. 이전 1 다음 728x90 반응형