728x90 반응형 PySpark란?1 PySpark(파이스파크)의 AWS Glue(글루) ETL 란? AWS Glue(글루) 란? AWS Glue는 데이터를 추출, 변환, 로드(ETL)하기 위한 완전 관리형 서비스입니다. Glue를 사용하면 데이터 웨어하우스, 데이터 레이크, 분석용 데이터베이스 등 다양한 데이터 저장소 간에 데이터를 이동하고 변환할 수 있습니다. PySpark 란? Glue의 PySpark는 Python API인 PySpark를 사용하여 데이터 변환 작업을 수행하는 기능을 의미합니다. PySpark는 Apache Spark의 Python API로, 분산형 데이터 처리 및 분석을 위한 강력한 도구입니다. Glue의 PySpark를 사용하면 Python을 사용하여 데이터 처리 작업을 구현할 수 있습니다. Glue의 PySpark 주요 기능 데이터 추출(Extract): Glue의 PySpa.. 2024. 2. 19. 이전 1 다음 728x90 반응형