๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
728x90
๋ฐ˜์‘ํ˜•

๐Ÿš€ Development/AWS(Amazon Web Services)5

PySpark(ํŒŒ์ด์ŠคํŒŒํฌ)์˜ AWS Glue(๊ธ€๋ฃจ) ETL ๋ž€? AWS Glue(๊ธ€๋ฃจ) ๋ž€? AWS Glue๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”์ถœ, ๋ณ€ํ™˜, ๋กœ๋“œ(ETL)ํ•˜๊ธฐ ์œ„ํ•œ ์™„์ „ ๊ด€๋ฆฌํ˜• ์„œ๋น„์Šค์ž…๋‹ˆ๋‹ค. Glue๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค, ๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ, ๋ถ„์„์šฉ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์ €์žฅ์†Œ ๊ฐ„์— ๋ฐ์ดํ„ฐ๋ฅผ ์ด๋™ํ•˜๊ณ  ๋ณ€ํ™˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. PySpark ๋ž€? Glue์˜ PySpark๋Š” Python API์ธ PySpark๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ ๋ณ€ํ™˜ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ธฐ๋Šฅ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. PySpark๋Š” Apache Spark์˜ Python API๋กœ, ๋ถ„์‚ฐํ˜• ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๋ฐ ๋ถ„์„์„ ์œ„ํ•œ ๊ฐ•๋ ฅํ•œ ๋„๊ตฌ์ž…๋‹ˆ๋‹ค. Glue์˜ PySpark๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด Python์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ์ž‘์—…์„ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Glue์˜ PySpark ์ฃผ์š” ๊ธฐ๋Šฅ ๋ฐ์ดํ„ฐ ์ถ”์ถœ(Extract): Glue์˜ PySpa.. 2024. 2. 19.
[AWS] IAM ์ด๋ž€? IAM ์ด๋ž€? AWS IAM์€ AWS Identity and Access Management์˜ ์•ฝ์ž๋กœ, AWS ๊ณ„์ • ๋‚ด์—์„œ ๋ฆฌ์†Œ์Šค์— ๋Œ€ํ•œ ์ ‘๊ทผ ๊ถŒํ•œ์„ ๊ด€๋ฆฌํ•˜๋Š” ์„œ๋น„์Šค์ž…๋‹ˆ๋‹ค. ์ด ์„œ๋น„์Šค๋ฅผ ํ†ตํ•ด ์‚ฌ์šฉ์ž๋“ค์€ AWS ๋ฆฌ์†Œ์Šค์— ๋Œ€ํ•œ ์ ‘๊ทผ์„ ์ œ์–ดํ•˜๊ณ , ๋ณด์•ˆ์„ ๊ฐ•ํ™”ํ•˜๋ฉฐ, ๋ฆฌ์†Œ์Šค ์‚ฌ์šฉ์„ ๋ชจ๋‹ˆํ„ฐ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. IAM์ด ์ œ๊ณตํ•˜๋Š” ๊ธฐ๋Šฅ IAM์€ AWS ๋ฆฌ์†Œ์Šค์— ๋Œ€ํ•œ ์ ‘๊ทผ์„ ๊ด€๋ฆฌํ•˜๊ณ  ๋ณด์•ˆ์„ ๊ฐ•ํ™”ํ•˜๋Š”๋ฐ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ์ ์ ˆํ•œ ๊ถŒํ•œ์„ ์„ค์ •ํ•˜๊ณ  ์‚ฌ์šฉ์ž์˜ ์—ญํ• ์„ ๊ด€๋ฆฌํ•จ์œผ๋กœ์จ ๋ฐ์ดํ„ฐ ์œ ์ถœ ๋ฐ ๋ณด์•ˆ ์œ„ํ˜‘์„ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž(User): AWS ๊ณ„์ •์— ์•ก์„ธ์Šคํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐœ๋ณ„ ์‚ฌ์šฉ์ž์ž…๋‹ˆ๋‹ค. ๊ฐ ์‚ฌ์šฉ์ž๋Š” ๊ณ ์œ ํ•œ ์ž๊ฒฉ ์ฆ๋ช…์„ ๊ฐ€์ง€๊ณ  ์žˆ์œผ๋ฉฐ, IAM์„ ํ†ตํ•ด ๊ทธ๋“ค์˜ ๊ถŒํ•œ๊ณผ ๊ทœ์น™์„ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฃน(Group): ๊ทธ๋ฃน.. 2024. 2. 19.
[AWS] Pyhton boto3 ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์‚ฌ์šฉ boto3 ๋ž€? boto3๋Š” ํŒŒ์ด์ฌ์—์„œ Amazon Web Services(AWS)๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•œ ๊ณต์‹ SDK(์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ํ‚คํŠธ)์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด AWS์˜ ๋‹ค์–‘ํ•œ ์„œ๋น„์Šค๋ฅผ ๊ด€๋ฆฌํ•˜๊ณ  ์ œ์–ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฃผ๋กœ ํด๋ผ์šฐ๋“œ ์„œ๋น„์Šค๋ฅผ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๋ฐฉ์‹์œผ๋กœ ๋‹ค๋ฃจ๋Š” ๋ฐ์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. boto3๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด EC2 ์ธ์Šคํ„ด์Šค ์ƒ์„ฑ, S3 ๋ฒ„ํ‚ท ๊ด€๋ฆฌ, DynamoDB ํ…Œ์ด๋ธ” ์กฐ์ž‘, Lambda ํ•จ์ˆ˜ ๋ฐฐํฌ ๋“ฑ์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. boto3 ์„ค์น˜ํ•˜๊ธฐ ๋จผ์ € boto3๋ฅผ ์„ค์น˜ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ pip๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์„ค์น˜ํ•ฉ๋‹ˆ๋‹ค. pip install boto3 ์‚ฌ์šฉ๋ฒ• ์˜ˆ์‹œ ์•„๋ž˜ ์˜ˆ์‹œ๋Š” S3 ๋ฒ„ํ‚ท์„ ๋งŒ๋“ค๊ณ  ๋ชฉ๋ก์„ ๋‚˜์—ดํ•˜๋Š” ๊ฐ„๋‹จํ•œ boto3 ์‚ฌ์šฉ๋ฒ•์ž…๋‹ˆ๋‹ค. import boto3 # AWS ์ธ์ฆ ์„ค์ • s3 = boto3.resou.. 2024. 2. 16.
[AWS] Redshift ๋ž€? Redshift ๋ž€? Amazon Redshift๋Š” ํด๋ผ์šฐ๋“œ์—์„œ ์™„๋ฒฝํ•˜๊ฒŒ ๊ด€๋ฆฌ๋˜๋Š” ํŽ˜ํƒ€๋ฐ”์ดํŠธ๊ธ‰ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค ์„œ๋น„์Šค์ž…๋‹ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‹ ์†ํ•˜๊ฒŒ ๋ถ„์„ํ•˜๊ณ  ์ฟผ๋ฆฌ(๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ •๋ณด๋ฅผ ์š”์ฒญํ•˜๋Š” ์ผ)ํ•  ์ˆ˜ ์žˆ๋„๋ก ์„ค๊ณ„๋œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์ž…๋‹ˆ๋‹ค. ์•„๋งˆ์กด ์›น ์„œ๋น„์Šค(AWS)์—์„œ ์ œ๊ณต๋˜๋ฉฐ, ๊ณ ์„ฑ๋Šฅ์˜ ์ปดํ“จํŒ… ๋ฆฌ์†Œ์Šค๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Redshift ํŠน์ง• Amazon Redshift๋Š” ๋›ฐ์–ด๋‚œ ํ™•์žฅ์„ฑ๊ณผ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•˜์—ฌ ๋Œ€์šฉ๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋น„์ฆˆ๋‹ˆ์Šค ๋ถ„์„ ๋ฐ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค ์šฉ๋„๋กœ ๋งŽ์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์™€ ๋ถ„์„์„ ์œ„ํ•œ ๊ฐ•๋ ฅํ•˜๋ฉด์„œ๋„ ์‚ฌ์šฉ์ž ์นœํ™”์ ์ธ ์„œ๋น„์Šค๋กœ, ๋น„์ฆˆ๋‹ˆ์Šค ๋ถ„์„ ๋ฐ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ถฉ์กฑํ•˜๋Š” ๋ฐ ๋งŽ์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ํด๋Ÿฌ์Šคํ„ฐ (Cluster): Red.. 2024. 1. 19.
728x90
๋ฐ˜์‘ํ˜•