본문 바로가기
AWS/SAA 준비

AWS SAA 합격으로 가는 길 #145

by Pacloud 2025. 12. 29.
반응형

안녕하세요! 넥스트클라우드의 테크니컬 트레이너 김유림입니다. 😊

오늘 블로그는 올해의 마지막 SAA 포스팅입니다. 마지막 포스팅을 맡게 되어 영광이에요.

신년이라는 이름으로 많이 어수선하겠지만, 오늘 공부도 화이팅입니다.

 

 

문제는  가지 단계를 거치며 풀어가겠습니다.

1. 문제의 요구사항 분석하기

2. 관련 AWS 서비스 생각하기

3. 선택지 분석하기

 

바로 문제 풀이 시작합니다.


문제1

회사의 보고 시스템은 매일 수백 개의 .csv 파일을 Amazon S3 버킷에 전달합니다. 회사는 이러한 파일을 Apache Parquet 형식으로 변환하고 변환된 데이터 버킷에 파일을 저장해야 합니다.

최소한의 개발 노력으로 이러한 요구 사항을 충족하는 솔루션은 무엇입니까?

 

선택지

A. Apache Spark가 설치된 Amazon EMR 클러스터를 생성합니다. 데이터를 변환하는 Spark 애플리케이션을 작성합니다. EMRFS(EMR 파일 시스템)를 사용하여 변환된 데이터 버킷에 파일을 씁니다.

B. AWS Glue 크롤러를 생성하여 데이터를 검색합니다. AWS Glue 추출, 변환 및 로드(ETL) 작업을 생성하여 데이터를 변환합니다. 출력 단계에서 변환된 데이터 버킷을 지정합니다.

C. AWS Batch를 사용하여 Bash 구문으로 작업 정의를 생성하여 데이터를 변환하고 데이터를 변환된 데이터 버킷으로 출력합니다. 작업 정의를 사용하여 작업을 제출합니다. 어레이 작업을 작업 유형으로 지정합니다.

D. 데이터를 변환하고 변환된 데이터 버킷으로 데이터를 출력하는 AWS Lambda 함수를 생성합니다. S3 버킷에 대한 이벤트 알림을 구성합니다. 이벤트 알림의 대상으로 Lambda 함수를 지정합니다.


풀이

이 문제는 CSV 파일을 Parquet 형식으로 변환하는 ETL 작업을 최소 개발 노력으로 구현하는 것이 핵심입니다. AWS Glue는 서버리스 ETL 서비스로 크롤러가 자동으로 스키마를 파악하고, ETL 작업이 코드 생성 및 데이터 변환을 자동화하여 개발 노력을 최소화합니다. EMR이나 Lambda는 직접 코드 작성이 필요하고, Batch는 ETL 전용 서비스가 아닙니다.

 

정답 : B

 

▼ 자세한 문제 풀이를 원하신 분은 아래 더보기를 통해 확인해 주세요.

더보기

1.  문제의 요구사항 분석하기

  • 매일 수백 개의 CSV 파일을 S3에서 처리
  • CSV를 Apache Parquet 형식으로 변환해야 하며 변환된 파일을 별도의 S3 버킷에 저장
  • 최소한의 개발 노력으로 구현

2. 관련 AWS 서비스 생각하기

  • AWS Glue : 완전 관리형 서버리스 ETL 서비스로, 데이터 검색, 변환, 로드 작업을 자동화합니다. Glue 크롤러는 S3의 데이터를 자동으로 스캔하여 스키마를 파악하고 데이터 카탈로그를 생성합니다. Glue ETL 작업은 Apache Spark 기반으로 동작하며, 시각적 인터페이스나 자동 생성된 코드로 데이터 변환을 수행합니다. CSV, JSON, Parquet 등 다양한 포맷 간 변환을 기본 지원하며, 인프라 관리가 필요 없습니다.
  • Amazon EMR : Hadoop, Spark 등 빅데이터 프레임워크를 실행하는 관리형 클러스터 플랫폼입니다. 클러스터 구성, Spark 애플리케이션 개발, EMRFS 설정 등 직접적인 개발과 관리가 필요합니다. 대규모 복잡한 데이터 처리에는 적합하지만, 단순 포맷 변환에는 과도한 설정이 필요합니다.
  • AWS Lambda : 서버리스 함수 실행 서비스로, 이벤트 기반으로 코드를 실행합니다. 실행 시간 제한(최대 15분), 메모리 제한(최대 10GB), 임시 스토리지 제한(최대 10GB) 등의 제약이 있어 대용량 파일 처리에는 부적합합니다. 수백 개의 파일을 처리하려면 복잡한 오케스트레이션이 필요합니다.
  • AWS Batch : 배치 컴퓨팅 작업을 실행하는 서비스로, Docker 컨테이너 기반으로 작업을 수행합니다. 작업 정의, 컨테이너 이미지 생성, 데이터 변환 로직 구현 등 직접 개발이 필요합니다. ETL 전용 서비스가 아니므로 데이터 포맷 변환에 최적화되어 있지 않습니다.

3. 선택지 분석하기

A. Apache Spark가 설치된 Amazon EMR 클러스터를 생성합니다. 데이터를 변환하는 Spark 애플리케이션을 작성합니다. EMRFS(EMR 파일 시스템)를 사용하여 변환된 데이터 버킷에 파일을 씁니다.

→ 클러스터 관리와 Spark 애플리케이션 개발이 필요하여 개발 노력이 큰 선택지입니다.

 

B. AWS Glue 크롤러를 생성하여 데이터를 검색합니다. AWS Glue 추출, 변환 및 로드(ETL) 작업을 생성하여 데이터를 변환합니다. 출력 단계에서 변환된 데이터 버킷을 지정합니다.

→ Glue는 서버리스 ETL 서비스로 자동 스키마 파악 및 코드 생성으로 개발 노력 최소화을 최소화하는 적절한 선택지입니다.

 

C. AWS Batch를 사용하여 Bash 구문으로 작업 정의를 생성하여 데이터를 변환하고 데이터를 변환된 데이터 버킷으로 출력합니다. 작업 정의를 사용하여 작업을 제출합니다. 어레이 작업을 작업 유형으로 지정합니다.

→ 컨테이너 이미지와 변환 로직을 직접 작성해야 하며 ETL 전용이 아닙니다.

 

D. 데이터를 변환하고 변환된 데이터 버킷으로 데이터를 출력하는 AWS Lambda 함수를 생성합니다. S3 버킷에 대한 이벤트 알림을 구성합니다. 이벤트 알림의 대상으로 Lambda 함수를 지정합니다.

→ 실행 시간 및 메모리 제한으로 대용량 파일 처리에 부적합합니다.


 

이어서 다음 문제입니다.


문제2

회사에는 온프레미스에 여러 Windows 파일 서버가 있습니다. 이 회사는 파일을 Windows File Server 파일 시스템용 Amazon FSx로 마이그레이션하고 통합하려고 합니다. 액세스 권한이 변경되지 않도록 하려면 파일 권한을 보존해야 합니다.

이러한 요구 사항을 충족하는 솔루션은 무엇입니까? (두 가지를 선택하세요.)

 

선택지

A. 온프레미스에 AWS DataSync 에이전트를 배포합니다. 데이터를 FSx for Windows 파일 서버 파일 시스템으로 전송하도록 DataSync 작업을 예약합니다.

B. AWS CLI를 사용하여 각 파일 서버의 공유를 Amazon S3 버킷에 복사합니다. 데이터를 FSx for Windows File Server 파일 시스템으로 전송하도록 AWS DataSync 작업을 예약합니다.

C. 각 파일 서버에서 드라이브를 제거합니다. Amazon S3로 가져오기 위해 드라이브를 AWS로 배송합니다. 데이터를 FSx for Windows File Server 파일 시스템으로 전송하도록 AWS DataSync 작업을 예약합니다.

D. AWS Snowcone 디바이스를 주문합니다. 장치를 온프레미스 네트워크에 연결합니다. 디바이스에서 AWS DataSync 에이전트를 시작합니다. 데이터를 FSx for Windows 파일 서버 파일 시스템으로 전송하도록 DataSync 작업을 예약합니다.

E. AWS Snowball Edge Storage Optimized 디바이스를 주문합니다. 장치를 온프레미스 네트워크에 연결합니다. AWS CLI를 사용하여 디바이스에 데이터를 복사합니다. Amazon S3로 가져오기 위해 디바이스를 AWS로 반송합니다. 데이터를 FSx for Windows File Server 파일 시스템으로 전송하도록 AWS DataSync 작업을 예약합니다.


풀이

이 문제는 Windows 파일 서버의 파일 권한(ACL, 메타데이터)을 보존하면서 FSx for Windows로 마이그레이션하는 것이 핵심입니다. AWS DataSync는 Windows 파일 권한을 자동으로 보존하는 기능을 제공하며, 온프레미스에 직접 에이전트를 배포하거나 Snowcone 디바이스의 에이전트를 사용할 수 있습니다.

 

정답 : A, D

 

▼ 자세한 문제 풀이를 원하신 분은 아래 더보기를 통해 확인해 주세요.

더보기

1.  문제의 요구사항 분석하기

  • 온프레미스 여러 Windows 파일 서버를 FSx for Windows로 마이그레이션
  • Windows 파일 권한(ACL, 메타데이터)을 반드시 보존
  • 마이그레이션 후에도 액세스 권한이 변경되지 않아야 함
  • 여러 파일 서버를 하나의 FSx 파일 시스템으로 통합

2. 관련 AWS 서비스 생각하기

  • AWS DataSync : 온프레미스와 AWS 간 데이터 전송을 자동화하는 서비스로, Windows 파일 시스템의 ACL, 타임스탬프, 소유권 등 메타데이터를 자동으로 보존합니다. DataSync 에이전트를 온프레미스에 배포하거나 Snowcone 디바이스에서 실행할 수 있으며, SMB 프로토콜을 통해 Windows 파일 서버에 직접 연결됩니다. FSx for Windows File Server로의 직접 전송을 지원하며, 네트워크 대역폭 조절, 일정 예약, 증분 전송 등의 기능을 제공합니다.
  • AWS Snowcone : 8TB 스토리지를 제공하는 소형 엣지 컴퓨팅 및 데이터 전송 디바이스입니다. DataSync 에이전트가 사전 설치되어 있어 온프레미스에서 직접 데이터를 수집하고 AWS로 전송할 수 있습니다. 네트워크 대역폭이 제한적이거나 보안상 직접 연결이 어려운 환경에 적합합니다.

3. 선택지 분석하기

A. 온프레미스에 AWS DataSync 에이전트를 배포합니다. 데이터를 FSx for Windows 파일 서버 파일 시스템으로 전송하도록 DataSync 작업을 예약합니다.

→ DataSync가 Windows 파일 권한을 자동 보존하며 FSx로 직접 전송할 수 있게 합니다.

 

B. AWS CLI를 사용하여 각 파일 서버의 공유를 Amazon S3 버킷에 복사합니다. 데이터를 FSx for Windows File Server 파일 시스템으로 전송하도록 AWS DataSync 작업을 예약합니다.

→ S3 복사 시 Windows ACL 정보가 손실되어 권한 보존이 불가능합니다.

 

C. 각 파일 서버에서 드라이브를 제거합니다. Amazon S3로 가져오기 위해 드라이브를 AWS로 배송합니다. 데이터를 FSx for Windows File Server 파일 시스템으로 전송하도록 AWS DataSync 작업을 예약합니다.

→ 물리적 드라이브 배송 방식은 메타데이터 보존이 복잡하고 비현실적입니다.

 

D. AWS Snowcone 디바이스를 주문합니다. 장치를 온프레미스 네트워크에 연결합니다. 디바이스에서 AWS DataSync 에이전트를 시작합니다. 데이터를 FSx for Windows 파일 서버 파일 시스템으로 전송하도록 DataSync 작업을 예약합니다.

→ Snowcone의 DataSync 에이전트가 권한을 보존하며 오프라인으로 전송할 수 있게 합니다.

 

E. AWS Snowball Edge Storage Optimized 디바이스를 주문합니다. 장치를 온프레미스 네트워크에 연결합니다. AWS CLI를 사용하여 디바이스에 데이터를 복사합니다. Amazon S3로 가져오기 위해 디바이스를 AWS로 반송합니다. 데이터를 FSx for Windows File Server 파일 시스템으로 전송하도록 AWS DataSync 작업을 예약합니다.

→ Snowball Edge는 DataSync를 지원하지 않고 S3 경유로 권한이 손실됩니다.


 

마지막 문제 살펴보겠습니다.


문제3

회사에는 AWS Organizations 조직의 일부로 5개의 조직 단위(OU)가 있습니다. 각 OU는 회사가 소유한 5개 비즈니스와 연관되어 있습니다. 회사의 연구개발(R&D) 사업이 회사에서 분리되어 자체 조직이 필요할 것입니다. 솔루션 설계자는 이 목적을 위해 별도의 새 관리 계정을 생성합니다.

솔루션 설계자는 새 마스터 계정에서 다음에 무엇을 수행해야 합니까?

 

선택지

A. 전환하는 동안 R&D AWS 계정이 두 조직의 일부가 되도록 하십시오.

B. R&D AWS 계정이 이전 조직을 떠난 후 R&D AWS 계정을 새 조직의 일부로 초대합니다.

C. 새 조직에 새 R&D AWS 계정을 생성합니다. 이전 R&D AWS 계정의 리소스를 새 R&D AWS 계정으로 마이그레이션합니다.

D. R&D AWS 계정이 새 조직에 가입하도록 합니다. 새 마스터 계정을 이전 조직의 구성원으로 만드세요.


풀이

이 문제는 AWS Organizations에서 계정을 다른 조직으로 이동하는 프로세스를 이해하는 것이 핵심입니다. AWS 계정은 한 번에 하나의 조직에만 속할 수 있으므로, 기존 조직에서 먼저 탈퇴한 후 새 조직으로 초대해야 합니다. 두 조직에 동시에 속하는 것은 불가능하며, 계정 자체를 이동하는 것이 리소스를 마이그레이션하는 것보다 효율적입니다.

 

정답 : B

 

▼ 자세한 문제 풀이를 원하신 분은 아래 더보기를 통해 확인해 주세요.

더보기

1.  문제의 요구사항 분석하기

  • 기존 조직의 R&D OU에 속한 AWS 계정을 분리
  • 새로운 독립적인 조직으로 R&D 계정을 이동
  • R&D 계정을 새 조직의 일부로 만들어야 함

2. 관련 AWS 서비스 생각하기

  • AWS Organizations : 여러 AWS 계정을 중앙에서 관리하는 서비스로, 계정 그룹화, 정책 적용, 통합 결제 등을 제공합니다. 조직은 하나의 관리 계정(마스터 계정)과 여러 멤버 계정으로 구성됩니다. 각 AWS 계정은 동시에 하나의 조직에만 속할 수 있으며, 조직 간 이동 시 반드시 기존 조직에서 탈퇴 후 새 조직에 가입해야 합니다.

3. 선택지 분석하기

A. 전환하는 동안 R&D AWS 계정이 두 조직의 일부가 되도록 하십시오.

→ AWS 계정은 동시에 두 조직에 속할 수 없으므로 기술적으로 불가능합니다.

 

B. R&D AWS 계정이 이전 조직을 떠난 후 R&D AWS 계정을 새 조직의 일부로 초대합니다.

→ 올바른 계정 이동 프로세스로 먼저 탈퇴 후 초대하는 방식은 올바른 방법입니다.

 

C. 새 조직에 새 R&D AWS 계정을 생성합니다. 이전 R&D AWS 계정의 리소스를 새 R&D AWS 계정으로 마이그레이션합니다.

→ 불필요하게 복잡하며 기존 계정을 이동하는 것이 더 효율적입니다.

 

D. R&D AWS 계정이 새 조직에 가입하도록 합니다. 새 마스터 계정을 이전 조직의 구성원으로 만드세요.

→ 관리 계정은 다른 조직의 멤버가 될 수 없으며 논리적으로 잘못되었습니다.


 

 

이번 주도, 그리고 연말의 마무리까지 화이팅입니다.

새해 복 많이 받으세요 😊

'AWS > SAA 준비' 카테고리의 다른 글

AWS SAA 합격으로 가는 길 #147  (0) 2026.01.05
AWS SAA 합격으로 가는 길 #146  (0) 2026.01.02
AWS SAA 합격으로 가는 길 #144  (1) 2025.12.26
AWS SAA 합격으로 가는 길 #143  (0) 2025.12.22
AWS SAA 합격으로 가는 길 #142  (0) 2025.12.19