본문 바로가기

G4dn2

EC2 G4DNlarge 인스턴스에 Tensorflow 및 Pytorch설치하기. 이번에 숙명여대 신빅해(신한은행 빅데이터 해커톤)에 멘토 및 과정 기획 설계자로 참여하며, 160개팀에 대해 EC2 학습환경을 세팅해야 하는 업무가 있었다. 160개를 하나하나 생성할 수 없었기에 AMI를 생성하여 나머지는 테라폼으로 일괄 처리하려고 계획을 세웠다. 그렇게 인공지능 서버를 구축하면서..수많은 글을 찾아보았지만 두 기술다 버전이슈가 너무 심각해서 고생을 많이했고, 성공한 버전과 설치과정을 블로그로 남기려고 한다. 먼저 내가 세팅한 환경은 아래와 같다. OS : Ubuntu 20.04 LTS GPU : RTX3090, Tesla T4등 Archi : x86_64 Cuda : 11.2 pytorch : 1.11.0+cu113 tensorflow : 2.8.0 cudnn : 11.2 이제 자세한.. 2023. 10. 12.
DNN학습에서의 AWS EC2 g4dn xlarge vs 2xlarge 성능 및 과금비교 이번 포스팅에서는 간단한 Neural Net을 활용하여 AWS EC2 g4dn의 xlarge와 2xlarge 인스턴스의 성능과 처리속도를 비교하고 모델을 학습할 때 성능이 부족하거나 과하지 않은지 확인해 적당한 인스턴스를 선택하는데 참고가 되었으면 한다. 인스턴스의 스펙과 온디맨드 요금은 다음 그림을 참고하면 된다. 두 인스턴스에서 사용하는 GPU는 Nvidia Tesla T4로 Compute Capability는 7.5로 지원하는 Cuda version은 10.x 버전 이상이고 이 글에서는 11.x 버전으로 설치할 것이다. EC2 인스턴스 생성은 OS, Instance 종류, 보안 그룹, 볼륨 용량 외에는 기본으로 설정했고 OS는 Linux 계열인 Unbuntu 20.04 LTS, Cuda, cudnn.. 2023. 4. 18.