[AWS] SageMaker Studio 알아보기

Amazon SageMaker를 통해 내부 기계 학습 환경을 AWS Cloud 환경으로 옮기고, MLOps를 지원할 수 있도록 구성하는 작업을 진행 중에 있습니다. Amazon SageMaker의 Studio를 통해 웹 기반 시각적 인터페이스로 학습 데이터 준비부터 기계 학습 모델 구축, 훈련, 배포에 이르기까지 모든 기계 학습(ML) 개발 단계를 손쉽게 수행할 수 있는데요. Amazon SageMaker의 Studio가 무엇인지 좀 더 알아보는 시간을 가져보겠습니다.


주요 기능

Amazon SageMaker Studio의 주요 기능 다섯 가지는 아래와 같습니다.

  • Jupyter 노트북에서 코드 작성 및 실행
  • 기계 학습을 위한 데이터 준비
  • 기계 학습 모델 빌드 및 훈련
  • 모델 배포 및 예측 성능 모니터링
  • 기계 학습 실험의 추적 및 디버그

 

그 외의 세부적인 기능으로는 데이터로부터 모델을 자동으로 생성하는 기능인 Autopilot, 데이터 전처리 및 시각화를 위한 인터페이스를 제공하는 Data Wrangler, 모델의 관리와 버전 관리를 위한 중앙 저장소 기능인 Model Registry 등 여러가지 기능을 제공하고 있습니다.


작동 방식

작동 방식을 확인해보면 실제 학습 데이터를 준비하고 학습 시 사용할 수 있도록 저장 및 가공하는 작업을 거치게 됩니다. 그 이후에는 모델을 학습하고, 학습이 완료된 모델은 저장하여 관리하거나 실제 운영 환경에 자동으로 배포할 수 있습니다. 또한 생성된 모델을 자동으로 테스트하고, 테스트 결과를 모니터링 등을 통해 확인할 수도 있습니다.


화면

Amazon SageMaker 메인 화면에서 Studio 메뉴를 통해 접근할 수 있으며 Open Studio 버튼을 클릭하여 웹 기반 인터페이스르를 접근할 수 있습니다.

 

 

웹 기반 인터페이스에서는 Data, AutoML, Notebook jobs, Pipelines 등의 여러가지 기능을 관리할 수 있습니다.

 

 

Running Terminals and Kernels 메뉴에서는 현재 실행되고 있는 Studio Notebook과 Notebook Instance, Teminal 등을 확인하고 관리할 수 있습니다.

이 외에도 SageMaker에서 사용할 수 있는 다양한 기능들을 Studio를 통해 사용하실 수 있습니다.

 

 

지금까지 Amazon SageMaker의 Studio가 무엇인지 알아보는 시간이었습니다....! 끝...!

 

 

[Reference]

[AWS] AWS Summit Seoul 2023 2일차

오늘 AWS Summit Seoul 2023 2일차를 다녀왔습니다...! 1일차에 비해 오시는 분들이 조금 줄어들지 않을까 생각했는데요. 하지만 1일차와 거의 비슷하게 많은 분들이 참석해주신 것 같습니다. 어제인 1일차에는 산업 업종별 강연을 통해 각 서비스 업종별, 사용했던 기술별로 다양한 레퍼런스를 들을 수 있어서 너무 좋은 시간이었습니다. 

 

2일차는 기술 주제별 강연으로 EC2, 스토리지, EKS, SageMaker 등 AWS에서 제공하는 다양한 서비스와 SaaS 서비스를 통해 Public Cloud를 더욱 효과적으로 사용할 수 있도록 도와주는 Datadog, SnowFlake 등 다양한 기술을 알아가는 기회가 될 수 있었습니다.

 

기술 주제별 강연이므로 아래와 같이 입문 기술, 중급 기술, 심화 기술, 커뮤니티 등으로 강연이 나눠져 있었습니다. 저는 아직 AWS에 대해서 많이 부족하여 입문이라고 생각하지만 SageMaker, SaaS, EKS, Observability 등 다양한 기술에 관심이 있어 다양한 주제의 강연을 들었습니다.

 


기조연설은 AWS 수석 테크 에반젤리스트인 윤석찬님이 진행해주셨습니다. AWS 서버리스 컴퓨팅 부사장인 Holly님은 영상으로 Summit Seoul에 전달하고 싶은 내용을 전달해주셨으며 이후에는 Flitto CTO인 강동한님과 LG U+ 연구위원인 송주영님이 윤석찬님과 Q&A 시간을 가지면서 AWS Public Cloud에 대한 이야기를 나눴습니다.

 

기조연설에서는 윤석찬님은 On-Premise 환경에서 Public Cloud로 서비스 운영 환경이 변화하면서 어떤 부분이 많이 변화하였는가를 말씀해주셨는데요. 변화된 부분 중 가장 큰 두가지의 변화를 이벤트 기반의 아키텍처 도입과 서버리스 서비스의 사용을 말씀해주셨습니다. Lambda, Fargate, API Gateway 등 다양한 서버리스 서비스를 통한 인프라 관리 비용 절감과 처리속도 등의 장점을 설정해주셨으며 이를 이벤트 기반으로 아키텍처를 설계하여 사용한다고 말씀해주셨습니다. 마지막으로는 서버리스 기반 천만 사용자 아키텍처에 대한 설명도 해주셨습니다.

 

이후에는 윤석찬님이 MC를 진행하고 강동한님, 송주영님이 각각 스타트업, 대기업 관점으로 Public Cloud 사용에 대한 Q&A 시간을 가졌는데요. SaaS 서비스를 구축하면서 어려웠던 부분을 극복하는 과정과 SaaS 서비스를 구축하기 위해서 반드시 필요한 요소들에 대해 각자의 생각을 공유해주셨습니다.

 


아래 사진은 2일차 기술 주제별 강연이며 제가 참여한 컨퍼런스를 체크해봤습니다. 직접들을 수 있는 6개의 강연 중 4개의 강연을 듣고 나머지 시간은 Expo를 탐방하는 시간을 가졌습니다.

전체 강연 아젠다는 아래 링크를 통해 확인하실 수 있습니다.

https://pages.awscloud.com/rs/112-TZM-766/images/AWS%20Summit%20Seoul%202023%20-%20Agenda.pdf

 

 

[ Amazon EKS, 중요한건 꺽이지 않는 안정성 ]

Amazon EKS에 대한 지식이 부족했지만 kubernetes를 사용해본 경험을 통해 EKS 관련 강연을 듣게 되었습니다. 컨트롤 플레인과 데이터 플레인 각각에 대한 안정성을 설정해주셨는데요. kubernetes의 기능인 readinessProbe, livenessProbe 등을 통해 Pod의 상태를 확인하고, Pod 확장과 노드 확장인 HPA(Horizontal Pod AutoScaler), CA(Cluster Auto Scaler) 등의 오토스케일을 통해 안정성을 보장하는 것을 설명해주셨습니다. Kubernetes 클러스터 오토스케일러 오픈소스인 Karpenter에 대한 소개도 해주셨으며, Kubernetes 버전 업데이트 전략에 대해서도 설명해주셨습니다.

 

[ 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기 ]

Amazon SageMaker를 통한 MLOps를 작업하고 있어 SageMaker에 대한 기대가 높은 상태로 강연을 듣게 되었습니다.

각각의 사용자 수에 따른 MLOps 전략과 이에 따른 SageMaker 사용 방법을 설명해주셨는데요. 100만 사용자, 1000만 사용자가 넘어갔을 때의 아키텍처는 생각보다 많이 복잡했습니다. 대규모 학습, 대규모 트래픽에 따른 대응, 고성능 추론 아키텍처 등 다양한 전략이 필요함을 설멸해주셨습니다. 추가적으로 비용 절감을 위한 기계학습 전용칩 기반 인스턴스를 사용하면 좋다는 내용도 말씀해주셨습니다. SageMaker 강연을 통해 다양한 부분을 생각하면서 MLOps를 구성해야겠다는 생각을 하게되었습니다.

 

 

이후 강연을 통해서도 여러가지 지식을 얻을 수 있었습니다.

 

 

강연 이후에는 Expo를 통해 AWS Public Cloud 환경에서 SaaS 서비스를 하고 있는 다양한 기업과 서비스를 확인할 수 있었는데요. 금융, 의료, 개발도구, 모니터링, 메타버스 등 정말 다양한 분야의 서비스가 SaaS를 통해 서비스를 운영하고 있다는 것을 알게되었습니다. 언젠가는 제가 담당하는 SaaS 서비스가 출시하고 성장하면, AWS Summit Seoul과 같은 IT 컨퍼런스에 참여하는 기회가 되면 좋을 것 같습니다.

 

이틀동안 AWS Summit Seoul 2023을 통해 AWS와 Public Cloud, SaaS 등에 대한 전반적인 지식을 얻을 수 있어 좋았고, 오랜만에 오프라인 컨퍼런스에 참여하게 되어서 더욱 더 좋았습니다. 다음에도 AWS Summit Seoul과 같은 IT 컨퍼런스가 있다면 참여하여 좋은 기회가 되면 좋겠습니다...끝..!

 

 

[AWS] AWS Summit Seoul 2023 1일차

최근에 AWS SaaS Boot Camp를 참여하여 AWS와 SaaS에 대한 관심이 엄청 커진 상태에서 이번에는 AWS Summit Seoul 2023에 참여하게 되었습니다. AWS Summit Seoul은 국내 최대 IT 컨퍼런스로 코엑스 컨벤션 센터에서 5월 3일(수)~ 4일(목) 일정으로 이틀간 진행하며 이번에 9회차를 맞고, 저는 첫 번째로 참여하게 되었습니다. 다양한 분야의 전문가들과 다양한 주제로 컨퍼런스를 참여할 수 있어 기분이 좋았습니다.

 

 

코엑스 컨벤션 센터의 지하 1층부터 지상 3층까지 컨퍼런스 공간이 마련되어 있었습니다.

 

 

1층에 있는 Expo에는 다양한 전시와 체험할 수 있는 부스가 있었지만 시간이 많지 않았기 때문에 바로 기조연설을 참석하기위해 이동했습니다. 기조연설 컨퍼런스룸으로 이동하기전 그랜드볼룸 앞에는 AWS Summit Seoul 참여 횟수에 따른 랜덤 캡슐을 뽑는 부스가 있었는데요. 저는 첫 번째 참여였기 때문에 1회차 랜덤 캡슐을 뽑고 스티커를 받았습니다..!

 

아래는 랜덤으로 뽑은 스티커입니다. 다른 회차는 다른 상품이 있는지 좀 궁금하군요..ㅎㅎ

 

 


기조연설은 AWS 모니터링 및 관측성 담당 부사장인 Nandini님과 AWS Korea 대표이사 함기호님 등을 포함하여 AWS에 큰 기여를 하고 있거나 적용 사례를 가지고 있는 분들이 진행해주셨습니다.

 

기조연설은 오디토리움에서 진행되었고, 생각보다 엄청 넓은 공간이었고 준비가 잘 되어있는 것 같아 기대가 되었습니다.

기조연설은 AWS가 과거부터 어떻게 성장해왔고, 앞으로 고객들을 위해 어떤 방향으로 발전해나갈 것인지 설명해주셨습니다. 또한 AWS에 있는 다양한 서비스들을 통해 빠른 속도, 비용 절감, 고가용성 등의 이점을 살릴 수 있고, AWS를 통해 서비스 구축 시 어떤 포인트들을 생각하면서 아키텍처를 설계해야되는지 설명해주셨습니다. 기조연설을 통해 AWS의 전반적인 앞으로의 방향성과 다양한 이점에 대해서 리마인드되는 시간이었던 것 같습니다.

 


기조연설이 끝나고 이제 컨퍼런스를 듣기위해 컨퍼런스룸으로 움직였습니다. 1일차에는 산업 업종별 강연과 2일차에는 기술 주제별 강연을 이뤄져 있었습니다. 1일차에는 클라우드 네이티브, 메가트렌드, 금융 및 핀테크, 통신 및 미디어, 리테일 및 디지털커머스, 제조 및 하이테크, 공공 부문 분야가 있었고 저는 클라우드 네이티브와 메가트렌드 분야를 중점으로 컨퍼런스를 참여하였습니다.

 

아래 사진은 1일차 산업 업종별 강연 내용이며 제가 참여한 컨퍼런스를 체크해봤습니다.

전체 강연 아젠다는 아래 링크를 통해 확인하실 수 있습니다.

https://pages.awscloud.com/rs/112-TZM-766/images/AWS%20Summit%20Seoul%202023%20-%20Agenda.pdf

 

 

산업 업종별 강연이다보니 각 서비스 업종별, 사용했던 기술별로 다양한 레퍼런스를 들을 수 있어서 너무 좋은 시간이었습니다. SaaS 서비스를 준비 중이다보니 AWS Public Cloud에서 SaaS 서비스 구축를 위한 시스템 아키텍처 설계, 대규모 트레픽을 처리하기 위한 방법, 안정적인 서비스 운영 방법, Observability를 통한 FinOps 등 다양한 지식을 얻을 수 있었습니다. 또한 AI와 MLOps 등에도 관심이 많았기 때문에 Generative AI로 SaaS 서비스를 운영하고 있는 스캐터랩의 AWS 활용법 사례를 듣는 시간 또한 너무 좋은 시간이었습니다.

 

 

 

내일인 2일차에는 기술 주제별 강연입니다. SageMaker와 SaaS 서비스 관련 최적화와 관련된 컨퍼런스를 들을려고 합니다. 관련 지식을 통해 실제 SageMaker를 통한 MLOps 구축과 SaaS 서비스 준비에 많은 도움이 되었으면 하는 바람이 큽니다. 두근두근한 마음으로 AWS Summit Seoul 2023 2일차를 참여하도록 하겠습니다....!!

 

 

[AWS] Amazon SageMaker 알아보기

 

AWS의 Amazon SageMaker를 통해 기존에 물리서버에서 하고있었던 기계 학습(Machine Learning) 환경을 Public Cloud 환경에서도 구현가능한지 확인해보고, 비용 측면이나 활용도 측면에서도 정말 좋은지 확인해보고자 작업을 진행하고 있습니다. Amazon SageMaker를 활용하기 위해 좀 더 알아본 내용과 AWS SageMaker 교육을 통해 알아본 내용을 같이 정리해보았습니다.

 

 

개요

Amazon SageMaker는 AWS에서 2017년 11월에 출시된 Cloud 기계 학습(Machine Learning) 서비스 입니다.

 

SageMaker를 사용하면 개발자가 Cloud 환경에서 기계 학습 모델을 생성, 학습 및 배포할 수 있습니다. 기계 학습을 위해 다양한 언어를 지원할 뿐만 아니라 학습 환경 구성, 학습, 배포하기 위한 pipeline을 제공하여 MLOps를 구현할 수도 있습니다. EC2에서 사용가능한 다양한 GPU 인스턴스를 제공하여 적합한 사양의 서버를 사용하여 기계 학습 시 사용할 수 있습니다. 제품 추천, 개인화, 지능형 쇼핑, 로봇 공학, 음성 지원 디바이스를 포함하여 20년에 걸친 Amazon의 실제 기계 학습 애플리케이션 개발 경험에 기반하여 구축된 서비스입니다.

 

 

사용 효과

아래 이미지는 AWS의 자료로 Amazon SageMaker를 사용하면 다양한 사용 효과를 얻을 수 있다고 합니다.

  • TCO(Total Cost of Ownership) : IT 인프라를 구매, 설치, 실행 및 유지 관리하는 과정에서 발생하는 모든 비용

개인적인 생각으로는 AWS의 GPU 인스턴스의 가격이 저렴하진 않기 때문에 비용적인 측면은 많은 고민이 필요할 것 같지만, MLOps를 구현한다면 팀 생산성 증가와 자동화로 인한 비용 감소를 예측할 수 있을 것 같다는 생각이 듭니다.

 

 

다양한 지원

선도적인 기계 학습 프레임워크, 도구 키트 및 프로그래밍 언어 등 다양한 지원을 통해 더욱 자유롭고 효율적으로 Amazon SageMaker를 사용할 수 있도록 지원하고 있습니다.

프로그래밍 언어 같은 경우에는 다양한 언어를 지원하지만 내부적으로 python을 기준으로 동작한다고하니 참고하시면 좋을 것 같습니다.

 

 

다양한 기능

기계 학습에 기본적으로 필요한 Train, Pipelines, Deploy 등 뿐만 아니라 기계 학습 환경을 자유롭고, 간단하게 구성하기 위한 Notebooks, Model Monitor, Studio, Feature Store, Automatic Model Tuning 등 다양한 기능을 제공하고 있습니다.

  • Amazon SageMaker Features

다양한 기능을 사용하여 최적의 학습 환경 및 MLOps를 구축할 수 있을 것 같습니다.

 

사용 고객

아래 이미지는 AWS의 자료로 Amazon SageMaker를 해외 기업뿐만 아니라 국내 기업에서도 Amazon SageMaker를 많이 사용하고 있는 것을 확인하실 수 있습니다.

AWS 기술 블로그에서는 Amazon SageMaker를 사용하여 모델을 개발하거나, 어떤식으로 사용하였는지 다양한 정보를 확인하실 수 있습니다.

 

[ Amazon SageMaker로 컬리(Kurly) 상품 후기 분류 모델 개발하기 ]

[ 농심의 Amazon SageMaker를 활용한 원자재 가격예측과 MLOps 여정 ]

 

 

 

지금까지 Amazon SageMaker가 어떤 것인지 알아본 내용을 정리해봤는데요. 실제 Amazon SageMaker를 사용해보면서 어떻게 사용하고 활용할 수 있는지 차차 정리해보도록 하겠습니다. 그럼 이만...! 끝...!

 

 

 

[Reference]

+ Recent posts