본문 바로가기

DATA SCIENCE/Review

Monthly Book Review 04 : 쿠브플로 운영 가이드

https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=287564133 

 

쿠브플로 운영 가이드

성공적인 쿠브플로 프로젝트의 계획과 실행을 위한 실전 가이드. 머신러닝 애플리케이션에서 ‘모델을 만드는 것’은 단지 작은 과정일 뿐이다. 전체 과정에는 개발, 오케스트레이션, 배포, 포

www.aladin.co.kr

 

# 01. 추천하는 독자

이 책의 서장에서 제시하는 대상 독자에 관한 내용을 요약하면 다음과 같다.

쿠브플로 아키텍처를 구축해 실제 운영하고 있는 데브옵스 팀이나 MLOps 팀,
그리고 그들과 소통하고자 하는 데이터 사이언티스트

이 책을 빠르게 훑듯이 읽고, 정독하고, 하나씩 줄도 쳐가며 세 번 정도 읽어본 입장에서 어느정도 동의한다. 우선 이 책은 대부분 이론적인 밑바탕에 대해 충실하게 설명하고, 다양한 클라우드 환경 위에서 구축하는 법에 대해 익힐 수 있다는 장점이 있다.

일반적인 데이터 사이언티스트 입장에선 사실 어떤 프레임워크를 사용해보는데 있어 시작도 전에 이론적인 부분을 하나하나 공부하는 것은 썩 추천하는 방법은 아니나, 자칫하면 비용이 발생할 수 있다는 점에서 신중히 도전해봐야하는 영역이라는 점을 고려한다면 추천할만하다.

또한 팀 단위의 소통을 위해서 같은 '언어'와 중심이 되는 '교보재'가 있을 때의 장점을 생각하면 역시 추천할만하다.

 

 

# 02. 책의 구성

이 책은 총 8개의 챕터와 3개의 Appendix로 이뤄져 있으며, 전체적인 분량은 330페이지 정도.

제일 앞의 두 챕터에선 이론 중심으로 쿠브플로가 어떤 것인지 개론적인 내용부터 설명이 들어가는데, 사실 이 부분이 전체 책 내용에서 가장 어려운 부분이기도 하다.

세 번째 챕터에선 그 뒤에서부터 설명할 다양한 환경에서의 쿠브플로 구축을 위한 과정에서 공통적으로 고려할만한 요소들에 대해 다루고, 네 번째 챕터부턴 실제 구축을 위한 설명과 샘플 코드를 제시한다.

여기에 마지막 챕터에선 쿠브플로에서 지원하는 모델 서빙과 관리 등에 관련된 내용을 다루며 책의 내용이 마무리된다.

때문에 굳이 전체 과정을 큼지막하게 나눈다면 다음과 같이 요약할 수 있을 것 같다.

쿠브플로 개론 → 쿠브플로 구축 → 모델 배포

 

# 03. Review

이 책의 내용이 다양한 환경에서 구축과 운영을 다루고, 쿠브플로의 전반적인 이론적인 내용을 다룬다는 점은 이 책의 가장 큰 장점이자 단점일 수 있을 것 같다.

우선 단점 측면에서 보자면 전체적인 구조를 구축하는 관점에서 접근하기에, 실제 어떤 서비스를 런칭하거나 적용하는 관점에서 접근하고 이해하기에 어렵다. 이러한 이유로 쿠브플로를 사용해본 적이 없는 독자에게 첫 학습용 교재로는 어울리지 않으며, 쿠브플로 공식 홈페이지에서 제공하는 MNIST 예제를 따라해본 후 여기서 제안하는 다양한 환경에서의 구축에 적용해보는 식으로 사용하는 것을 추천한다.

장점 측면에선 쿠브플로에서 지원하는 전반적인 내용에 대해 다루기 때문에 실제 운영하는 입장에서는 꽤 유용한 참고서적으로 사용할 수 있겠다는 것이다. 다만 이러한 부분에 있어서도 쿠브플로와 같은 쿠버네티스 생태계는 빠르게 업데이트되고 대폭 수정되기도 하기에 일종의 수명이 존재할 수 있다는 문제가 존재하기는 한다.

 

# 04. 아쉬운 점 & 개선점

아쉬운 점은 이미 말했듯 다양한 환경에서의 구축에 초점을 맞춘 나머지 실제 서비스를 구축해 운영해보는 예제가 부족하다는 것이며, 이는 프레임워크나 언어를 처음 배울 때 빠르게 숙련도를 높이지 못하는 원인이 되곤 한다.

위의 이유로 나는 이 책이 일종의 쿠브플로와 같은 쿠버네티스 생태계를 다루는 시리즈가 되길 희망한다. 첫 번째 이 책을 통해 다양한 환경에서 시작 환경을 구축하는 것을 익혔으니, 실제 머신러닝 서비스를 적용하고 운영하는 예제격 교재가 나오고, 이스티오를 다루는 교재가 나오는 식으로 말이다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."