본문 바로가기

DATA SCIENCE/Review

(19)
Monthly Book Review 08 : 비즈니스 데이터 과학 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=296868256 비즈니스 데이터 과학 비즈니스 분야에서 자주 언급되는 문제와 관련된 통계학, 경제학 개념 및 빅데이터 기술을 소개한다. 이 책에는 아마존과 마이크로소프트에서 데이터 과학팀을 이끌고 시카고 대학교에서 계량 www.aladin.co.kr 01. Summary 이 책은 학문적이며, 실용적이다. 각각의 챕터를 통해 문제를 풀기 위한 고민, 분석한 결과에 대한 해석, 이러한 해석을 기반으로 보완할 수 있는 방법을 제시하고, 그 결과와 성능을 보인다. R을 베이스로 한다. 전체적으로 문제에 대한 소개 > 관련 이론과 논문에 대한 설명 > 통계학적 분석과 해석 > R 코드를 통한 실행과 추가적인 분석을 바탕으..
Monthly Book Review 07 : XGBoost와 사이킷런을 활용한 그레이디언트 부스팅 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=292185214 XGBoost와 사이킷런을 활용한 그레이디언트 부스팅 기본적인 머신러닝과 판다스부터 사용자 정의 변환기, 파이프라인과 희소 행렬로 새로운 데이터의 예측을 만드는 강력한 XGBoost 모델 튜닝까지 모두 다룬다. 또한 XGBoost의 탄생 배경과 XGBoost를 www.aladin.co.kr 01. 이 책을 고른 이유 최근에는 딥러닝이 아닌 머신러닝에 대한 필요성이 생겼지만, 더이상 단순히 초급자용 책으로 이런저런 책에서 반복적으로 제시하는 내용 외 진짜 도움이 되는 책이 읽고 싶어졌다. Xgboost는 그 중에서 빼놓을 수 없는 방법론이고, 가장 즐겨 사용하는 라이브러리이기에 좀 더 세부적으로 익..
Monthly Book Review 06 : 파이썬을 활용한 금융 분석(2판) https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=291695905 파이썬을 활용한 금융 분석 현재 파이썬은 데이터와 인공지능이 주도하는 금융 분석 분야에서 대표적인 프로그래밍 언어로 사용되고 있다. 이 책에서는 다양한 파이썬 패키지와 도구를 사용하여 금융 데이터 과학, 알고리 www.aladin.co.kr 01. 이 책을 고른 이유 이 책을 고른 이유를 간단히 설명하자면, 위 그림에서 볼 수 있듯 [2판]이 발행된 것에 있다. 파이썬 3점대 버전을 사용할 수 있게 되었고, 금융공학을 전문하지 않은 독자들을 위한 양이 대폭 늘어났다. 파이썬은 그 언어 특징상 비전공자들이 사용하기도 하며, 이론과 구조를 하나하나 배워가며 실습을 하기보다 실습을 하며 이론과 구조를 ..
Monthly Book Review 05 : 파이썬 라이브러리를 활용한 머신러닝 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=289735220 파이썬 라이브러리를 활용한 머신러닝 사이킷런의 핵심 개발자가 복잡한 수학을 동원하지 않고 실용적으로 머신러닝을 구축하는 모든 단계를 설명한다. 미적분, 선형대수, 확률 이론을 공부하지 않았어도 이 책을 통해 머신러닝을 www.aladin.co.kr 1. 이 책을 고른 이유 이 책의 표지에만 해도 AI에 관심을 갖는 사람이라면 흥미가 생길 문구가 무려 두 개나 있다. 첫 번째는 '사이킷런 핵심 개발자가 쓴', 그리고 두 번째는 '사이킷런 1.x' 반영이라는 부분. 인공지능에 대해 공부를 하는 학생이든, 현업에 종사하고 있는 실무자든 저 두 문구를 보고 매력을 느끼지 않을 수 있을까싶다. 2. 간단한..
Monthly Book Review 04 : 쿠브플로 운영 가이드 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=287564133 쿠브플로 운영 가이드 성공적인 쿠브플로 프로젝트의 계획과 실행을 위한 실전 가이드. 머신러닝 애플리케이션에서 ‘모델을 만드는 것’은 단지 작은 과정일 뿐이다. 전체 과정에는 개발, 오케스트레이션, 배포, 포 www.aladin.co.kr # 01. 추천하는 독자 이 책의 서장에서 제시하는 대상 독자에 관한 내용을 요약하면 다음과 같다. 쿠브플로 아키텍처를 구축해 실제 운영하고 있는 데브옵스 팀이나 MLOps 팀, 그리고 그들과 소통하고자 하는 데이터 사이언티스트 이 책을 빠르게 훑듯이 읽고, 정독하고, 하나씩 줄도 쳐가며 세 번 정도 읽어본 입장에서 어느정도 동의한다. 우선 이 책은 대부분 이론적..
Monthly Book Review 03 : 혼자 공부하는 SQL #한빛미디어의 신간 서평 이벤트에 당첨되어 책을 제공받아 작성한 리뷰입니다. https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=282031508 혼자 공부하는 SQL 아무런 사전 지식 없는 입문자가 ‘꼭 필요한 내용을 제대로’ 학습할 수 있도록 구성했다. ‘무엇을’, ‘어떻게’ 학습해야 할지조차 모르는 입문자의 막연한 마음을 살펴, 과외 선생님이 알 www.aladin.co.kr 00. 리뷰 요약 1. 책의 내용은 SQL 전반에 걸친 내용이 빠짐없이 잘 정리되어 있어, 여러 차례의 반복학습을 통해 역량을 키우기 적합하다. 2. 다만 모든 내용을 다 담으려 하다보니 책의 구성적 측면에서 아쉬움이 많고, 자칫 환경설정 등의 작업 과정에서 흥미를 잃거나 독자의 목적과 ..
Monthly Book Review 02 : 이토록 쉬운 머신러닝&딥러닝 입문 with 사이킷런+파이토치 00. 리뷰 요약 - 이 책은 굉장히 친절하다, 적어도 머신러닝&딥러닝과 관련해 유명하다 싶은 책을 지난 1년의 시간 동안 20권은 샀고, 그 중 5권 이상을 5번 이상 정독하며 코드를 따라치는 등의 학습을 했음에도 불구하고도 부족해 블로그 등을 통해 익혀야 했던 내용들까지도 포함하여 적어도 딥러닝에 대해 어느정도 경험이 있는(함수형으로 딥러닝 모델을 작성해 프로젝트를 진행해봤거나, 이를 기반으로 간단한 공모전에 제출해보며 고민해본 사람) 사람이라면 적극 추천할만한 책. - 다만 이 책의 난이도는 생각보다 일관적이진 않다. 다소 학술적 목적에서 접근한 부분이 이 책의 가장 큰 장점임과 동시에 딥러닝을 처음 접하는 사람이라면 이 책에 담겨있는 전문가용*으로 짜여진 코드 방식이 다소 어렵게 느껴질 수 있다...
강의 리뷰 01 : The Red - The RED : Hadoop & Spark 아키텍처 딥다이브 by Brandon Lee 1. 강의 소개 빅데이터, 분산처리, spark 등에 대해 관심을 가지고 있다면 한 번쯤은 instagram이나 여러 사이트 추천 알고리즘을 통해 접할 수 있는 강의였고, 강사로 등장하시는 Brandon Lee라는 분의 이력과 강의 설명에 홀린 듯 신청하게 되는 강의. 꾸준히 강의가 진행되는 식이 아닌 녹화된 강의 영상을 일정 주기로 푸는 방식으로 강의가 진행되며, 현재 전체 6개 파트 중 3개의 파트가 업로드된 상태. 다루는 주제는 하둡, Hive, Hbase, Kafka, Spark & Livy, Delta Lake. 주요 대상은 소개 사이트에 의하면 다음과 같다. 2. 강의 평가 우선 첫 번째로 해당 강의의 내용은 생각보다 그리 유익하지는 않다. 기대감이 커서일 수도 있지만, 해당 강의를 진행하시는..
Monthly Book Review 01 : 데이터 분석가의 숫자유감 골든래빗 출판사로부터 책을 제공받아 작성했습니다. https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=276662690 데이터 분석가의 숫자유감 직장에서 흔히 발생하는, 데이터를 오해하면서 일어나는 에피소드를 만화와 글로 담았다. 그래서 재미도 있고 지식도 있다. 인과관계와 상관관계, A / B 테스트, 평균값 등 데이터 시대에 직장인 www.aladin.co.kr 00. 리뷰 요약 - 디지털 마케팅 or 데이터 분석가의 역할과 업무에 대해 궁금한 사람에게 추천, 만화의 형태로 아주 쉽게 이해가능하다. - 아래에서 볼 수 있듯 실제 책 소개에서도 2시간만에 300페이지에 해당하는 내용을 파악할 수 있다고 하는데, 나는 출퇴근 시간에 지하철에서 읽다보니 약 4~5일 ..