# 배경
최근의 이직과 관련해 추가적인 학습 등이 필요하다는 것을 파악하였음.
구체적으로 컴퓨터 공학적인 부분, 수학통계적 능력, 알고리즘 이해도가 있었음.
비전공자이기에 최대한 많은 것들을 접하고, 얕게라도 건드려 보고자 하였던
기존의 전략은 나쁘지 않았으나, 이제는 좀 더 하나씩 주제를 바꿔가며 깊이를 더해갈때라고 판단.
# 기존의 노력(주 평균 15h 이상)
1. 매달 최소 1~2권의 관련 도서를 읽고, 소화해내고자 하였고
2. 알고리즘 스터디를 위해 매주 월요일 코딩 테스트 문제를 풀었으며
3. 페이퍼 소화 능력을 위해 자체적인 프로젝트를 기획, 구현하거나 관련 강의를 수강(Yolo 모델 구현)
4. 연 최소 한 개 이상의 관련 자격증 취득 및 공부
5. 반기별 한 개 이상의 공모전 취득 <- 목표였으나 리서치 수준으로만 진행
# 기존의 노력 평가
1. 관련 도서의 경우, 이젠 단순히 책을 통해 배울 수 있는 머신러닝, 딥러닝 영역이 한정되기 시작
2. 보다 체계적으로 각 능력 분야를 개발해야할 필요성을 느낌
3. 즉, 기존에는 개인적인 흥미가 다소 관여되어 여러 주제를 넘나드는 공부가 이뤄졌다면 이제는 보다 중장기적인 플랜에 의거한 전략이 필요
# 새로운 전략
1. 전략을 짜기 앞서 공부할 분야를 세분화한 결과 9개로 구분되며, 다음과 같음.
- COMPUTER SCIENCE
- ML, DL
- MLops(docker, kubernetes)
- 대용량분산처리(spark, kafka, hadoop)
- STATISTICS
- 협업툴(git)
- Algorithm
- SQL
- CLOUD(aws, gcp, naver...)
2. 이 중에서 현재의 내 능력치와 2년 내 필요 수준, 현업에서 요구되는 수준 등을 고려하면 다음과 같이 정리 가능
☆ : 알긴 알지만 제대로 모름
★ : 아는 것 중 제대로 할 줄 아는 것 존재
★★ : 전반적인 구조에 대해 알고 업무에 적용가능하며, 나만의 장점이 존재
★★★ : 어디가서도 해당 분야에서 우수하다고 할 수 있을 정도
★★★★ : 업계 최고 수준
★★★★★ : SOTA 영역
분류 | 현재 실력 | 요구 수준/현업 요구 정도 | 시급성(Rank) |
COMPUTER SCIENCE | ☆ | ★★+ | 1.5+(2) |
ML, DL | ★★ | ★★★+ | 1+(3) |
MLops | ☆ | ★★+ | 1.5+(2) |
대용량분산처리 | ☆ | ★★+ | 1.5+(2) |
STATISTICS | ★ | ★★ | 1(4) |
협업툴 | ☆ | ★★ | 1.5+(2) |
Algorithm | ★☆ | ★★★+ | 2.5+(1) |
SQL | ★ | ★★+ | 1+(3) |
CLOUD | ☆ | ★★ | 1.5+(2) |
- 이렇게 어느정도 정량화한 후에는 또 다른 문제가 남았다. 바로 저 위의 능력을 하나하나씩 개발해나가기에는 너무 막연해보인다는 것.
- 기존에 자체적인 동기부여, 프로젝트 단위로 이뤄지던 것들을 상당부분 일상화해야할 필요성을 느꼈고, 그것을 위해 가장 좋은 방법인 강의를 알아봤다.
https://fastcampus.co.kr/dev_online_computer
- 이미 기존에 fastcampus 강의를 진행하고 있고, 여타 다른 서비스 등을 살펴본 결과 가장 합리적인 선택은 위 강의였다. 전체 약 140시간 과정으로 이루어져있으며, 수학/통계학/알고리즘/컴퓨터 사이언스에 이르는 과정을 한 번에 정리할 수 있다는 것이 가장 큰 장점이며, 여러 유수의 대학 강사진과 커리큘럼을 따왔다고 한다.
- 우선 당장 부족한 점이 많아 여러 스킬셋을 일괄적으로 향상시켜야 하는 내 상황으로선 가장 합리적 선택인 셈.
- 세부 과정을 보니 이미 익숙한 내용도 꽤 많아 해당 부분을 빠르게 넘긴다고 가정하면 3달 안(~2022.02 末)에 끝내는 것이 목표.
- 위 강의를 통해 이뤄내고자 하는 목표는 다음과 같다.
분류 | 현재 실력 | 강의 후 | 목표 실력(2022 末) |
COMPUTER SCIENCE | ☆ | ★☆ | ★★+ |
ML, DL | ★★ | ★★☆ | ★★★+ |
MLops | ☆ | ☆ | ★★+ |
대용량분산처리 | ☆ | ☆ | ★★+ |
STATISTICS | ★ | ★★ | ★★ |
협업툴 | ☆ | ☆ | ★★ |
Algorithm | ★☆ | ★★ | ★★★+ |
SQL | ★ | ★ | ★★+ |
CLOUD | ☆ | ☆ | ★ |
- 2022년 말까지 최소 14개의 별을 채워야하는 상황이며, 해당 강의를 위해 3개월의 시간을 배분하였고 3개의 별을 얻도록 하는 것이 목표이며, 이 과정을 마친 다음으로는 MLops나 대용량분산처리쪽에 좀 더 집중할 계획이다.
3. 전체적인 계획
- 위에서 설명한 바대로 매달 최소 1개 이상의 별을 얻도록 하는 것이 목표이며, 이를 위해 위의 강의를 3개월 동안 진행하고, 대용량분산처리 및 MLops와 관련된 책들을 통해 기본기를 쌓는 것이 목표.
- 내년에는 올해 이직을 위해 미뤄놨던 AWS machine learning 관련 자격증이나 SQL을 좀더 심화적으로 다룰 수 있는 SQLP 시험을 위의 강의와 별개로 준비 및 학습할 예정.
- 올해의 경험에 비추어보건데 사실 위의 과정을 충실히 수행하는 것만으로도 주 15~20시간(이 이상 시간을 투자하기 시작하면 아직 내 수준에선 롱런하기 어려운 영역으로 넘어가는 것 같다)의 시간이 필요할 것이기에, 추가적인 시간이 남지는 않을 것 같지만 만약 추가적인 시간이 남는다면 기타 공모전 등에 참여해보는 것도 좋을 것 같다.
'DATA SCIENCE > Study' 카테고리의 다른 글
Error: failed to download version index (0) | 2021.12.29 |
---|---|
윈도우11 WSL2 default setting - 1(linux 버전 확인) (0) | 2021.12.29 |
Apache Spark 시작하기 (0) | 2021.09.08 |
빅분기 실기 시험 리뷰 (0) | 2021.06.19 |
머신러닝 관련 기초지식 : epoch / batch_size / iteration / dataset (0) | 2021.05.25 |