카테고리 없음

[DataScientist 첫걸음] Step 1. 데이터 사이언티스트 될 수 있을까?

leadbreak 2020. 10. 23. 12:03

요즘 정부교육부터, 패스트 캠퍼스 등등 데이터 사이언스와 분석에 대해 많은 관심이 늘어나고 있습니다.

 

저도 그 중 하나인데요, 조금 먼저 비슷한 길을 걷고 있는 입장으로서 혹여나 저와 같은 고민을 한 분이 있다면 도움이 되길 바라는 느낌으로 새로운 메뉴를 만들었습니다.

 

해당 [EDUCATOIN] 메뉴를 통해 추후 데이터 사이언티스트로서 도전해보기 전에 적성검사 내지는 어떤 업무를 하는지 완전 기초부터 하나씩 해보는 과정을 업로드해보겠습니다.

 

이번 글에서는 간략히 데이터분석가와 데이터 사이언티스트에 대해서 설명해보겠습니다.

 

우선 이러한 직종은 기존의 개발자와는 다르다는 것을 아셔야 합니다.

물론 위에서 언급한 데이터 관련 직종이 새로이 생겨나는 직종인만큼 현재 많은 개발자 혹은 개발자 출신분들이 이러한 역할을 겸하거나 이직해서 하시는 경우가 많습니다.

 

하지만 엄밀히 말해 두 직종은 차이가 있습니다.

나무를 벌목하는 전기톱이라는 도구를 통해 예를 들어보면

 

개발자는 제한된 자원을 활용해 최선의 전기톱을 만드는 일을 합니다. 단순히 그뿐 아니라 나무를 저장하는 창고와 같은 여러 가지를 직접 설계하고 만들고, 디자인합니다.

개발자들은 특정 도구가 어떤 식으로 움직이고, 작동하는지 이해해야하는 경우가 많습니다.

적어도 그것을 개발하는 동안에는 말이죠.

 

그리고 데이터 사이언티스트는 이러한 전기톱을 사용하는 법을 배웁니다. 그것을 위해 대략적인 원리와 같은 것을 배우기는 하지만, 그 내부가 어떻게 설계되어 있는지는 잘 모르는 경우가 많습니다.  그저 어디서 어떻게 이 전기톱을 사용해야 효율적으로 효과적으로 사용할 수 있는지를 연구하고 전략을 제안합니다.

 

때문에 데이터 사이언티스트는 맡은 분야가 어디냐에 따라 해당 분야에 대한 지식을 필요로 합니다(이를 도메인 지식이라고 합니다).

전기톱을 사용할 때, 해당 벌목 작업의 목적이 최대한 많은 나무를 최단 시간에 벌목하는 것이 목적인지 아니면 자연경관을 최대한 보존하면서 균형감있게 벌목하는 것인지부터

어떤 나무를 하루에 얼마만큼씩 벌목해야 하고, 이렇게 벌목한 나무를 운송하는 과정은 어떠니 어떤 식으로 벌목 인력과 운송 인력을 배정하는 것이 최적이다와 같은 분석을 해야할 수도 있습니다.

 

물론 데이터 사이언티스트와 같은 직종도 개발자로서의 능력이 출중하다면 당연히 큰 장점이 될 수 있지만, 이에 더해 산업 전반에 대한 이해와 공부가 뒷받침되어야 합니다. 학문으로 따지면 컴퓨터 공학부터, 통계학, 경영학, 경제학 등등이 섞인 직업이라고 볼 수 있습니다.

 

그렇기에 실질적으로 그 어느 데이터 사이언티스트도 모든 분야를 전공하고, 통달해있지는 않습니다. 누군가가 컴퓨터 공학을 전공하고, 이후 통계학과 경영, 경제 등을 배워 데이터 사이언티스트가 되는 경우도 있고, 아예 전공을 특화시켜 데이터베이스를 관리하는 쪽으로 들어가는 경우도 있습니다.

 

비전공자의 경우에도 개발자의 스타일과는 다른 데이터 분석가 및 사이언티스트로서의 역량을 배워(전기톱을 사용하는 법과 원리를 배워) 경력을 쌓으며 스스로를 개발해나가는 경우도 많습니다.

 

그렇기에 이번 게시판을 통해 직업이라는 어쩌면 인생의 큰 줄기가 될지도 모르는 도전을 앞두고, 정말 해당 작업이 자신의 선호 및 취향과 맞는지를 한 번 테스트해보는 기회이자, 굳이 데이터 사이언티스트가 되지 않더라도 이러한 역량을 조금이라도 갖춰 업무자동화를 시킬 수 있는 능력을 갖춰놓을 기회로 삼는 것도 좋을 것 같습니다.

 

다시 말하지만 해당 메뉴는 본격적으로 데이터 사이언티스트로서의 도전을 준비하기 전에(특정 정부지원 커리큘럼이나 아카데미 등) 사전에 환경설정을 마치고, 사소한 오류를 잡아보며, 실제로 업무를 자동화하고 데이터를 수집하며 분석해봄으로써 스스로의 적성을 확인하는 과정입니다.

 

가장 대표적인 언어라고 할 수 있는 Python부터 시간을 내 하나씩 만들어보겠습니다.