데이터 사이언스 맥시멀리스트의 위시리스트 (1) - 엔지니어링 기초

박준석
박준석 인증된 계정 · 데이터 사이언티스트입니다.
2023/03/30
GPT가 온통 데이터 사이언스와 인공지능 업계의 주의를 끌고 있지만 하루 벌어서 하루 먹고 살아야 하는 가난한(?) 데이터쟁이는 오늘도 그냥 하던 이야기를 계속하도록 하자. 인공지능에 대해 별로 아는 건 없지만 하고 싶은 말이 없는 건 아닌데, 별로 영양가 있는 이야기를 할 수 있을 것 같지는 않아 그냥 안 하려고 한다. 틀린 이야기를 할 가능성도 높고. 이런 얘기는 좀 더 잘 아는 분들이 잘 풀 수 있을거라고 생각한다.
 
보통 데이터 사이언스에 관심이 있는 사람이 있다고 할 때 나는 되도록 격려해주는 차원에서 이야기를 해 주는 편이다. 이것도 알아야 하고, 저것도 배워야 하고 이런 식으로 잘 이야기를 하지 않는다. 웬만하면 유캔두잇 정신을 심어주는 게 중요하기 때문이다. 하지만 마음 속 다른 한켠에서는 다른 목소리가 흘러나오는 것을 애써 막고 있는 것도 사실이다. 현업을 잘 하려면 이것도 해야 하고 저것도 해야 하는데…그냥 참자. 이거 다 하라고 하면 포기할라. 하지만 이 지면에서만큼은 그 리스트를 쭉 다 풀어놔도 될 것 같아서 한 번 써 본다. 임금님 귀는 당나귀 귀! 이름하여 데이터 사이언스 맥시멀리스트의 위시리스트. 아마 데이터 분야에 종사한다면 이런 꼰대스러운 리스트 하나쯤은 갖고 있을 것 같은데 총대 메고 한 번 풀어보도록 하자.
 
일단 미니멀리스트 스킬셋부터 한 번 이야기해 보자. 보통 데이터과학자 면접을 준비하기 위해 다음과 같은 것들을 공부하라고 한다.
 
- 기초통계학 (가설검정, 점/구간추정, 회귀분석, 비율검정, 이산형 자료분석 등)
- 기계학습 (회귀, 분류, 편향분산 트레이드오프, 정규화, 모형선택 등)
- 기초 코딩 (SQL은 필수, 파이썬이나 R 중 택1, 약간의 자료구조/알고리즘)
 
일단 이것들은 기본으로 깔고 간다고 가정하자. 한 가지 이야기해야 할 것은 데이터 사이언스라는 분야는 실로 매우 광활하다는 것이다. 요즘은 데이터분석가 (data analyst) 와 데이터과학자 (data scientist), 기계학습 엔지니어 (machin...
박준석
박준석 님이 만드는
차별화된 콘텐츠, 지금 바로 만나보세요.
이미 회원이신가요? 로그인
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.
24
팔로워 2.5K
팔로잉 31