데이터 사이언스 맥시멀리스트의 위시리스트 (1) - 엔지니어링 기초
2023/03/30
GPT가 온통 데이터 사이언스와 인공지능 업계의 주의를 끌고 있지만 하루 벌어서 하루 먹고 살아야 하는 가난한(?) 데이터쟁이는 오늘도 그냥 하던 이야기를 계속하도록 하자. 인공지능에 대해 별로 아는 건 없지만 하고 싶은 말이 없는 건 아닌데, 별로 영양가 있는 이야기를 할 수 있을 것 같지는 않아 그냥 안 하려고 한다. 틀린 이야기를 할 가능성도 높고. 이런 얘기는 좀 더 잘 아는 분들이 잘 풀 수 있을거라고 생각한다.
보통 데이터 사이언스에 관심이 있는 사람이 있다고 할 때 나는 되도록 격려해주는 차원에서 이야기를 해 주는 편이다. 이것도 알아야 하고, 저것도 배워야 하고 이런 식으로 잘 이야기를 하지 않는다. 웬만하면 유캔두잇 정신을 심어주는 게 중요하기 때문이다. 하지만 마음 속 다른 한켠에서는 다른 목소리가 흘러나오는 것을 애써 막고 있는 것도 사실이다. 현업을 잘 하려면 이것도 해야 하고 저것도 해야 하는데…그냥 참자. 이거 다 하라고 하면 포기할라. 하지만 이 지면에서만큼은 그 리스트를 쭉 다 풀어놔도 될 것 같아서 한 번 써 본다. 임금님 귀는 당나귀 귀! 이름하여 데이터 사이언스 맥시멀리스트의 위시리스트. 아마 데이터 분야에 종사한다면 이런 꼰대스러운 리스트 하나쯤은 갖고 있을 것 같은데 총대 메고 한 번 풀어보도록 하자.
일단 미니멀리스트 스킬셋부터 한 번 이야기해 보자. 보통 데이터과학자 면접을 준비하기 위해 다음과 같은 것들을 공부하라고 한다.
- 기초통계학 (가설검정, 점/구간추정, 회귀분석, 비율검정, 이산형 자료분석 등)
- 기계학습 (회귀, 분류, 편향분산 트레이드오프, 정규화, 모형선택 등)
- 기초 코딩 (SQL은 필수, 파이썬이나 R 중 택1, 약간의 자료구조/알고리즘)
일단 이것들은 기본으로 깔고 간다고 가정하자. 한 가지 이야기해야 할 것은 데이터 사이언스라는 분야는 실로 매우 광활하다는 것이다. 요즘은 데이터분석가 (data analyst) 와 데이터과학자 (data scientist), 기계학습 엔지니어 (machin...
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.
정말 좋은 글입니다. 이직하고 리눅스 환경에서 커맨드라인 만지는게 처음이라 한참동안 고생한 사람이 바로 접니다..😭