구닥다리(?) 데이터 사이언스의 현주소
2023/03/24
대 머신러닝, 인공지능, 대규모 언어생성모형의 시대에 전통적 통계 기법들에 대해 이야기하는 것은 왠지 구닥다리 같은 느낌을 줄 것 같아 두렵다고 하면 이것은 엄살일까? 아무튼 chatGPT, GPT-4 등등이 줄줄이 등장하고 세상을 금방이라도 바꾸어놓을 것만 같은 이 시점에, 뭔가 다른 이야기를, 특히 약간 고전적인(?) 느낌이 드는 통계학 이야기를 하면 시대에 뒤처진 것만 같은 느낌을 받는 것도 사실이다. 데이터과학자라면 모름지기 최신 동향을 끊임없이 모니터링하고 기술 습득을 게을리하지 말아야지! 하고 생각할 수도 있다. 하지만 나 자신도 그렇고, 지금까지 봐왔던 다른 사람들도 - 물론 개중에는 최신 조류 캐치업을 게을리하지 않는 사람들도 많지만 - 다 그렇게 사는 것은 아니다. 물론 데이터과학자들 이야기다. 감히 단언컨대 대부분의 데이터분석가/과학자들은 팬시한 것과는 다소 거리가 있는, 하루하루 마감되어야 할 일을 치우고 살고 있다고 생각한다. 실제로 그게 당장 조직에 필요하거나 돈이 되기도 하고.
아무튼 다른 몇몇 업계 분들과 곧 낼 책에서도 이야기했지만 머릿속에 수학, 통계 이론만 가득 차 있어서는 현업에서 도무지 살아남을 수가 없는 세상이 되었다. 아무리 트레이닝은 다소 옛날 방식으로 받았어도 그날그날의 일을 치워내기 위한 엔지니어링 기본기를 꾸준히 단련하지 않으면 살아남기 힘든 세상이 된 것은 맞다. 나도 학교를 졸업할 때까지만 해도 거의 이론밖에 머릿속에 들어있지 않은 인간이었지만, 졸업 후 반강제로 엔지니어링 기본기들을 습득하게 되었다. 단순히 프로그램을 짜는 것뿐 아니라 남들과 어떻게 "같이" 코드를 작성할 수 있는지 (git), 클라우드 컴퓨팅 환경에서 어떻게 일할 수 있는지 (bash, AWS, aws cli), 코드를 어떤 형식으로 써야 하는지 등등을 배우면서 조금씩 체질을 개선해 나갔다. 사실 학교를 졸업할 때 이런 것들을 전부 갖춘 사람들은 많지 않다. 물론 약간은 있는데 그런 사람들을 우리는 괴물이라 부르지 않을까. 아무튼 배...
아무튼 다른 몇몇 업계 분들과 곧 낼 책에서도 이야기했지만 머릿속에 수학, 통계 이론만 가득 차 있어서는 현업에서 도무지 살아남을 수가 없는 세상이 되었다. 아무리 트레이닝은 다소 옛날 방식으로 받았어도 그날그날의 일을 치워내기 위한 엔지니어링 기본기를 꾸준히 단련하지 않으면 살아남기 힘든 세상이 된 것은 맞다. 나도 학교를 졸업할 때까지만 해도 거의 이론밖에 머릿속에 들어있지 않은 인간이었지만, 졸업 후 반강제로 엔지니어링 기본기들을 습득하게 되었다. 단순히 프로그램을 짜는 것뿐 아니라 남들과 어떻게 "같이" 코드를 작성할 수 있는지 (git), 클라우드 컴퓨팅 환경에서 어떻게 일할 수 있는지 (bash, AWS, aws cli), 코드를 어떤 형식으로 써야 하는지 등등을 배우면서 조금씩 체질을 개선해 나갔다. 사실 학교를 졸업할 때 이런 것들을 전부 갖춘 사람들은 많지 않다. 물론 약간은 있는데 그런 사람들을 우리는 괴물이라 부르지 않을까. 아무튼 배...
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.
좋은 글 감사합니다. 학계에서 산업계로 넘어오고 느낀 바들이 참 많은데, 준석님이 쓰신 모든 문장에 공감이 됩니다. 특히, 분석 쪽 지식이 있어도 엔지니어링 지식이 없으면 할 수 있는게 많지 않다는 부분이요. 허허..