데이터과학 입문자라면 과감히 파이썬을 배우세요.

박준석
박준석 인증된 계정 · 데이터 사이언티스트입니다.
2022/12/26
데이터과학 입문자를 위한 최고의 언어?

이 글은 얼룩커로서 저의 첫 글이니, 이야기를 시작하기 전에 저에 대한 소개를 짧게나마 하는 것이 도움이 될 것 같아 몇 자 적어봅니다. 저는 학교에서는 양적방법론을 주로 연구하는 (계량)심리학을 전공했으며 졸업 후에는 미국에서 데이터과학자로 일하고 있고, 지금은 한 핀테크 회사에서 기계학습 모형을 만들고 있습니다. 예전에는 페이스북에서 [오하이오의 낚시꾼] 이라는 필명으로 글을 쓰기도 했습니다. 한동안 개인 사정으로 글을 쓰지 않다가 얼룩소라는 플랫폼을 빌어 다시 글을 쓰기로 했습니다. 소재를 선정해 주신 운영진께 감사드립니다.

오늘 제가 하고자 하는 이야기는 아마 데이터과학에서 가장 민감한 논쟁거리 중 하나일 것입니다. 바로 데이터과학 입문자, 특히 데이터과학을 진로로 하려 하는 사람들이 배워야 할 프로그래밍 언어가 무엇이냐 하는 것입니다. 아마 데이터과학 최고의 언어는 무엇이냐 하는 더 민감한 질문도 있겠지만, 그 질문은 너무 위험하니 아마 영영 안 다루지 않을까 싶네요. 아무튼 데이터과학에 대해 잘 모르시는 독자분들을 위해 배경을 잠깐 설명하면, 데이터분석/과학자들이 갖추어야 할 중요한 소양으로 프로그래밍을 꼽을 수 있습니다. 모든 분석가가 프로그래밍을 통해 데이터분석을 하는 것은 아니지만 (MS Excel, Tableau 등과 같은 도구를 주로 쓰시는 분들도 많죠), 자동화를 할 필요가 있거나, 복잡한 통계모형을 만들거나, 요즘 많이 회자되는 기계학습이나 딥러닝 등의 작업을 하려면 사실상 프로그래밍 없이는 힘들다고 봐야 합니다. 그래서 분석가들이 프로그래밍 언어를 적어도 하나 배우는데요. 일반적으로 C, C++, Java 등의 언어를 많이 배우는 일반적인 개발자들과는 달리 분석가들에게는 거의 정형화된 두 가지 선택지가 존재합니다 (그 밖에도 선택지가 전혀 없는 것은 아니지만요) 바로 파이썬 (Python) 이라는 언어와 R이라는 언어입니다. 이 둘은 데이터분석에서 양대산맥 같은 존재라 데이터과학 입문자는 거의...
박준석
박준석 님이 만드는
차별화된 콘텐츠, 지금 바로 만나보세요.
이미 회원이신가요? 로그인
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.
24
팔로워 2.5K
팔로잉 31