데이터과학 입문자라면 과감히 파이썬을 배우세요.
2022/12/26
데이터과학 입문자를 위한 최고의 언어?
이 글은 얼룩커로서 저의 첫 글이니, 이야기를 시작하기 전에 저에 대한 소개를 짧게나마 하는 것이 도움이 될 것 같아 몇 자 적어봅니다. 저는 학교에서는 양적방법론을 주로 연구하는 (계량)심리학을 전공했으며 졸업 후에는 미국에서 데이터과학자로 일하고 있고, 지금은 한 핀테크 회사에서 기계학습 모형을 만들고 있습니다. 예전에는 페이스북에서 [오하이오의 낚시꾼] 이라는 필명으로 글을 쓰기도 했습니다. 한동안 개인 사정으로 글을 쓰지 않다가 얼룩소라는 플랫폼을 빌어 다시 글을 쓰기로 했습니다. 소재를 선정해 주신 운영진께 감사드립니다.
오늘 제가 하고자 하는 이야기는 아마 데이터과학에서 가장 민감한 논쟁거리 중 하나일 것입니다. 바로 데이터과학 입문자, 특히 데이터과학을 진로로 하려 하는 사람들이 배워야 할 프로그래밍 언어가 무엇이냐 하는 것입니다. 아마 데이터과학 최고의 언어는 무엇이냐 하는 더 민감한 질문도 있겠지만, 그 질문은 너무 위험하니 아마 영영 안 다루지 않을까 싶네요. 아무튼 데이터과학에 대해 잘 모르시는 독자분들을 위해 배경을 잠깐 설명하면, 데이터분석/과학자들이 갖추어야 할 중요한 소양으로 프로그래밍을 꼽을 수 있습니다. 모든 분석가가 프로그래밍을 통해 데이터분석을 하는 것은 아니지만 (MS Excel, Tableau 등과 같은 도구를 주로 쓰시는 분들도 많죠), 자동화를 할 필요가 있거나, 복잡한 통계모형을 만들거나, 요즘 많이 회자되는 기계학습이나 딥러닝 등의 작업을 하려면 사실상 프로그래밍 없이는 힘들다고 봐야 합니다. 그래서 분석가들이 프로그래밍 언어를 적어도 하나 배우는데요. 일반적으로 C, C++, Java 등의 언어를 많이 배우는 일반적인 개발자들과는 달리 분석가들에게는 거의 정형화된 두 가지 선택지가 존재합니다 (그 밖에도 선택지가 전혀 없는 것은 아니지만요) 바로 파이썬 (Python) 이라는 언어와 R이라는 언어입니다. 이 둘은 데이터분석에서 양대산맥 같은 존재라 데이터과학 입문자는 거의...
이 글은 얼룩커로서 저의 첫 글이니, 이야기를 시작하기 전에 저에 대한 소개를 짧게나마 하는 것이 도움이 될 것 같아 몇 자 적어봅니다. 저는 학교에서는 양적방법론을 주로 연구하는 (계량)심리학을 전공했으며 졸업 후에는 미국에서 데이터과학자로 일하고 있고, 지금은 한 핀테크 회사에서 기계학습 모형을 만들고 있습니다. 예전에는 페이스북에서 [오하이오의 낚시꾼] 이라는 필명으로 글을 쓰기도 했습니다. 한동안 개인 사정으로 글을 쓰지 않다가 얼룩소라는 플랫폼을 빌어 다시 글을 쓰기로 했습니다. 소재를 선정해 주신 운영진께 감사드립니다.
오늘 제가 하고자 하는 이야기는 아마 데이터과학에서 가장 민감한 논쟁거리 중 하나일 것입니다. 바로 데이터과학 입문자, 특히 데이터과학을 진로로 하려 하는 사람들이 배워야 할 프로그래밍 언어가 무엇이냐 하는 것입니다. 아마 데이터과학 최고의 언어는 무엇이냐 하는 더 민감한 질문도 있겠지만, 그 질문은 너무 위험하니 아마 영영 안 다루지 않을까 싶네요. 아무튼 데이터과학에 대해 잘 모르시는 독자분들을 위해 배경을 잠깐 설명하면, 데이터분석/과학자들이 갖추어야 할 중요한 소양으로 프로그래밍을 꼽을 수 있습니다. 모든 분석가가 프로그래밍을 통해 데이터분석을 하는 것은 아니지만 (MS Excel, Tableau 등과 같은 도구를 주로 쓰시는 분들도 많죠), 자동화를 할 필요가 있거나, 복잡한 통계모형을 만들거나, 요즘 많이 회자되는 기계학습이나 딥러닝 등의 작업을 하려면 사실상 프로그래밍 없이는 힘들다고 봐야 합니다. 그래서 분석가들이 프로그래밍 언어를 적어도 하나 배우는데요. 일반적으로 C, C++, Java 등의 언어를 많이 배우는 일반적인 개발자들과는 달리 분석가들에게는 거의 정형화된 두 가지 선택지가 존재합니다 (그 밖에도 선택지가 전혀 없는 것은 아니지만요) 바로 파이썬 (Python) 이라는 언어와 R이라는 언어입니다. 이 둘은 데이터분석에서 양대산맥 같은 존재라 데이터과학 입문자는 거의...
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.
문득 어쩌면 R이나 파이썬을 떠나서 ‘어떤 목적성을 가지고’, ‘누구를 위해’ 데이터를 만드는지가 더 중요할 것 같다는 생각을 했어요. 파이썬은 훌륭한 도구지만 잘못 휘두르면 가장 강력한 데이터 문제의 시작점이 될 수도 있을 것 같아요. 결국 중요한 것은 데이터를 이용하는 사람의 판단이니까요. @.@
https://alook.so/posts/VntO3v2
대학원에서 파이썬 스터디 랩을 운영하고 있던 입장에서, '왜 파이썬인가'에 대해 설명할 때 참고할 수 있는 좋은 글 작성해 주셔서 감사합니다 ㅎㅎ
오하이오의 낚시꾼 게시물 자주 봐왔는데 여기서 체계적인 글부터 뵙게 되니 너무 반갑습니다. 저도 대학에서 R 조금 배웠다가, 일하면서는 거의 엑셀만쓰고, 데이터사이언스를 좀 배울까 고민이 들때마다 다시 R을 배워야 하나를 고민했었는데요.
대세가 파이썬으로 가고있음을 이해하는데 많은 도움이 되었습니다.
이렇게 이 댓글창은 피땀눈물로 얼룩진 얼룩소 파이썬 사용자들의 성지가 되고……
아직도 (?) sas 쓰는 업계도 있을껄요…
오픈 소스는 강력한 장점이자 취약점이기도 하니까요. @@
잘 읽었습니다. 분야에 따라 갈리는 것 같기도 합니다. 요즘은 파이썬이 잠식해나가고 있긴 하지만 심리학, 사회학쪽은 전통적(?)으로 R을 더 많이 쓰는 것 같습니다.
오, 반갑습니다! 저도 파이썬을 주력으로 이용합니다.
통계나 그래프 뽑기를 위해 R을 보조용으로 사용하긴 했는데, 파이썬이 대세가 되니 R의 유용한 패키지들이 파이썬으로 옮겨지더군요.. 대단한 커뮤니티의 힘ㅎㅎ
얼룩소에 파이썬 환경 구성하기로 글을 쓴 적이 있습니다. 혹시 이 글을 읽고 입문하길 원하시는 분이 계신다면 도전해 보시길..!
https://alook.so/posts/vKt6rLz
오 반갑습니다!! 글도 잘 읽었습니다. R 사용자로서 눈물과 함께(?) 읽었습니다만.. 앞으로도 기대합니다! :D
오, 반갑습니다! 저도 파이썬을 주력으로 이용합니다.
통계나 그래프 뽑기를 위해 R을 보조용으로 사용하긴 했는데, 파이썬이 대세가 되니 R의 유용한 패키지들이 파이썬으로 옮겨지더군요.. 대단한 커뮤니티의 힘ㅎㅎ
얼룩소에 파이썬 환경 구성하기로 글을 쓴 적이 있습니다. 혹시 이 글을 읽고 입문하길 원하시는 분이 계신다면 도전해 보시길..!
https://alook.so/posts/vKt6rLz
잘 읽었습니다. 분야에 따라 갈리는 것 같기도 합니다. 요즘은 파이썬이 잠식해나가고 있긴 하지만 심리학, 사회학쪽은 전통적(?)으로 R을 더 많이 쓰는 것 같습니다.
오 반갑습니다!! 글도 잘 읽었습니다. R 사용자로서 눈물과 함께(?) 읽었습니다만.. 앞으로도 기대합니다! :D
이렇게 이 댓글창은 피땀눈물로 얼룩진 얼룩소 파이썬 사용자들의 성지가 되고……
아직도 (?) sas 쓰는 업계도 있을껄요…
오픈 소스는 강력한 장점이자 취약점이기도 하니까요. @@
문득 어쩌면 R이나 파이썬을 떠나서 ‘어떤 목적성을 가지고’, ‘누구를 위해’ 데이터를 만드는지가 더 중요할 것 같다는 생각을 했어요. 파이썬은 훌륭한 도구지만 잘못 휘두르면 가장 강력한 데이터 문제의 시작점이 될 수도 있을 것 같아요. 결국 중요한 것은 데이터를 이용하는 사람의 판단이니까요. @.@
https://alook.so/posts/VntO3v2
대학원에서 파이썬 스터디 랩을 운영하고 있던 입장에서, '왜 파이썬인가'에 대해 설명할 때 참고할 수 있는 좋은 글 작성해 주셔서 감사합니다 ㅎㅎ
오하이오의 낚시꾼 게시물 자주 봐왔는데 여기서 체계적인 글부터 뵙게 되니 너무 반갑습니다. 저도 대학에서 R 조금 배웠다가, 일하면서는 거의 엑셀만쓰고, 데이터사이언스를 좀 배울까 고민이 들때마다 다시 R을 배워야 하나를 고민했었는데요.
대세가 파이썬으로 가고있음을 이해하는데 많은 도움이 되었습니다.