몬스 ·
2023/01/29

맞아요. 데이터는 만드는 사람들의 의도가 담겨있는데, 정작 대규모 데이터를 만드는 쪽은 규모가 큰 기업이나 국가가 대부분이죠.. 데이터보다 분석능력을 중시한다는 건 결국 데이터를 생산하는 주체에게 좋을 일.. 코딩이다 뭐다 중요하지만, 어떤 데이터를 어떻게 만들지 참 중요한 일인 것 같아요!

홈은 ·
2023/01/29

데이터마이닝을 위한 로우데이터 단계부터 분석가의 의사결정이 들어가야 한다는 의견도 있 (나라던가.. 나같은 사람…) 분석자가 왜곡된 의사결정을 하고 의도적으로 예상결과값이 나오도록 데이터를 추출하는 것도 문제가 있겠지만 의사결정없이 기계적으로 분석하는 건 사실 더 위험할 수 있거든요.

단순히 주어진 값으로 분석을 할 때 추출값 선정 과정에 문제가 있거나 결정적인 누락 부분이 있다면 아무리 훌륭한 분석 과정을 거쳤더라도 똥…… 쓰레기를 넣으면 쓰레기가 나오능 것과 같은 의미입니당. 와하핫.

좋은 예시) 인체에 가장 적합한 스마트폰 규격은 가로 ㅇㅇ센티미터에 세로ㅇㅇ센티미터양. 우리가 겁나 열시밓 분석했엉. -> 근데 알고보니 모집단 17만명 중 12만명이 백인 남자였.. -> 분석 결과를 적극적으로 반영한 훌륭한 결과물이 나왔지만 이거를 ‘인체적합도가 높다’ 라고 말하기엔 우리는 너모나 동양인인 것.

강부원 인증된 계정 ·
2023/01/29

남의 집 댓글창이라 뒤 늦게라도 안봤으면 손해봤겠는데요. 몬스, 홈은, 스테파노 님 덕분에 다 알아듣지는 못하겠지만, 뭔가 조금 데이터 사이언스 더 폭넓게는 과학적 사고가 무엇인지 생각해보게 되네요. 데이터 사이언스야 말로 관찰을 통해 객관적 결과를 도출하는 분야인 듯 싶지만, 반면에 연구자의 사심이 가장 강하게 개입될 수 있는 분야라는 생각도 좀 들고요. 필터링해서 포집하는 정보나 응용하는 변수에 따라 달라지는 결과값을 각각 다르게 제시하는 경우도 흔히 볼 수 있고요. 진단이나 측정 과정에서 특정한 방향성을 지시하려는 명분으로 데이터 사이언스가 사용될 때 위험해지겠다는 생각도 들고요. 한편 염감이나 추측으로만 전망하기 좋아하는 얼치기 인문학 시장에 건강한 충격도 주고, 낡은 관점이나 편협한 태도를 전환시키는 새로운 방법론이 될 수 있다고도 생각합니다. 여러 말씀과 의견 고맙습니다.

몬스 ·
2023/01/29

@홈은님, 그렇네요. 아껴쓴다는게 나를 위해서만은 아닌 것 같아요. 이 기회에 제대로 아껴봐야겠어요. 핫템 소개 좋은 아이디어입니다!
후행적인 분석에 대한 깔끔한 정리도 감사합니다! 물리적 공간은 11차원?으로 제한되지만, 최근 데이터 사이언스는 수십 수백 차원의 데이터를 이용하는 경우도.. 물론 차원을 늘리면서 발생하는 문제(차원의 저주)를 해결하기 위해 데이터를 엄청나게 모은다던지, 차원 축소 기술을 이용한다던지 라는 방법이 쓰이지만요..

@스테파노님, 과학은 재현성에 기반한다는 점에서 후행과 선행을 떠난 진리의 추구라는 측면이 강조되는 것 같아요. 그 진리라는 것이 완전한 것이냐고 하면 그건 또 아니지만요. 어디까지나 경험과 관찰의 영역을 설명할 뿐이니..

기술에 대해서는 문제를 해결하기 위한 노력이라고 말씀하신 부분을 개인적으로는, 노이즈가 가득한 비과학적 세상에서 과학(문제를 해결하기 위한 모델)의 세상으로 문제를 끌고 오는 과정이라고 생각해본 적이 있어요. 엔지니어링도 늘 동작해야하니 코어에는 과학 비스무리한 후행적이면서도 선행적인 모델을 필요로 하니까요. 엔지니어들은 그곳으로 문제를 거르고 정제하여 끌고오는 역할을 하는 게 아닌가 하고..

두 분의 생각에 또 꼬리를 이어봅니다.

얼룩커
·
2023/01/29

@강부원 님, 과학은 결과의 도출이니 "후행적"인가에 대한 논의는 제법 깊어질 주제 같습니다. 흔히 "과학"을 "엔지니어링-기술"과 혼용하기 때문이 아닐까 싶네요. 최근 반도체 야야기를 읽다가 다음 구절이 눈에 들어 왔어요.

"엔지니어링과 사이언스는 출발점이 다르다. 사이언스는 인간의 호기심에서 출발을 해서 그것을 만족시키기 위한 것이고 엔지니어링에는 고객이 있고 그 고객은(본인들이 인식하든, 인식하지 못하든) 풀어야 할 문제를 갖고 있다. 엔지니어링은 그 문제를 해결하기 위해서 노력을 하는 것이다". - 최리노의 한 권으로 끝내는 반도체 이야기, 최리노 -

과학과 기술과 엔지니어링의 차이. 이런 개념의 차이점의 이해가 늘 명확하지 않은 것이니까요.

데이터의 분석은 "기술"의 영역이라 늘 "후행적 솔루션"이 됩니다. 단 그 솔루션이 순환의 가치 사슬에 놓이게 되면, 더 나은 결과를 생산할 것이라는 예측과 기대가 "되먹임"이니 "선행"이니 하는 착시를 준다고 생각합니다.

반면, 과학은 결과의 도출 자체가 선행이 될 수도 있다고 생각해요. 물리학이 원자력과 양자역이라는 기술을 만들어 냈듯이 말이지요. 생각이 또 꼬리에 꼬리를 뭅니다.

홈은 ·
2023/01/29

강부원 님(몬스 빙의????? 여긴 어디! 나는 누구?)

후행적 분석 결과는 향후 선행지표 예측에 반영하여 참고할 수 있습니다. 몬스 님이 말씀하신 불안지수 같은 것도 조정값으로 활용할 수 있고요. 하지만 추세를 확정으로 넘겨짚는 오류를 범할 수도 있기 때문에 분석가들은 신중해야 함다.

쉽게 예를 들자면 엊그제 어제 오늘 테슬라가 올랐으니 내일도 테슬라가 오를꺼양. 같은 그런 거….
하지만 엊그제 어제 오늘 테슬라 주가 상승이라는 분석 자료를 활용하여 피봇 지표를 설정할 순 잇것죠. 그러면 피봇 지표를 향후 상승 또는 하락을 추정을 위한 신뢰도 높은 자료로 활용할 수도 잇것죠… 이거시 미래 테슬라 주가 예측.

물리학에서 11차원까지 가능하다고 했다 그르대요? (잘 모름) 그럼 데이터도 11차원 분석 가능… 다양하게 예측할 수 있는 미래 중 가장 현실성 있는 미래를 골라내는 작업이 데이터 사이언스…

홈은 ·
2023/01/29

핫to the 팩……

전 아직 가스요금도 전기요금도 실감하지 못하는 중이라 공감은 덜 되고 있어요. 아파트는 상대적으로 실내 온도가 높게 유지되는 부분도 있고 워낙 난방에너지를 안 쓰는 편이라 폭탄까진 아니지 않을까 싶어요. 한국은 누진 구간이 있어서 거기 걸리면 엄청 많이 내는 것 같더라고요.

여름에는 29도로 살고 찬물로 씻고, 겨울에는 난방 기준온도를 낮에는 15도, 밤에는 20도로 해놓고 도톰한 실내복 입고 (가끔 외투도 입……) 물 자주 끓이면 가스비 3-4만원, 전기요금 2-3만원을 안 넘더라고요. 실내 온도를 낮추니까 덜 건조해서 가습기가 덜 돌아가더라고요? 더 아껴지는 부분도 있는 것 같아요. 발뮤다 가습기 써서 찬바람이 나오는데도 별로 춥다 못느끼며 살아요. 입김도 안 나오고… 가끔 코는 시리……

몬스 님 글 보면서 ‘진짜 더 아껴써야겠구나. 아껴쓸 수 있는 사람들이 아껴써야 가스나 전기를 비싸서 못 쓰는 사람들에게 돌아갈 에너지가 있겠구나’ 라는 생각이 듭니다. 돈을 낼 여력이 있는 사람들이 에너지를 많이 쓰면 가격 상승은 더 심해지잖아요. 그러면 가장 빈곤한 사람들이 불이익을 받을 수밖에 없다고 생각해요. ㅠ ㅠ 돈이 없어서 난방을 못하는 사람들은 없었으면 합니다. 그러려면 보통 사람들의 에너지 절약은 선택이 아니라 필수라는
생각이 드네요.

! 개인난방 주제로 각자의 핫템 소개해도 재밌겠어요. 함 하까요.

몬스 ·
2023/01/29

트위터는 사용하기 나름인 것 같아요ㅎㅎ 팔로우가 완잔히 자유다보니.. 또 실시간성이라는 장점이 있어서, 소식이나 이슈를 소비하기엔 좋은 곳 같아요!

연하일휘 ·
2023/01/29

와!! 트위터를 이렇게 분석할 수도 있었군요!! 트위터를 사용해 본 적이 없는.........그리고 주위의 말로는 트위터는 조금 극단적인 경향의 사람들이 많으니 사용하지 말라는 조언을 들어왔던 터라, 너무 부정적인 관점만 지녔던 것은 아닌가 반성하게 되었습니다..ㅎㅎ 좋은 글, 많이 배워갑니다!! :)

몬스 ·
2023/01/28

진짜 그런 조합으로 제 몸만 데펴야겠어요ㅎㅎ
일본은 겨울에 많이 안추운데요. 집은 많이 추워요.. 이중창이나 방한 관련 법안이 2022년에 통과되었다고 들었어요. 창도 이중창이 아닌 곳이 많고, 벽도 얇은 곳이 많아서 춥습니다. 여름에는 덥고, 겨울에는 추운 집..ㅎㅎ

더 보기 (3)