시대를 초월한 (서양/남성/문학) 위대한 책 500?
2024/07/30
지난 주말, 영국 이코노미스트에서 역사상 위대한 책 500권에 대한 그래픽 기사를 공개했다. thegreatestbooks.org라는 곳에서 수집해 정리한 순위를 바탕으로 했다(김석관 STEPI 박사 포스팅을 통해 알게 됐는데, 그 소개도 흥미롭다)
흥미로운 내용이라 더 자세히, 한눈에 보고 더 알고 싶었지만, 기사엔 차트가 100위까지만 나오고 책 관련 정보도 많지 않아 아쉬웠다. 그래서 주말과 새벽 시간을 이용해(잉여력...) 표의 내용을 수집한 뒤 정제하고, 몇 가지 정보를 추가해 살펴봤다.
흥미로운 내용이라 더 자세히, 한눈에 보고 더 알고 싶었지만, 기사엔 차트가 100위까지만 나오고 책 관련 정보도 많지 않아 아쉬웠다. 그래서 주말과 새벽 시간을 이용해(잉여력...) 표의 내용을 수집한 뒤 정제하고, 몇 가지 정보를 추가해 살펴봤다.
인터랙티브로도 정보를 볼 수 있게 만들었다.
1. 출간 언어: 서양어권 98%. 그냥 서양 위대한 책 500이라 해야 할 듯.
기사에도 나오긴 했는데 부각은 안 됐다. 너무 서양 편향적인 것 같아 체크해봤다.
표에서는 제공하지 않아서 챗gpt api 써서 정보 추가.
- 중세 및 고대 영어 포함 영어가 70%.
- 유럽어 포함하면 98%
- 아랍어 3권(코란, 천일야화, 북으로의 이주시절)
- 동양은 5권 뿐. 1%.
- 고전 한문 포함 중국어 3(논어와 손자병법 서유기)
- 일본어 2(고전 겐지 이야기 외엔 하루키의 태엽감는새 연대기가 포함)
2. 시대: 근대 편향+ 고대 그리스 편향
연도와 순위를 축으로 그래프(상위를 부각하고자 순위에 로그 취함) 그려보면 하나의 거대한 덩어리와 좀 작은 기둥이 보인다.
- 큰 덩어리는 1800년 이후에 뭉쳐 있음. 이 시기 출간이 435권, 87%. (뭐 지금 시대 가까운 시기가 주목 받겠지.)
- 그 외에 그나마 밀도가 있는 구간은 고대 그리스 비극과 플라톤의 시대. 기원전 400년 전후.
- 그 사이 2000년은 거의 망망대해. 서양 편향. (인류의 지적 유산이 이렇게 공백이 길었나.)
3. 작가 성별: 남성 80%. 남성 위대한 책 500이겠지
작가 성별 정보가 없어서 역시 챗gpt api로 붙여봤다.
- 남성 399(80%), 여성 98(20%)
- 여성 작가는 대부분 20세기 이후(81%) 등장. 19세기 이후(96%)가 거의 다.
- 길가메시 서사시 작가가 여성으로 분류됐는데 챗gpt 환각인 듯. 저자 정보가 없었겠지...
4. 장르: 문학이 대세
장르 정보도 없기에 추가했다. 분류가 아주 엄밀하진 않다. 도서 분류 기준을 바탕으로 요청했지만, gpt가 알아서 분류한 것도 있다.
- 문학의 압도적 우세. 445권이 문학.
- 철학이 21, 역사가 11, 과학기술이 7 경제 4 사회과학 3 순.
5. 퍼포먼스
사실 개인적으로 가장 궁금했던 주제다. 콘텐츠 물리적 특성과 퍼포먼스인데, 볼 게 순위와 길이밖에 없어 아쉽다. 온라인이나 모바일 콘텐츠는 너무 길면 읽는 시간이 더 길어지지 않는 구간이 있는데, 이게 책에서도 그런지 알고 싶어서 봤다.
길이는 이코노미스트가 영미권 대학생 읽기 속도인 분당 300단어를 바탕으로 계산한 내용을 바탕으로 했다.
- 길이(읽는 시간)는 1분(이건 뭐지)부터 5355분(로마제국 쇠망사)까지 다양. 푸르스트도 4547분으로 2위.
- 하지만 1분위 204분, 3분위 566분 중위값은 456분이었음. 이 구간에 대부분 몰려 있고 일부 극단적으로 긴 책들이 포함.
- 길이와 순위에는 별 관계가 없었음. 역시 추천도서는 독자의 인내심을 고려하지 않는 듯
- 많은 책이 몰린 19세기 이후를 따로 봤는데 역시 큰 관계는 보이지않음
- 연도와 순위는 의외로 현대 책의 순위가 상대적으로 낮은 모습이 보임. 아주 가까운 책은 500위 안에 넣어도 약간 순위는 낮음.
- 시대별 책의 길이는 크게 변화는 없음. 20세기 이후에 약간 짧아지긴 했다(이후 427분 vs. 이전 519분. 맨휘트니검정으론 p값 0.09. 의미있는 차이.)
(여담인데, 수 계산은 챗 gpt한테 시키면 안 될 듯하다. 처음에 길이의 시간(ex. '이틀 7시간 23분')을 분 단위로 변환하기 위해 이용해봤더니, 3분의 1이 오류였다. 조금 틀린 것도 아니고 허무맹랑하게 나왔다. 그나마 표현을 수식으로 바꿔서 계산만 시키면 많이 줄어드는데, 그래도 10개 넘게 틀렸다. 장르나 성별 조사는 일부 오류가 있지만 비교적 쓸 만했다.)
미국과 한국에서 기자상을 수상한 과학전문기자입니다. 과학잡지·일간지의 과학담당과 편집장을 거쳤습니다. '사라져 가는 것들의 안부를 묻다' '인류의 기원(공저)' 등을 썼고 '스마트 브레비티' '화석맨' '왜 맛있을까' '사소한 것들의 과학' '빌트' 등을 번역했습니다.
@JACK alooker 아주 간단한 업무(?) 지시긴 했어요. 제목 대면 장르 말하기, 작가 대면 성별 말하기.. 하긴 근데 그걸 500번씩 시켰으니 좀 혹사했을지도 모르겠네요. ^^;
@몬스 아주 간단한 작업에만 활용했어요. 기본적인 조사(저자 성별, 작품 장르)라 그런지 잘 분류해줬어요. 근데 숫자 계산은 단순 사칙연산인데도 너무 많이 틀리더라고요. ㅎㅎ
@윤신영 님께서 AI를 너무 혹사시키는거 아닙니꽈?😁
무척 흥미로운 조사입니다! 챗쥐피티를 이렇게 쓸 수도 있군요!
@JACK alooker 아주 간단한 업무(?) 지시긴 했어요. 제목 대면 장르 말하기, 작가 대면 성별 말하기.. 하긴 근데 그걸 500번씩 시켰으니 좀 혹사했을지도 모르겠네요. ^^;
@몬스 아주 간단한 작업에만 활용했어요. 기본적인 조사(저자 성별, 작품 장르)라 그런지 잘 분류해줬어요. 근데 숫자 계산은 단순 사칙연산인데도 너무 많이 틀리더라고요. ㅎㅎ
@윤신영 님께서 AI를 너무 혹사시키는거 아닙니꽈?😁
무척 흥미로운 조사입니다! 챗쥐피티를 이렇게 쓸 수도 있군요!