구글 도서 검색, 다운로드 허용

3 minute read

미국 도서관과의 제휴로 책을 스캔해서 검색을 가능하게 하는 구글 도서 검색(Google Book Search) 서비스에서 PDF파일로의 다운로드가 가능해졌다는 소식이 BBC에 의해 알려졌습니다. 어떤 내용인지 알아봅니다.

구글 도서 검색(Google Book Search)은 초창기 구글 프린트(Google Print)로 개발되었으나, 사용자의 요청에 의해 구글 도서 검색이라는 이름으로 바뀌었습니다. 현재 구글 도서 검색은 세가지 URL로 사용할 수 있는데, print.google.com, book.google.com 그리고 공식 URL인 books.google.com입니다. 물론 앞의 두개는 모두 북스로 리다이렉트가 됩니다.

구글이 책을 검색해 준다고 해서 설마 모든 책을 워드프로세서로 옮기진 않겠지 라는 생각을 할 수도 있지만, 구글이 하는 방법은 책의 모든 페이지를 스캔해서 광학 리더기를 이용해서 영문으로 변환하는 기술을 사용하고 있습니다. 따라서, 구글 도서 검색에선 검색은 되지만, 텍스트로 보여지는 것이 아닌 원자료의 그림 파일을 볼 수 있습니다. 신기한 것은 검색어 부분이 노란색으로 반전된다는 점입니다.

그림으로 서비스하는 구글 도서 검색에서 PDF 파일을 지원한다고 하니 좋다라고 생각할 수도 있겠지만, 아쉽게도 PDF 파일 역시 그림 파일로 저장되어 있기 때문에 긁어서 퍼갈 수는 없게 되어 있습니다.

아래의 그림은 구글 책 검색에서 PDF파일이 있을 경우 나오는 PDF 다운로드 링크입니다.

구글 도서 검색의 다운로드 링크

이 링크를 클릭하면 PDF파일이 전송되는데, PDF파일을 열면 그림으로 된 책을 볼 수 있습니다. 그런데, 일부러 그런것인지 책이 똑바로 되어 있질 않고 약간씩 비틀려 있는 것을 볼 수 있습니다.

실제 다운로드한 PDF 파일

이런 PDF 파일은 저작권이 소멸됐거나, 퍼블릭 라이센스가 적용된 서적에만 적용됩니다. PDF 파일의 첫페이지는 구글에서 작성한 부탁의 글이 써 있는데, 그 내용이 매우 정중합니다. 이런 PDF 파일은 구글이 저작권을 주장할 수 없기 때문에 법에 의한 강요를 할 수 없습니다.

구글의 부탁(ask)의 말 네가지는 이렇습니다.

PDF 파일의 첫장 인용:

  1. 상업적으로 쓰지 말아 주세요(Make non-commercial use of the files)
  2. 자동화된 쿼리를 삼가해주세요(Refrain from automated querying)
  3. 속성을 유지해 주세요(Maintain attribution) - 구글 워터마크를 지우지 말라는 말
  4. 법을 지키세요(Keep it legal)

미국의 책이야 구글이 자체적으로 스캔한다고 해도 한국 책들은 그럴 수 없습니다. 구글이 가지고 있는 광학 리더기가 한글을 읽을 수 없는 것도 이유가 되겠네요. 만약 구글 도서 검색에 내가 권리를 가지고 있는 책을 넣고 싶다면 구글 도서 검색의 파트너 페이지에서 신청할 수 있습니다.

구글 도서 검색의 파트너 프로그램

구글 도서 검색의 파트너 프로그램은 전의 포스팅에서도 언급했듯이 도서 권리자에게 수익을 주는 시스템이 마련되어 있습니다.

보통 이런 서비스는 저작권료로의 지출이 많기 때문에 수익이 크게 나기가 힘듭니다. 그리고, 온라인 서적 시장은 이미 아마존이 석권하고 있는 상태이기도 합니다. 하지만, 이런 사업은 구글이 얼마만큼 정보에 욕심이 많은지를 단적으로 보여주고 있습니다.

추가.

Google Book Search의 한글 공식 명칭은 구글 도서 검색입니다. 도서라는 말이 조금 딱딱한 면이 있는데 쉽게 책 검색이라고 하는 것도 좋을 것 같네요.

Comments