구글 블로그 검색의 기술적인 발전

3 minute read

구글의 서비스 중에서 개발이 되는지 아닌지조차 알기 힘든 서비스들이 존재한다. 그 중 가장 더딘 업데이트를 보여주는 것이 블로그 검색이 것이다.

블로그만을 검색하는 서비스는 세계적으로 보아도 그리 활성화되어있지 못하다. 테크노라티나 최근 인기를 끌고 있는 스피어닷컴 정도가 이 부분의 높은 점유율을 보이고 있고, 구글 블로그 검색도 구글 뉴스에 추가되기 전까지는 전혀 사람들의 관심을 끌지 못했다.

하지만, 최근 구글 블로그 검색은 RSS와 같은 피드를 중심으로 기술적인 발전이 있었던 것으로 보인다. 구글 블로그 검색은 구글 리더와 블로거닷컴(Blogger) 등과 연동되고 있어서, 블로그 검색이 좋아지면 그를 이용한 서비스의 성능도 따라서 올라간다.

구글 블로그 검색의 성능 향상에 대한 증거는 이후에 설명할 두가지 사실로 미루어 짐작할 수 있다.

구글 개인화 홈페이지의 요약 기능

구글의 개인화 페이지에는 몇일 전 플러스 버튼이 추가되었다. 이 버튼을 누르면 제목 밑에 요약문을 볼 수 있기 때문에 마치 간단한 리더로 읽는 것과 같은 효과를 볼 수 있다.

아이구글에 추가된 스니펫 버튼

블로거닷컴에 피드 앨리먼트 추가

구글 블로거가 최근 베타 딱찌를 떼고 난 후, 블로그를 꾸미는 템플릿 시스템의 대대적인 변화가 있었는데, 구글은 매우 복잡한 템플릿 시스템을 편리하게 만들기 위해 페이지 앨리먼트(element)라는 모듈을 만들었다.

앨리먼트를 이용하면 자신의 블로그에 피드를 직접 보여줄 수 있다. 5개 까지만 보여줄 수 있는 것은 아마도 저작권 때문인 것 같지만, 이 기능은 완성도가 매우 높고, 속도도 빠른 편이다.

다음 그림은 컴맹대왕님이 페이지 앨리먼트만을 이용해서 만든 뉴스 메타 블로그.

컴맹대왕의 구글 뉴스 블로그

이 두가지의 핵심은 블로그 검색에 사용되는 피드를 구글이 거의 실시간으로 다룬다는데 있다. 실제로 구글 블로그 검색의 크롤링 시간, 말하자면 긁어오는 시간은 과거와 비교한다면 극적으로 단축되었다. 물론 한RSS와 같은 직접 피드 주소를 입력하는 서비스보다는 느리지만, 블로그 검색 서비스 중에서는 아마도 가장 빠른 수준인 것 같다.

한편, 네이버의 블로그 검색은 베타가 없어졌고, 외부 블로그 내용도 충실하게 보여주지만, 검색 결과는 그리 만족할만 한 수준은 아니다. 반면, 올블로그나 이올린의 검색은 성능이 매우 좋아졌다.

블로그도 일종의 홈페이지이기 때문에 블로그 검색이 따로 필요하냐라는 질문엔 아직 답을 할 수 없을 것이다. 그리고, 페이지랭크와 같은 만족할만 한 알고리즘도 나와있지 않다.

구글은 블로그 검색 자체보다는 검색 기술을 다른 서비스와 연동시키는 방향으로 연구를 하고 있고, 기능적으로 우수하다고 할 순 없지만, 가장 방대한 데이터를 다룰 수 있는 구글의 스토리지 기술 덕택에 이 부분에서 선두를 달릴 가능성은 매우 높은 편이다.

Comments