구글 왈, 다음블로그야 협조좀 해 줘
구글 웹서치를 즐겨 쓰는 인터넷 사용자는 유독 다음블로그가 검색이 잘 된다는 것을 알게 됩니다. 아무런 내용도 없는 블로그도 역시 매우 높은 랭킹으로 검색이 됩니다. 왜 이런일이 발생하는 것일까요?
다음 블로그는 robots.txt를 만들어 놓지 않았기 때문에 외부에서 검색엔진이 검색을 할 수 있게 되어 있습니다. 검색엔진 중에 업데이트가 가장 빠른 검색엔진이 바로 구글입니다. 구글은 구글댄스라고 해서 30일정도에 80억개가 넘는 모든 웹페이지들을 업데이트 시켜버리는 괴물같은 검색엔진입니다.
구글웹서치의 복잡한 알고리즘으로 사용자는 검색어와 가장 연관성이 높은 웹페이지를 찾을 수 있는데, 유독 다음 블로그는 중요하지도 않는 문서들이 검색결과의 상위에 랭크됩니다. 이런 현상의 열쇠는 바로 다음 블로그의 URL 구조 때문입니다.
다음 블로그는 프레임이란 것을 사용해서 문서의 정확한 URL을 숨김니다. 아래는 제가 만들어 본 다음 블로그의 URL입니다.
이 화면과는 다르게 페이지의 원래 URL은 http://blog.daum.net/_blog/blog.do?blogid=08zOJ 입니다. 원 URL을 보면 알겠지만 블로그의 글 끼리 구분하는 구분자는 blogid값밖에는 없습니다. 즉, URL만 보고는 이 사람 블로그인지 아닌지를 구분할 수가 없다는 말이죠.
이 것은 검색엔진도 마찬가지로 적용됩니다. 구글은 이 URL을 보고 누구의 블로그인지 모릅니다. 아마도 다음의 모든 블로그가 한 사람이 만든 것으로 오해하고 있을 가능성이 매우 높습니다.
첩첩산중으로 다음 블로그는 서로 이리저리 자동으로 링크가 걸리는 것도 많습니다. 소위 랜덤링크라고 하는 것도 있어서 검색엔진은 더욱 혼란스러울 수 밖에 없겠지요.
이런 이유로 구글웹서치는 현재까지는 다음 블로그에 매우 높은 랭킹을 부여하고 있습니다만, 이 것이 얼마나 오래 갈지는 알 수 없습니다. 구글웹서치가 이런 사실을 알게 된다면 올바른 검색결과를 내기 위해서 다음 블로그에 어떤 패널티를 가할 것이 분명하기 때문이죠. 그렇게 된다면 알찬 내용으로 만든 블로그도 피해 아닌 피해를 입을 수 있습니다.
이런 일이 생기기 전에 다음 개발진들이 블로그의 URL에 아이디를 넣는 것이 필요합니다. 다시 말해서 위의 주소는 다음과 같이 바꾸는 것이 필요할 것입니다.
http://blog.daum.net/_blog/blog.do?username=cable8mm&blogid=08zOJ
또는
http://blog.daum.net/_blog/cable8mm/blog.do?blogid=08zOJ
Comments