구글 이미지 검색에서 잘못 된 태극기 이미지가 최상단에 노출되는 이유
구글을 지배하는 나무위키라는 글이 소개되고 난 후에 삼일절을 맞이하여 구글에서 태극기를 검색하면 잘못 된 태극기 이미지가 최상단에 노출된다는 JTBC 방송국 관계자의 문의가 있었습니다. 뉴스에서 소개는 되지 못했지만, 관련된 내용을 알려드리고자 합니다.
전에 소개해 드린 것 처럼 나무위키는 구글을 잡아먹고 있습니다. 왠만한 검색어의 첫 페이지에는 여지없이 나무위키 웹문서가 노출됩니다. 그렇다면 이미지 검색은 어떨까요?
구글은 웹문서 검색엔진과 이미지 검색엔진을 운영하고 있으며, 이 둘은 별개로 작동되지만, 이미지가 어느 문서에서 노출되는지 계산하여 이미지 검색 결과의 순위를 결정합니다.
예를 들어서, 같은 트와이스의 이미지라도 페이지랭크(인용이 많이 된 논문이 저명성이 높다는 것을 링크가 많이 걸려진 웹문서 저명성이 높다로 살짝 바꾸어서 점수를 메기는 알고리듬) 점수가 높은 웹문서에 노출되는 이미지는 이미지 검색 결과에서도 상단에 노출됩니다.
그렇다면 왜 잘못 된 태극기 이미지가 태극기 검색에서 최상단에 뜨는 것일까요?
나무위키의 태극기 문서를 보면 과거의 많은 태극기 이미지가 노출됩니다.
네가지 이미지 중에서 왜 하필이면 1948년~1949년 까지 사용되었던 이미지의 가중치가 가장 높은 것일까요? 그 이유는 이 이미지가 어떤 서버에 올라가 있는지와 관계가 있습니다.
나무위키에서 현재의 대표 태극기 이미지는 나무위키 서버에 직접 업로드 되어 있습니다. 그리고, 위의 이미지들은 위키미디어라는 위키피디아에서 사용하는 이미지 서버에 올라가 있습니다. 나무위키의 경우에 이미지들을 자신의 서버에 캐싱을 하지만, 나무위키 미러들은 위키미디어 서버의 이미지를 그대로 사용합니다.
그렇다면, 구글은 어떤 이미지에 더 많은 가중치를 부여할까요? 나무위키가 국내에서는 굉장한 가중치를 가지고 있지만, 위키피디아에 비할 수는 없습니다. 따라서, 나무위키에 직접 올라가 있는 태극기 대표 이미지는 아쉽게도 구글 이미지 검색에서 상단에 위치할 수 없게 됩니다.
결국 국내에서 위키미디어 이미지 중 무엇을 자주 사용하느냐와 관계 없이, 가중치가 훨씬 높은 위키피디아에서 어떤 이미지가 더 많이 사용되었는지가 검색 순서에 영향을 미치게 됩니다. 그리고, 위키피디아에서는 한국 역사 문서에 더 자주 노출되는 1948~1949년에 사용된 태극기 이미지를 구글은 더 중요하다고 보게 됩니다.
이런 잘못 된 결과는 세가지 해결책이 있습니다.
첫번째, 구글이 웹문서 검색과 마찬가지로 이미지의 가중치를 지역별로 나누는 것입니다. 다시 말해서, 한국에서 태극기 이미지를 검색할 때 위키피디아의 가중치는 제외하면 이런 문제가 사라집니다.
두번째, 위키피디아 혹은 페이지랭크가 더 높은 사이트에 현재의 태극기 이미지를 최대한 많이 노출시키면 노출 순서가 바뀌게 됩니다.
세번째, 나무위키에서 이미지 서버로 위키미디어를 사용하지 않으면, 과거의 태극기 이미지 순위가 내려갈 가능성이 높아집니다.
인터넷은 서비스 제공자가 더 정확한 콘텐츠를 사용자에게 제공해야 되지만, 사용자의 많은 참여가 없다면 더 나은 콘텐츠를 공급받을 수 없습니다. 무엇보다도 위키피디아가 영문 서비스가 메인이지만, 그 곳에서 태극기의 과거 이미지가 현재의 이미지보다 더 높은 가중치를 받는 상황이 정상적이라고 볼 수 없겠지요.
Comments