2015년 8월 2일 일요일

검색 순위를 결정하는 원칙은 어떻게 되나요?

네이버 통합검색의 랭킹 시스템
1) 네이버 통합검색의 순위 결정 시스템

네이버 검색 서비스에서는 세계 최초로 하나의 검색어에 대해
다양한 ‘컬렉션’을 한번에 보여주는 ‘통합검색’ 서비스를 제공하여, 하나의 검색어에 대해
이용자가 다양한 종류의 컨텐츠를 접할 수 있는 기회를 제공하고 있습니다.

이때 ‘컬렉션’ 은 뉴스, 이미지, 지식iN, 사이트, 웹, 지역 정보 등
컨텐츠를 특성에 따라 나눈 그룹이고, ‘통합검색’은 하나의 검색어에 대하여
다양한 컬렉션을 한번에 보여주는 검색을 뜻합니다.

네이버 검색 서비스에서는 이용자가 원하는 컨텐츠를 보다 신속하고 정확하게 제공하기 위해,
네이버 통합검색에 컬렉션 별 랭킹 시스템과 컬렉션 간 랭킹 시스템을 적용하고 있습니다.

- 컬렉션 별 랭킹 모델

네이버 통합검색에서는 각 컬렉션 별로 특성에 따라 각기 다른 랭킹 모델을 적용하고 있습니다.

예를 들어, 뉴스 컬렉션에는 최신성이 중요하게 반영된 ‘뉴스랭킹 모델’이,
지식iN에는 최신성, 유사도, 그리고 답변자에 대한 신뢰도까지 고려한 ‘지식iN랭킹 모델’이
적용되는 등, 각 컬렉션 별로 검색어에 가장 부합한 특성의 정보를 제공하고 있습니다.

특히, 컬렉션의 랭킹 모델은 또 다른 컬렉션의 랭킹 모델과도 미세하게 조율되어 있어,
각 컬렉션 별로 가장 적합한 컨텐츠를 다른 컬렉션과 중복되지 않게 보여주고 있습니다.

예를 들어, 동계올림픽에서 은메달을 딴 '김연아' 키워드 검색 결과의 경우
뉴스 컬렉션에는 김연아의 경기결과 뉴스가, 블로그 컬렉션에는 김연아와 아사다 마오를 비교한
블로거의 평가글이, 사이트 컬렉션에는 김연아의 공식 홈페이지 및 관련 사이트 검색 결과가 나오고 있어, 각 컬렉션마다 김연아를 검색한 이용자들에게 유용한 정보를 제공해주고 있습니다

[네이버 통합검색의 랭킹 시스템]


- 컬렉션 간 랭킹 모델

네이버 검색 서비스에서는 컬렉션 별 뿐만 아니라,
컬렉션 간에도 '컬렉션 랭킹'이라는 알고리즘을 적용하고 있습니다.

네이버 통합검색은 ‘지식iN’, ‘사전’, ‘뉴스’, ‘블로그’ 등 컬렉션들의 노출순서가
고정되어 있지 않고, 컬렉션 랭킹에 따라 그 순서가 유동적으로 변하게 됩니다.

네이버 통합검색은 이용자들의 검색 행동 분석을 통한 컬렉션 랭킹을 적용하여,
이용자가 원하는 정보가 속할 확률이 높은 컬렉션부터 순서대로 검색 결과에 보여줍니다.

따라서, 네이버 통합검색은 하나의 키워드에 대하여 해당 시점에
다수의 이용자들이 선호하는 정보에 적합한 컬렉션 순으로 검색 결과를 제공하고 있습니다.

예를 들면, '트라우마'라는 키워드의 경우 트라우마의 뜻이나 극복법 등에 대한
이용자들의 니즈가 높아 사전, 지식iN 컬렉션이 상단에 위치하게 되고,
가수 '이문세'의 경우는 인물정보와 음악 컬렉션이 검색 결과 상단에 위치하게 됩니다.

2) 검색 알고리즘의 요소

검색 결과의 노출 순위를 결정하는 검색 알고리즘은 검색결과가 이용자의 니즈에 얼마나
부합하는가를 결정하는 '적합도'를 판단하기 위한 것으로, 네이버 검색 서비스에서는 적합도 판단에 있어
문서와 검색어 간의 유사성, 문서 자체의 품질, 이용자 선호도 등을 고려하고 있습니다.

- 유사성

이용자가 입력한 검색어가 문서 내에 얼마나 잦은 빈도로 발견되는지,
문서 내에 어떤 위치에서 발견되는지 등 문서와 검색어 간의 유사도가 적합도 산출에 반영됩니다.

- 문서 품질

해당 문서에 걸린 링크의 수, 다양한 형태의 정보 포함 여부, 문서를 포함한 사이트의
업데이트 정도 등 문서 자체가 가지는 고유한 특성이 적합도 산출에 반영됩니다.

- 이용자 선호도

해당 문서에 얼마나 많은 이용자가 방문했는지, 이용자가 해당 문서에 얼마나 오래 머물렀는지 등
문서에 대한 이용자들의 행동패턴 역시 적합도 산출에 반영됩니다.

3) 검색 품질 관리

검색결과가 홍보 수단으로 활용되면서 각종 소프트웨어, 로봇 및 자동화된 도구를 이용해서 기계적으로
다량의 문서를 생성하거나 특정 문서를 노출시키려는 악의적인 시도 등이 늘고 있는데, 이러한
어뷰즈 행위는 검색 품질을 훼손하고 이용자의 불편을 초래하기 때문에 적극적으로 차단하고 있습니다.

네이버는 과학적인 방법을 동원해 어뷰즈를 정밀하게 필터링하여
서비스에 영향을 끼치지 않도록 하고 있으며, 기존 서비스 운영 경험을 통대로
어뷰즈 필터링 로직을 지속적으로 개선하고 있습니다.

다만, 검색결과 어뷰즈 판정 기준이 알려질 경우 이를 우회한 새로운 어뷰즈 공격이 생기게 되고,
그에 따라 대다수 선의의 이용자들이 피해를 볼 수 있습니다.

따라서, 네이버는 정책적으로 어뷰즈 필터링 로직과 해당 로직을
역으로 추정할 수 있는 어뷰즈 필터링 결과를 외부에 공개하지 않고 있습니다.

원본출처 : https://goo.gl/azmTK4

댓글 없음:

댓글 쓰기