기술 개요

Google은 '완벽한 검색 엔진'을 개발하기 위해 언제나 심혈을 기울이고 있습니다. 공동 창립자인 Larry Page는 완벽한 검색 엔진이란 “사용자의 의도를 정확하게 이해하고 사용자가 원하는 결과를 정확하게 제공하는" 검색 엔진이라고 정의합니다. 그러한 취지에서 Google은 혁신적인 기술을 추구해왔고 기존 모델의 한계를 거부했습니다. 그 결과 Google만의 독자적인 인프라를 개발하고, 검색 수행 방식을 근본적으로 바꿔 놓은 PageRank™ 기술을 선보이게 되었습니다.

Google 개발자들은 가장 빠르고 정확한 결과를 제공하기 위해서는 새로운 종류의 서버 설정이 필요하다는 사실을 처음부터 잘 알고 있었습니다. 대부분의 검색 엔진은 몇 대의 대형 서버로 운영되었기 때문에 사용량이 많아지면 종종 속도가 느려지곤 했지만, Google은 PC를 연결하여 사용하기 때문에 각 검색에 대한 답을 신속하게 찾을 수 있도록 했습니다. 이러한 혁신적인 방법으로 검색 소요시간이 크게 단축되고 확장성이 향상되었으며 비용은 줄어들었습니다. 다른 업체들이 이 아이디어를 모방하기에 급급할 때 Google은 이 백엔드(back-end) 기술을 끊임없이 다듬고 효율성을 높여갔습니다.

Google 검색 기술의 기반이 되는 소프트웨어는 1초 이내에 수많은 일련의 계산을 동시에 수행합니다. 일반적인 검색 엔진은 검색어가 웹페이지에 등장하는 빈도에 의존하지만 Google은 PageRank™ 기술을 사용하여 웹의 전체 링크 구조를 검토하고 어떤 페이지가 가장 중요한지 판단합니다. 그 다음 하이퍼텍스트 매칭 분석을 통해 입력한 검색어와 관련 있는 페이지를 찾습니다. 전체적인 중요도에 검색어와의 관련성을 더하는 방식이 Google이 사용자가 찾는 정보를 제공하는 방식입니다.

  • PageRank 기술:PageRank는 5억 개 이상의 변수와 20억 개 항으로 구성된 방정식을 계산하여 웹페이지의 중요도를 객관적으로 평가합니다. 직접 연결되는 링크의 일반적인 숫자로 계산하는 것이 아니라 페이지 A에서 페이지 B로 연결된 링크 하나를 페이지 A가 페이지 B에게 던지는 한 표로 해석하여 특정 페이지의 득표 수를 기준으로 해당 페이지의 중요도를 평가합니다.

    또한 PageRank는 특정 페이지의 중요도를 고려하여 중요한 페이지로부터 한 표를 받은 경우 일반적인 페이지보다 더 큰 값을 지정합니다. 중요한 페이지는 더 높은 PageRank 점수를 받고 검색결과의 상단에 표시됩니다. Google의 기술은 웹의 집단적 지능을 사용하여 페이지의 중요도를 결정합니다. Google에는 돈을 받고 검색결과를 변경하는 등 사람의 개입이나 결과 조작이 없기 때문에 객관적인 정보 제공자로서 사용자의 신뢰를 받습니다.

  • 하이퍼텍스트 매칭 분석: Google 검색 엔진은 페이지의 콘텐츠도 분석합니다. 그러나 Google은 페이지 기반의 텍스트를 단순히 스캔하는 것으로 그치지 않습니다. 사이트 운영자가 메타 태그를 통해 조작할 위험이 있기 때문입니다. 그 대신 페이지의 전체 콘텐츠를 분석하고 글꼴, 구획 및 단어의 정확한 위치까지 고려합니다. 또한 인접한 웹페이지의 내용도 분석하여 검색결과가 검색어와 가장 관련성이 높은 것인지 확인합니다.

Google의 혁신적인 기술은 컴퓨터에 한정된 것이 아닙니다. 모바일 장치를 통해 웹에 액세스하는 사용자 역시 정확하고 신속한 검색결과를 얻을 수 있도록 Google은 HTML을 WAP, i-mode, J-SKY 및 EZWeb에 최적화된 형식으로 즉시 변환하는 최초의 무선 검색 기술을 개발했습니다. 현재 Google은 AT&T Wireless, Sprint PCS, Nextel, Palm, Handspring, Vodafone을 비롯한 유수의 기업에게 무선 기술을 제공합니다.

Google 검색어의 일생

Google 검색어의 수명은 보통 0.5초도 안되지만, 정보를 찾는 사용자에게 검색결과가 전달되기까지 여러 단계를 거쳐야 합니다.


3.
검색결과가 1초도 안되어 사용자에게 제공됩니다.
   1. 웹서버가 검색어를 색인 서버로 보냅니다. 책의 맨 뒤에 있는 색인 페이지처럼 색인 서버에 있는 콘텐츠는 검색어와 일치하는 단어가 어느 페이지에 있는지 알려줍니다.
2. 검색어는 doc 서버로 이동하며, 해당 서버에서 실제로 저장된 문서가 검색됩니다. 검색이 끝나면 각 검색결과를 설명하는 발췌문(snippet)이 생성됩니다.
   ©2010 Google - - Google 정보 - 개인정보 보호정책 - 서비스 약관