В статье "Automatic Geotagging of Russian Web Sites" рассказывается об особенностях определения географического положения сайта поисковой системой Yandex.
Интересно, что кроме оценки географической принадлежности IP адреса и домена, используются такие методы, как анализ телефонных кодов городов и географических названий на страницах ресурса или выделение типовых сокращений имен городов в URL.
Второй документ "Extracting News-Related Queries from Web Query Log" знакомит читателей с алгоритмом выделения из общего потока поисковых запросов, обращений связанных с поиском новостей.
|