The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Релиз движка для мета-поиска searx 0.7

06.02.2015 22:54

Вышла новая версия searx, свободного мета-поискового движка, работающего посредством комбинирования результатов выдачи различных поисковых систем. Это позволяет получать нейтральные (не зависящие от конкретного пользователя и поисковой системы) поисковые результаты и улучшает приватность, поскольку searx не хранит никаких данных о пользователе. Работает движок весьма быстро, так как поисковые запросы выполняются параллельно. Код проекта написан на языке Python и распространяется под лицензией AGPLv3.

Ключевым отличием от других мета-поисковиков, таких как Ixquick и DuckDuckGo, является поддержка неограниченного числа различных источников, реализованная с помощью специальных "адаптеров" на языке Python. В данной версии поддерживается около 40 различных источников, упорядоченных по категориям.

Открытый код движка позволяет любому использовать его на своём сервере, полностью контролируя работу программы. На текущий момент, searx уже установлен более чем на 20 публичных веб-сайтах, поддерживаемых пользователями.

  1. Главная ссылка к новости (https://github.com/asciimoo/se...)
  2. OpenNews: Релиз поискового движка Elasticsearch 1.0.0
  3. OpenNews: Открыт исходный код поискового движка Gigablast
  4. OpenNews: Поисковый движок Searchdaimon переведён в разряд свободных проектов
  5. OpenNews: Релиз поискового движка Apache Nutch 2.0
  6. OpenNews: Европейский Фонд СПО представил децентрализованную поисковую систему YaCy 1.0
Автор новости: dimqua
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/41624-searx
Ключевые слова: searx, search
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (31) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (-), 11:30, 07/02/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Сколько места занимает на диске "индекс" средненькой страницы?
     
     
  • 2.2, Аноним (-), 11:43, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Так как это метапоиск, объединяющий выдачи других поисковиков, то вряд ли он что-то индексирует.
     
     
  • 3.4, Аноним (-), 11:50, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • –3 +/
    > Так как это метапоиск, объединяющий выдачи других поисковиков, то вряд ли он
    > что-то индексирует.

    В чем смысл гонять через себя трафик? Особенно если информация о предпочтениях пользователей  не оседает (ложечки то нашлись, ух ты, и осадка не осталось ;)

     
     
  • 4.5, Аноним (-), 11:55, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Ты что, дурачек?)) Смысл в том, чтобы объединить выдачи других поисковиков и получить одну более лучшую выдачу. Возможно тебе стоит прочитать анонс, чтобы не задавать таких вопросов.
     
     
  • 5.11, ваноним (?), 12:57, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > получить одну более лучшую выдачу.

    а волшебной кнопочки "найти самый-более-лучший результат" там, случайно, нет?

     
  • 5.15, Аноним (-), 14:32, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Это невозможно. Каждый поисковик и так дает лучшую (для него) выдачу. Эта попытка намешать лучшие выдачи из разных поисковиков по каким-то замысловатым алгоритмам ни к чему кроме дублей результатов привести не может.
    Можно использовать как анонимайзер запросов, если твоим сервером поиска пользуешься не только ты. Ну и все.
     
     
  • 6.18, Аноним (-), 15:05, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > Это невозможно. Каждый поисковик и так дает лучшую (для него) выдачу. Эта
    > попытка намешать лучшие выдачи из разных поисковиков по каким-то замысловатым алгоритмам
    > ни к чему кроме дублей результатов привести не может.
    > Можно использовать как анонимайзер запросов, если твоим сервером поиска пользуешься не
    > только ты. Ну и все.

    Ну вот, одна хорошая мысль есть! Дубли можно группировать и помещать в "верх" выдачи.

     
     
  • 7.22, ваноним (?), 18:08, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    внезапно, это будет работать не на всех типах поисковых запросов
     
  • 7.25, dimqua (ok), 19:37, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Группировку дублей собираются сделать.
     
  • 5.16, Michael Shigorin (ok), 15:02, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Ты что, дурачек?))

    Нет, он спрашивает, какой смысл тратить _свой_ трафик на _публичный_ сервис.  И, возможно, подразумевает либо конечность альтруизма, либо интерес в виде перехвата и анализа.

    PS: Ваш вопрос с учётом выколотых глазок смайликов вообще занятный, да.

     
     
  • 6.28, Аноним (-), 13:05, 08/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Потому что публичный сервис предоставляет полезную функциональность и позволяет анонимам не тратить место на диске под индексы страниц))) Очевидное же разжевывать приходится))

    PS: ))))))

     
  • 5.17, Аноним (-), 15:03, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Ты что, дурачек?)) Смысл в том, чтобы объединить выдачи других поисковиков и
    > получить одну более лучшую выдачу. Возможно тебе стоит прочитать анонс, чтобы
    > не задавать таких вопросов.

    Может я и дурачек! Надеюсь Вас это не сильно обременяет.
    Но тема объединения сама по себе интересна (как хотя бы объединять?).

    Мне лень прочитать анонс (чукча писатель, а не читатель ;)

    Используем 10-ть поисковиков.
    Если даже 8-ть из 10-ти поисковиков выдают (по 10 ссылок на странице) хотя бы по 30% "мусора" (остальные два по 20%), складываем в рандомном порядке, получаем... Вам необходимо просмотреть 100 описаний с ссылками (по некоторым придется перейти), в которых 28% "мусора".
    Не забывайте Вы ни как не можете повлиять на количество "мусора" выдаваемого сторонними поисковиками (пока сами не проиндексируете выданные ими ссылки на предмет например "релевантности" для полученного Вами от пользователя запроса).

    Один "правильный" (выбранный Вами) с вашей точки зрения поисковик, при правильно составленном Вами запросе выдаст Вам 10 результатов на странице из которых 20% "мусора". Даже при просмотре первых 3-х станиц Вы сэкономите только на "мусоре" 24% времени (не говоря о том, что остальные 7-мь Вам может быть и не придется просматривать).

    Так что если Вы правильно объединяете, то это может быть very and very well for You!


     
     
  • 6.30, h4ck3r1337 (ok), 13:32, 08/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Я ничего не объединяю, а пересказываю назначение прожекта из новости. Я не собираюсь проводить икспертизу о том, можно ли такой метапоиск реализовать или нельзя, т.к. не искперт и даже код этого поделия не смотрел (как и ты).
     
  • 4.13, YetAnotherOnanym (ok), 13:42, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > одну более лучшую выдачу'

    И как оно определит, какие результаты для меня более лучшие? Если в сабже есть какие-то особые магические методы улучшить релевантность выдачи, гугл внедрит их у себя на следующий день после релиза.

     
     
  • 5.14, Аноним (-), 14:13, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Во-первых, не внедрит, потому что гугл ориентируется на среднестатистического пользователя, и фичи улучшающие выдачу для отдельных небольших групп требуют больше средств на поддержку чем дают профита. Он всегда будет середнячком "для всех".
    Во-вторых, гугл скорее внедрит у себя больше рекламы и проплаченных ссылок.
    В-третьих, то что гугл заблочил по велению копирастов или роскомнадзора, найдётся из других источников.
    В-четвёртых, гугл всё-таки интексирует web, а сюда можно прикрутить специализованные поиски.
     
     
  • 6.26, dimqua (ok), 19:43, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > Он всегда будет середнячком "для всех".

    Эх, если бы, они уже давно "пузырь фильтров" внедрили. http://dontbubble.us/?kad=ru_RU

     
  • 4.19, Аноним (-), 15:05, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Смысл в том, что если у нас есть куча корпоративных приложений, каждое из которых имеет свой поисковый движок, неплохо бы иметь возможность собрать всё в одном месте.

    Только писать это надо явно не на питоне.

     
     
  • 5.21, Аноним (-), 17:12, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    я ни разу не фанат питона, но не могли бы вы пояснить почему?
     
     
  • 6.23, рожатель_кирпичек (?), 18:20, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    > я ни разу не фанат питона, но не могли бы вы пояснить
    > почему?

    Патамушта надо на джаве или .NET

     
  • 6.24, Аноним (-), 18:34, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Ну хотя бы потому, что для жавы полно быстродействующих средств для построения/обработки индексов, анализа текста и пр. Да и интегрировать какой-нибудь kerberos в питон-приложение для включение в вин-домен, по-моему откровенное извращение. При этом такие задачи интеграции решит любой jBoss.
     
     
  • 7.29, Аноним (-), 13:24, 08/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Этот поисковик не строит индексы и не анализирует тексты. Делоть хттп запросы и простенько мержить выдачи можно и на питоне вполне ок.
     

  • 1.3, Аноним (-), 11:45, 07/02/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    ищет впечатляюще
     
     
  • 2.12, angra (ok), 13:11, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Понравилось, что пишет откуда получает данные. Сделал с десяток запросов. Все адекватное выдал google. Когда у google появится хоть один серьезный конкурент, будет польза от таких проектов.
     

  • 1.6, YetAnotherOnanym (ok), 12:13, 07/02/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А чо, сам я не могу прочитать страницу с результатом поиска и сделать выводы своей головой?
     
  • 1.7, Аноним (-), 12:14, 07/02/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • –3 +/
    эмм,
    > git clone git@github.com:asciimoo/searx.git && cd searx
    > Cloning into 'searx'...
    > Permission denied (publickey).
    > ...
     
     
  • 2.8, Аноним (-), 12:16, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +1 +/
    1) man git
    2) https://help.github.com/
    3) git clone https://github.com/asciimoo/searx.git
     
     
  • 3.9, Аноним (-), 12:21, 07/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    ok
     

  • 1.10, Аноним (-), 12:29, 07/02/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Тенденция потрясающая. Проект отличный. Поиск пока подхрамывает, но все впереди. Успехов в развитии.
     
  • 1.20, CSRedRat (ok), 15:28, 07/02/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Яндекса в списке источников нет.
     
     
  • 2.27, count0krsk (ok), 12:49, 08/02/2015 [^] [^^] [^^^] [ответить]  
  • +/
    Тем не менее ищет неплохо. Добавил себе )
     

  • 1.31, Виталий (??), 19:06, 08/02/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Чем Nigma не устраивала http://info.nigma.ru/index.html
     
     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру