The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги | ]

15.02.2017 22:41  В Москве состоится семинар о полнотекстовом поиске в PostgreSQL

21 февраля в Москве состоится открытый семинар (митап) #RuPostgres, основной темой которого станет полнотекстовый поиск. Планируется выступление Фёдора Сигаева и Артура Закирова. На семинаре будет показано как организовать полнотекстовый поиск по массиву текстов, рассказано про фасетный поиск, новинки свежей версии PostgreSQL и новый индекс RUM. Вопросы можно присылать заранее, чтобы докладчики включили ответы в своё выступление. Участие бесплатное, необходима регистрация. Также планируется онлайн-трансляция для участников сообщества #RuPostgres.

  1. Главная ссылка к новости (https://www.meetup.com/postgre...)
Автор новости: postgresman
Тип: К сведению
Ключевые слова: postgresql
При перепечатке указание ссылки на opennet.ru обязательно
Обсуждение Ajax/Линейный | Раскрыть все сообщения | RSS
 
  • 1.1, Аноним (-), 12:33, 16/02/2017 [ответить] [показать ветку] [···]    [к модератору]
  • +/
    Чем отличается обычный sql запрос по всей базе от полнотекстового поиска?
     
     
  • 2.4, Аноним (-), 14:15, 16/02/2017 [^] [ответить]     [к модератору]
  • +/
    Подсистема полнотекстового поиска по сути индексирует поля, которые невозможно п... весь текст скрыт [показать]
     
     
  • 3.5, Аноним (-), 14:23, 16/02/2017 [^] [ответить]    [к модератору]  
  • +/
    спасибо!
     
     
  • 4.10, Аноним (-), 20:23, 16/02/2017 [^] [ответить]    [к модератору]  
  • +/
    нзч
     
  • 3.11, Фтщт (?), 21:11, 16/02/2017 [^] [ответить]    [к модератору]  
  • –1 +/
    зачем придумывать если не знаешь?
     
  • 2.6, Аноним (-), 14:28, 16/02/2017 [^] [ответить]     [к модератору]  
  • +/
    Не спец по postgres, но в других субд колонки типа varchar имеют ограничения по ... весь текст скрыт [показать]
     
  • 2.9, КО (?), 17:11, 16/02/2017 [^] [ответить]    [к модератору]  
  • +/
    А это и есть запрос типа:
    А найди ка мне такие строки в Которых упоминаются слова Иванов,Иван,Иванович неподалеку друг от друга и в любом падеже, на крайняк любое из них с инициалами.
     
  • 2.13, KonstantinB (ok), 00:59, 17/02/2017 [^] [ответить]    [к модератору]  
  • +/
    Вот есть у тебя какая-нибудь энциклопедия на 100500 страниц, а в конце алфавитный указатель вида "абажур - стр. 4, 51, 82".

    Если ты будешь перелистывать в поиске абажура все 100500 страниц - это будет обычный SQL-запрос по базе. Если воспользуешься указателем - это будет в первом приближении то, как работает полнотекстовый поиск (по одному слову).

    Если хочется понаучнее - почитай про инвертированные индексы и про алгоритмы-структуры полнотекстового поиска, заточенные под естественный язык (стеммеры, расстояния между словами, вот это все).

     
  • 1.3, DmA (??), 13:44, 16/02/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • –3 +/
    Очень редко тут пишут новости Постгресмены - все две новости у них, одна сегодня, вторая в  далёком 2007 году.
     
  • 1.7, Ilya Indigo (ok), 16:28, 16/02/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    Надеюсь Sphinx они не обойдут стороной и хотя бы сделают сравнение по производительности, нагруженности и гибкости по сравнению с нативными решениями.
     
     
  • 2.8, QuAzI (ok), 17:03, 16/02/2017 [^] [ответить]    [к модератору]  
  • +/
    Как раз тоже вспомнил о нём. Ни в одной СУБД не видел таких возможностей текстового поиска встроенных, обычно всё грустненько и на семинар не тянет ну никак.
     
  • 2.12, Vz (?), 23:00, 16/02/2017 [^] [ответить]    [к модератору]  
  • +2 +/
    что именно есть в sphinx, чего нет в постгресе?
     
     
  • 3.15, QuAzI (ok), 11:48, 17/02/2017 [^] [ответить]    [к модератору]  
  • +/
    > что именно есть в sphinx, чего нет в постгресе?

    Например стемминг, словоформы (типа алиасов, например замена см->сантиметр, чтобы получать равноценный выхлоп), поиск одной фразы по нескольким колонкам с ранжированием результатов выдачи (формула ранжирования задаётся весьма гибко)

     
     
  • 4.20, Аноним (-), 22:59, 17/02/2017 [^] [ответить]    [к модератору]  
  • +/
    О чём вы? Не уверен насчёт ранжирования, но стеминг и алиасы в postgres есть.

    У sphinx есть интересные оптимизации, архитектура, об этом бы рассказали.

     
     
  • 5.21, QuAzI (ok), 23:45, 17/02/2017 [^] [ответить]    [к модератору]  
  • +/
    Пруфы в студию, пожалуйста. А то может народ зря люцены и сфинксы во все места втыкает чтобы поиск был хотя бы на поиск похож
     
  • 4.22, Michael Shigorin (ok), 20:09, 19/02/2017 [^] [ответить]    [к модератору]  
  • +/
    >> что именно есть в sphinx, чего нет в постгресе?
    > Например стемминг, словоформы [...]

    Кстати, если кому понадобится, но не подойдёт по каким-то причинам сфинкс -- гляньте ещё xapian.

     
  • 2.17, Аноним (-), 15:02, 17/02/2017 [^] [ответить]    [к модератору]  
  • +2 +/
    Есть сравнение но 5-летней давности http://lib.custis.ru/Сравнение_движков_полнотекстового_поиска
     
     
  • 3.18, Ilya Indigo (ok), 15:46, 17/02/2017 [^] [ответить]    [к модератору]  
  • +/
    > Есть сравнение но 5-летней давности http://lib.custis.ru/Сравнение_движков_полнотекстового_поиска

    Благодарю.
    Тут видно, что реализация Sphinx всех уделывает, и мне кажется, что и сейчас мало что изменилось.
    Посмотрим на отчёты с конференции.

     
     
  • 4.19, Аноним (-), 15:56, 17/02/2017 [^] [ответить]    [к модератору]  
  • +/
    Ну как минимум вот пилится новый индекс RUM, он вроде как заточен под текстовый поиск. В самом постгресе его ещё нет (он всё же ещё но не доделан) но можно собрать самому.
     
  • 4.23, Горегоре (?), 10:54, 21/02/2017 [^] [ответить]    [к модератору]  
  • +/
    Solr?
     
     
  • 5.24, Ilya Indigo (ok), 00:09, 22/02/2017 [^] [ответить]    [к модератору]  
  • +/
    > Solr?
    > Lucene — это Java...

    Дальше этих слов не читал.

     
  • 1.16, имя (?), 13:58, 17/02/2017 [ответить] [показать ветку] [···]    [к модератору]  
  • +/
    https://postgrespro.ru/docs/postgresql/9.6/indexes-types
     

     Добавить комментарий
    Имя:
    E-Mail:
    Заголовок:
    Текст:


      Закладки на сайте
      Проследить за страницей
    Created 1996-2018 by Maxim Chirkov  
    ДобавитьПоддержатьВебмастеруГИД  
    Hosting by Ihor