Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Область

Элемент

Описание

Механика

Вид

Область результатов

Список результатов

Поиск по алгоритмам поисковой системы OpenSearch, при помощи функционала стемминга (поиск по основе слова)

  • При ошибке раскладки (например, “rfr yfqnb” вместо “как найти“), поиск все еще понимает, что пользователь запрашивает, то есть меняет запрос на кириллическую раскладку и происходит поиск будто запрос происходил на русском языке

  • Поиск игнорирует стоп-слова, к которым обычно относятся такие общие термины, как артикли, предлоги, местоимения, служебные глаголы и т.п. При вводе поискового запроса, который содержит только стоп-слово оно игнорируется и пользователь видит заглушку о том, что результаты не найдены.

    Для каждого языка предусмотрен свой список стоп-слов:

  • Список стоп-слов для русского языка https://github.com/apache/lucene/blob/main/lucene/analysis/common/src/resources/org/apache/lucene/analysis/snowball/russian_stop.txt

  • Список стоп-слов для английского языка https://github.com/apache/lucene/blob/main/lucene/analysis/common/src/java/org/apache/lucene/analysis/en/EnglishAnalyzer.java#L48

Поиск внутри документа - возможность загружать в контейнер OpenSearch файлы в форматах pdf для их обработки и поиска по ним

В результатах поиска выводится:

  • Название модуля

  • Иконка pdf + название файла со ссылкой на открытие

  • Цитата из файла, по которой найдено совпадение

...