Комментарии 6
Представьте, что вы ищете «здоровые закуски», а поиск выдаёт результаты вроде «ореховой смеси», «фруктовых батончиков» и даже «низкокалорийной гранолы».
На практике почему-то обычно получается ровно наоборот - я ищу "низкокалорийную гранолу", а ваши умные векторные поиски выдают мне "здоровые закуски". И хрен заставишь их искать именно то, что я сказал, а не то, что они навекторили.
Векторный поиск идеально подходит для:
Рекомендации продуктов или контента на основе интересов пользователей.
Ну то есть это инструмент не для того, чтобы покупатель нашел продукт, а для того, чтобы продукт нашел покупателя.
Пришел на этот пост с поисковика по слову "Sphinx" а он оказался только в тегах, я огорчен, может поправите это недоразумение?
"превращает запросы и документы в математические модели, называемые векторами, или эмбеддингами ". Неправильное понимание как рассчитываются эмбеддинги
"Эти векторы размещаются в многомерном пространстве, что позволяет векторному поиску понимать смысл слов". Нет там понимания смысла, нам есть косинусное сходство или иные метрики.
Уважаемый автор, так нельзя, уважительнее надо относиться и к себе и к читателям
Спасибо. Сделал этот параграф более корректным с точки зрения просвещённого специалиста. Вообще, идея поста была рассказать очень поверхностно про тему, а это требует упрощения каких-то вещей и избежания терминов типа "косинусное сходство", и "евклидово расстояние". Если интересно, про эти вещи подробнее написано в другом блогпосте на нашем сайте - https://manticoresearch.com/blog/vector-search-in-databases/
Полнотекстовый поиск vs. Векторный поиск