Klient wchodzi do sklepu z elektroniką i wpisuje "coś do słuchania muzyki na siłowni". Wyszukiwarka SQL zwraca zero wyników albo losowe produkty z opisem zawierającym słowo "muzyka". Klient wychodzi. Sprzedaży nie ma.

To nie jest wymyślony scenariusz. To codzienność większości sklepów internetowych, które wciąż opierają wyszukiwanie wyłącznie na dopasowaniu słów kluczowych. Semantic search rozwiązuje ten problem. I coraz częściej pojawia się jako standard, nie jako dodatek premium.

Czym jest semantic search?

Klasyczne wyszukiwanie działa prosto: bierze słowa z zapytania i szuka dokumentów, które te słowa zawierają. "Słuchawki sportowe" znajdzie produkty z frazą "słuchawki sportowe" w nazwie lub opisie. Jeśli produkt nazywa się "earbudy do biegania", przepadnie.

Semantic search działa inaczej. Zamiast porównywać słowa, porównuje znaczenie. Każde zapytanie i każdy produkt jest zamieniany na wektor, listę liczb reprezentującą jego semantyczny sens w wielowymiarowej przestrzeni. Produkty i zapytania o podobnym znaczeniu mają wektory blisko siebie.

Efekt: "coś do słuchania muzyki na siłowni" znajdzie słuchawki sportowe, earbudy treningowe i bezprzewodowe słuchawki do aktywności fizycznej, nawet jeśli żadne z tych słów nie pojawia się dosłownie w zapytaniu.

Jak to działa technicznie?

Podstawą są modele językowe zwane modelami embeddingowymi. Przyjmują tekst i zwracają wektor o stałej długości, zazwyczaj kilkaset liczb zmiennoprzecinkowych. Modele trenowane na miliardach zdań "rozumieją" że "rower górski" i "MTB" są semantycznie bliskie, a "rower" i "kask" są powiązane kontekstem.

W praktyce w e-commerce wygląda to tak:

•Przy dodaniu produktu do indeksu, generujesz embedding dla nazwy, opisu i kategorii produktu. Wektor zapisujesz obok standardowych pól w bazie wyszukiwania.
•Przy zapytaniu użytkownika, generujesz embedding dla zapytania i szukasz produktów których wektory są najbliżej wektora zapytania. To nazywa się wyszukiwaniem najbliższych sąsiadów (nearest neighbor search).

Hybrid search, dlaczego samo semantic nie wystarczy

Samo wyszukiwanie wektorowe ma słabości. Klient który wpisuje konkretny numer katalogowy "AKG K702" albo SKU produktu oczekuje dokładnego trafienia, nie semantycznie podobnych słuchawek. Dla precyzyjnych zapytań keyword search jest niezastąpiony.

Dlatego w praktyce stosuje się hybrid search, połączenie obu podejść. Wyniki z keyword search i vector search są łączone i rerankowane. Parametr alfa kontroluje proporcje: jak bardzo semantic wpływa na ranking w stosunku do keyword.

Wartość 0.2 oznacza że 80% rankingu pochodzi z dopasowania słów kluczowych, a 20% z podobieństwa semantycznego. To dobry punkt startowy dla większości sklepów e-commerce gdzie klienci często szukają po konkretnych nazwach produktów.

Gdzie semantic search naprawdę pomaga

•Zapytania intencyjne bez słów kluczowych produktu, "prezent dla taty mechanika", "coś na ból kolan podczas biegania". Tego keyword search nie obsłuży nigdy.
•Synonimy i żargon branżowy, "tacker" zamiast "zszywacz", "nailer" zamiast "gwoździarka". Zamiast budować ręcznie słownik synonimów, model sam rozumie powiązania.
•Zapytania opisowe bez nazwy produktu, "urządzenie do robienia kawy bez kapsułek", "mata do ćwiczeń do salonu". Klient opisuje co chce, nie jak to się nazywa.

Czego semantic search nie zastąpi

•Precyzyjnych zapytań z numerami katalogowymi, SKU, kodami EAN. Tam keyword wygrywa bezapelacyjnie.
•Bardzo krótkich zapytań jednosłownych, "nike", "lego", "samsung". Jedno słowo ma zbyt słaby sygnał semantyczny. Warto wyłączyć semantic dla zapytań krótszych niż 3 słowa.
•Filtrowania cenowego i atrybutowego, "czerwone buty rozmiar 42 do 200 zł". To zadanie dla filtrów, nie dla embeddingów.

Koszty i wydajność

Największa bariera wejścia to czas generowania embeddingu. Wywołanie zewnętrznego API dla każdego zapytania to 50-200ms latencji, co dla wyszukiwarki działającej w milisekundach jest katastrofą.

Rozwiązanie jest proste: embeddingi produktów generujesz raz przy dodaniu do indeksu, nie przy każdym wyszukiwaniu. Przy zapytaniu użytkownika generujesz embedding tylko dla krótkiego tekstu zapytania, a to na lokalnym modelu zajmuje 15-30ms.

Modele open source jak paraphrase-multilingual-MiniLM-L12-v2 obsługują język polski i działają sensownie na CPU, bez GPU i bez płatnych API. Na standardowym VPS z 4GB RAM model odpowiada w kilkanaście milisekund.

Semantic search przestaje być funkcją zarezerwowaną dla dużych graczy z budżetem na AI. SwiftSearch ma go wbudowanego w plany Business i Pro, działa na naszych serwerach, bez żadnych zewnętrznych kluczy API ani dodatkowych kosztów per zapytanie.

Przetestuj SwiftSearch bezpłatnie przez 14 dni →

Artykuł opublikowany w 2026 roku. Ceny i parametry planów mogą ulec zmianie, sprawdź aktualne informacje na stronach dostawców.