Amikor lekérdezést ír be a keresőmotor oldaláravagy a böngésző keresősávjában (a képernyő tetején) olyan események kezdődnek, amelyek el vannak rejtve a hétköznapi felhasználóktól. Hogyan szükséges az információ a hatalmas világhálón, és mi a relevancia? Maga a szó a latin "relevo" származik, és oroszra fordítva: "lift" vagy "könnyebb". A kifejezés angol megfelelője releváns. A GOST 7.73-96 3.5.1. Pontjában ezt a fogalmat megfejtették, és a "relevancia" és a "releváns" meghatározása megegyezik, amely a kapott információknak a felhasználó által benyújtott információkérésnek felel meg.
Ez az állami szabvány másokat is tartalmazHasznos, szabványosított fogalmak és meghatározások az információkeresés és terjesztése terén, automatizált információs rendszerek segítségével. A dokumentum segít megérteni sok szó jelentését az információs, kiadói vagy könyvtári tevékenységekben, és nem csupán egy olyan nyelvi egységet, mint a „relevancia”. A „kontinens” és a „kontinens” fogalmak meghatározását a GOST 7.73-96 3.5.2. Ezeket úgy kell értelmezni, mint a kapott információk adatainak az információigényeknek való megfelelését. Ezt a fogalmat gyakran összekeverik a relevanciával, ami alapvetően nem igaz, mivel az egyik esetben a kérelem összeegyeztetéséről, a másikon az igények összeegyeztetéséről van szó. Helytelen azt is megválaszolni, hogy „mi a relevancia?” Annak megválaszolása, hogy ez a kifejezés közel áll a „megfelelőség” fogalmához, vagyis az eredmény gyakorlati alkalmazhatóságához.
De hogy vannak még az információk?A keresőmotor robotok seregét használja - önálló programokat, amelyek webhelyeket látogatnak meg, és információkat tárolnak róluk. Ez a név a "bot" angol szóból származik, vagyis a "robot" rövidítve. Ezek a programok új webhelyeket találnak, majd a főoldalra lépnek, és böngészhetik annak tartalmát. A robotok megtanulják az otthoni (a böngészőben először betölti) belső linkeket tartalmazó oldalakat. A botprogramok más linkekre mutató hivatkozásokat is megnéznek, vagyis külső linkekre. Ezen információ megőrzése után rákattintanak, felfedeznek új webhelyeket és megtudják, hogyan kapcsolódnak a webes erőforrások. Fáradhatatlanul tanulmányozzák a világtérkép "térképét". De mi a relevancia? Mi köze van a robotoknak?
Egy konkrét példára nézze meg, mit kínálnakkeresők Yandex és Google. A „mi a relevancia?” Kérdésre a Yandexben 28 millió választ találtak, a Google-nak pedig 155 ezer válaszát. Itt mondhatjuk, hogy mindegyik megfelel a kérésnek, de nem mindegyik követelmény, vagyis nem mindegyik lesz kontinentális. Például kétségtelenül hasznosak lennének azok az oldalak, ahol a Wikipedia vezérigazgatója ismerteti ezt a fogalmat, és a releváns és irreleváns költségeket tartalmazó webhely a döntések meghozatalakor nem releváns e témában. Nyilvánvalóbb példa az, amikor a Yandex 31 millió választ adott ki a „kéz fel” kérésre, amely azt jelentette, hogy információt kellett kapni egy zenei csoportról, és köztük volt egy cikk, amely felszólította a kéz emelését, mivel ez a gyógytornászok szerint nagyon hasznos. Egy ilyen válasz nem tekinthető kontinensnek, bár a 31 millió válaszból 586 helyet foglal el a kérdésben.
Így minél nagyobb a szöveg relevanciája, avalószínűbb, hogy beírja a keresési válaszok első pozícióit. Ez a mutató kvantitatív értékeléssel rendelkezik, de a különféle keresőmotorokban történő alkalmazásának algoritmusai eltérőek és ismeretlenek a felhasználók számára, és idővel megváltoznak, mivel a keresőmotorok, a rangsorolás növekedésével próbálnak releváns információt szolgáltatni, csökkentve a kereséshez szükséges időt. Nagyon releváns oldalak azok, ahol a lekérdezésnek megfelelő kulcsszó előfordulása 3 és 7% között lehet. De ez nem az egyetlen kritérium a dokumentum relevanciájának. Ezek számos belső és külső mutatót tartalmaznak. A belső mutatók (kivéve a kulcsszavak sűrűségét) a helyük a szövegben (előfordulás a címsorban, a címsorhoz való közelség és egymáshoz való közelség, a valószínű keresési kifejezések kialakításával), valamint a szinonimák jelenléte, amelyek megerősítik a szövegtartalom és a kérés megfelelőségét. A fő külső mutatót a globális hálózat népszerűségének tekintik, amelyet a PageRank a Google számára, a TIC a Yandex számára és a Tor100 jelzi a Rambler rendszer számára. Vagyis az, hogy milyen gyakran jönnek az emberek más webhelyekre, jobb, ha magas minősítéssel rendelkeznek. Ez a relevancia.