Prilikom unosa upita na stranici tražiliceili na traci pretraživanja (pri vrhu zaslona) preglednika počinju se događati skriveni od običnih korisnika. Kako su informacije potrebne na širokom svjetskom webu i koja je relevantnost pretraživanja? Sama riječ dolazi od latinskog "relevo", a na ruski je prevedena kao "dizati" ili "olakšati". Riječ je ekvivalentna izrazu. U odredbi 3.5.1 GOST-a 7.73-96 taj se pojam dešifrira, a "relevantnost" i "relevantnost" imaju istu definiciju, koja se sastoji u korespondenciji primljenih informacija s korisnikovim zahtjevom za informacijama.
Ovaj državni standard sadrži i drugeKorisni standardizirani pojmovi i definicije koji se odnose na polje dohvaćanja informacija i njegovo širenje pomoću automatiziranih informacijskih sustava. Dokument pomaže razumjeti značenje mnogih riječi u informacijskim, izdavačkim ili knjižničnim aktivnostima, a ne samo takve jezične jedinice kao "relevantnost". Definicija pojmova "kontinent" i "kontinent" također je dešifrirana odredbom 3.5.2. GOST 7.73-96. Treba ih tumačiti kao podudarnost primljenih podataka s informacijskim potrebama. Često se ovaj pojam zbunjuje s relevantnošću, što u osnovi nije točno, jer u jednom slučaju govorimo o usklađivanju zahtjeva, a u drugom o usklađivanju potreba. Također je pogrešno pitanje: "što je relevantno?" odgovoriti da je ovaj termin blizu pojma "adekvatnosti", odnosno praktične primjenjivosti rezultata.
Ali kako su informacije još uvijek smještene?Tražilica koristi vojsku botova - samostalne programe koji posjećuju web stranice i pohranjuju informacije o njima. Ovo ime dolazi od engleske riječi "bot", odnosno skraćeno od "robot". Ovi programi pronalaze nove web stranice, a zatim idu na glavnu stranicu i pregledavaju njezin sadržaj. Botovi uče stranice povezane s kućnim (u pregledniku koji se prvo učita) internim vezama. Također, bot programi pregledavaju veze koje upućuju na druge stranice, to jest na vanjske veze. Zadržavajući ove informacije, oni ih prate, otkrivaju sve nove web stranice i saznaju kako su povezani web resursi. Tako neumorno proučavaju "kartu" svjetskog weba. Ali što je relevantno? Kakve to veze ima s botovima?
Za konkretan primjer, pogledajmo što nudetražilicama Yandex i Google. Na pitanje "što je relevantno?" U izdavanju Yandexa pronađeno je 28 milijuna odgovora, a Google je imao 155 tisuća. Ovdje možemo reći da svi odgovaraju zahtjevu, ali nisu svi uvijek zahtjevi, odnosno neće svi biti kontinentalni. Primjerice, stranice na kojima je objašnjenje ovog koncepta dato izvršnom direktoru Wikipedije nesumnjivo će biti korisne, a web mjesto o relevantnim i nebitnim troškovima pri donošenju odluka nije relevantno za ovu temu. Očitiji primjer je kada je Yandex objavio 31 milijun odgovora na zahtjev "ruke u ruke", koji je podrazumijevao primanje informacija o glazbenoj grupi, a među njima je članak koji ih poziva da podignu ruku, jer je to, prema fizioterapeutima, vrlo korisno. Takav se odgovor ne može smatrati kontinentom, iako od 31 milijuna odgovora on zauzima 586 mjesta u broju.
Dakle, što je važnija tekst, to je i veća relevantnost tekstaveća je vjerojatnost da će upisati prve položaje odgovora na pretraživanje. Ovaj pokazatelj ima kvantitativnu procjenu, ali algoritmi za njegovu primjenu u različitim tražilicama su različiti i nepoznati za korisnike, a oni se s vremenom mijenjaju, jer se tražilice, pokušavajući podići na ljestvici, pokušavaju pružiti relevantne informacije, smanjujući vrijeme potrebno za pretraživanje. Vrlo relevantne stranice su one na kojima se pojavnost ključne riječi koja odgovara upitu može kretati od 3 do 7%. Ali to nije jedini kriterij za relevantnost dokumenta. Oni uključuju niz unutarnjih i vanjskih pokazatelja. Unutarnji pokazatelji (osim gustoće ključnih riječi) su njihov položaj u tekstu (pojava u naslovu, njihova blizina naslova i jedni drugima, s tvorbom vjerojatnih izraza za pretraživanje), kao i prisutnost sinonima koji potvrđuju podudaranje tekstualnog sadržaja zahtjevu. Glavnim vanjskim pokazateljem smatra se popularnost u globalnoj mreži, što ukazuju PageRank za Google, TIC za Yandex i Tor100 za Rambler sustav. Odnosno, koliko često ljudi dolaze na stranicu s drugih stranica, bolje je ako imaju visoku ocjenu. U tome je relevantnost.