Pri zadávaní dotazu na stránke vyhľadávacieho nástrojaalebo na vyhľadávacom paneli (v hornej časti obrazovky) prehliadača sa začnú vyskytovať udalosti, ktoré sú skryté pred bežnými používateľmi. Ako sú potrebné informácie na rozsiahlom webe a aký je význam vyhľadávania? Samotné slovo pochádza z latinčiny „relevo“ a je preložené do ruštiny ako „výťah“ alebo „zosvetlí“. Anglický ekvivalent pojmu je relevantný. V článku 3.5.1 normy GOST 7.73-96 je tento pojem dešifrovaný a výraz „relevantnosť“ a „relevantný“ má rovnakú definíciu, ktorá spočíva v korešpondencii získaných informácií s požiadavkou na informácie podanou používateľom.
Tento štátny štandard obsahuje ďalšieUžitočné štandardizované pojmy a definície týkajúce sa oblasti získavania informácií a ich šírenia pomocou automatizovaných informačných systémov. Tento dokument pomáha pochopiť význam mnohých slov v informačných, vydavateľských alebo knižničných činnostiach, a nielen takú jednotku jazyka ako „relevantnosť“. Definícia pojmov „kontinent“ a „kontinent“ je tiež dešifrovaná v článku 3.5.2 GOST 7.73-96. Mali by sa interpretovať ako súlad prijatých informácií s informačnými potrebami. Tento koncept je často zamieňaný s relevantnosťou, čo v zásade nie je pravda, pretože v jednom prípade hovoríme o vyhovení žiadosti a v druhom o uspokojení potrieb. Je tiež nesprávne odpovedať na otázku: „čo je relevantné?“ odpovedať, že tento pojem sa blíži pojmu „primeranosť“, to znamená praktickej uplatniteľnosti výsledku.
Ako sa však informácie stále nachádzajú?Vyhľadávací nástroj používa armádu robotov - samostatné programy, ktoré navštevujú webové stránky a ukladajú o nich informácie. Tento názov pochádza z anglického slova „bot“, čo je skratka „robot“. Tieto programy nájdu nové weby a potom prejdú na hlavnú stránku a prehľadajú jej obsah. Roboty sa učia stránky týkajúce sa domova (v prehliadači, ktorý sa načíta ako prvý) vnútorných odkazov. Programy topánok sa zameriavajú aj na odkazy, ktoré odkazujú na iné weby, tj externé odkazy. Keď si tieto informácie ponechajú, kliknú na ne, objavia nové weby a zistia, ako súvisia webové zdroje. Preto neúnavne študujú „mapu“ World Wide Web. Čo je to však relevantné? Čo to má spoločné s robotmi?
Pre konkrétny príklad sa pozrime, čo ponúkajúvyhľadávače Yandex a Google. Na otázku „čo je relevantnosť?“ V Yandex bolo nájdených 28 miliónov odpovedí a spoločnosť Google mala 155 tisíc. Tu môžeme povedať, že všetci zodpovedajú žiadosti, ale nie všetky z nich sú požiadavky, to znamená, že nie všetky budú kontinentálne. Napríklad stránky, na ktorých je vysvetlenie tohto pojmu uvedené v generálnom riaditeľovi Wikipedia, budú nepochybne užitočné a stránka o relevantných a irelevantných nákladoch pri rozhodovaní nie je pre túto tému relevantná. Zreteľnejším príkladom je prípad, keď spoločnosť Yandex vydala 31 miliónov odpovedí na požiadavku „zdvihnúť ruky“, čo znamenalo prijímanie informácií o hudobnej skupine, a medzi nimi bol aj článok, ktorý vyzval zdvihnúť ruky, pretože to je podľa fyzioterapeutov veľmi užitočné. Takúto odpoveď nemožno považovať za kontinent, hoci z 31 miliónov odpovedí zaujíma 586 pozícií v tejto otázke.
Čím je teda relevantnosť textu vyššia, tým väčšia jes väčšou pravdepodobnosťou vstúpi na prvé pozície hľadaných odpovedí. Tento ukazovateľ má kvantitatívne hodnotenie, ale algoritmy na jeho implementáciu do rôznych vyhľadávacích nástrojov sú pre používateľov rôzne a neznáme a časom sa menia ako vyhľadávacie nástroje, ktoré sa snažia zvyšovať poradie, snažia sa poskytnúť príslušné informácie a skracujú čas potrebný na ich nájdenie. Vysoko relevantné stránky sú tie, kde výskyt kľúčového slova, ktoré sa zhoduje s dopytom, sa môže pohybovať od 3 do 7%. Toto však nie je jediným kritériom relevantnosti dokumentu. Patria sem viaceré interné a externé ukazovatele. Interné ukazovatele (okrem hustoty kľúčových slov) sú ich pozícia v texte (výskyt v nadpise, ich blízkosť k nadpisu a navzájom, s vytváraním pravdepodobných vyhľadávacích fráz), ako aj prítomnosť synoným, ktoré potvrdzujú zhodu textového obsahu so žiadosťou. Za hlavný externý ukazovateľ sa považuje popularita v globálnej sieti, čo indikujú PageRank pre Google, TIC pre Yandex a Tor100 pre systém Rambler. To znamená, ako často ľudia prichádzajú na stránku z iných stránok, je lepšie, ak majú vysoké hodnotenie. To je to, čo je relevantné.