Kun kirjoitat kyselyn hakukoneiden sivulletai hakupalkissa (näytön yläreunassa) selain alkaa tapahtua tavallisille käyttäjille piilotettuja tapahtumia. Kuinka sitten laajassa Internetissä on tarvittavat tiedot, ja mikä on haun merkitys? Sana itsessään tulee latinalaisesta "relevo" ja käännetään venäjäksi nimellä "nosta" tai "helpota". Termin - "relevanssi" englanninkielinen vastaavuus. GOST 7.73-96: n kappaleessa 3.5.1 tämä käsite puretaan, ja ”relevanssilla” ja ”merkityksellisellä” on sama määritelmä, joka koostuu saatujen tietojen vastaavuudesta käyttäjän esittämään tietopyyntöön.
Tämä tilastandardi sisältää muitahyödyllisiä standardisoituja termejä ja määritelmiä, jotka koskevat tiedon hakukenttää ja sen jakelua automaattisen informaation avulla. Asiakirja auttaa ymmärtämään monien sanojen merkitystä tiedottamisessa, julkaisemisessa tai kirjastotoiminnassa, ei pelkästään sellaisen kieliyksikön kuin "osuvuus". Termien ”asiaankuuluvuus” ja ”soveltuva” määritelmä on myös määritelty GOST 7.73-96: n kohdassa 3.5.2. Niitä olisi tulkittava vastaanotettujen informaatiotietojen vastaavuuksina informaatiotarpeeseen. Usein tämä käsite sekoitetaan relevanssiin, mikä on täysin väärin, koska yhdessä tapauksessa kyse on pyynnön noudattamisesta ja toisessa kysynnän noudattamisesta. On myös väärin kysyä ”mikä on merkitystä?” Sanoa, että tämä termi on lähellä käsitettä ”riittävyys”, ts. Tuloksen käytännöllinen sovellettavuus.
Mutta miten tiedot ovat?Hakukone käyttää armeija robotteja - itsenäisiä ohjelmia, jotka vierailevat verkkosivustoilla ja tallentavat tietoja heistä. Nimi tulee englannin sanasta "bot", eli lyhennettynä "robotista". Nämä ohjelmat löytävät uusia sivustoja, siirtyvät sitten pääsivulle ja selaavat sen sisältöä. Botit oppivat kotiin liittyvät sivut (selaimessa se ladataan ensin) sisäisten linkkien avulla. Lisäksi bot-ohjelmat tarkastelevat linkkejä, jotka osoittavat muihin sivustoihin, ts. Ulkoisiin linkkeihin. Pitämällä nämä tiedot he seuraavat niitä, löytävät kaikki uudet sivustot ja oppivat kuinka verkkoresurssit yhdistetään. Siksi he väsymättä tutkivat Internetin "karttaa". Mutta mikä on osuvuus? Mitä tekemistä robotilla on?
Katsotaan konkreettinen esimerkki, mitä he tarjoavat.hakukoneet Yandex ja Google. Kysymykseen ”mikä on merkitystä?” Yandexin myöntämisessä oli 28 miljoonaa vastausta, ja Googlella on 155 tuhatta. Tässä voimme sanoa, että ne kaikki vastaavat pyyntöä, mutta eivät aina tarpeita, ts. Kaikki eivät ole merkityksellisiä. Esimerkiksi sivut, joilla Wikipedian toimitusjohtaja antaa selityksen tästä käsitteestä, ovat epäilemättä hyödyllisiä, ja sivusto, joka sisältää merkityksellisiä ja merkityksettömiä kustannuksia päätöksenteossa, ei ole aiheeseen liittyvä. Havainnollisempi esimerkki on, kun ”käsi ylös” -pyyntö, joka tarkoittaa tietojen saamista musiikkiryhmästä, Yandex antoi 31 miljoonaa vastausta, ja heidän joukossaan on artikkeli, jossa kehotetaan nostamaan käsiä, koska tämä on fysioterapeutien mukaan erittäin hyödyllinen. Tällaista vastausta ei voida pitää asiaankuuluvana, vaikka 31 miljoonasta vastauksesta se vie 586 kantaa antamisessa.
Siten, mitä korkeampi tekstin merkitys on,todennäköisemmin, että hän tulee hakuvastausten ensimmäisiin sijainteihin. Tällä indikaattorilla on määrällinen arvio, mutta algoritmit sen toteuttamiseksi eri hakukoneissa ovat erilaisia ja käyttäjille tuntemattomia, ja ne muuttuvat myös ajan myötä, kun hakukoneet yrittävät nousta sijoituksissa yrittää antaa asiaankuuluvaa tietoa ja lyhentää sen hakuaikaa. Erittäin osuvia pidetään sivuja, joilla kyselyä vastaavan avainsanan esiintyminen voi olla välillä 3–7%. Mutta tämä ei ole ainoa kriteeri asiakirjan relevanssille. Niihin sisältyy joukko sisäisiä ja ulkoisia indikaattoreita. Sisäiset indikaattorit (paitsi avainsanan tiheys) ovat niiden sijainti tekstissä (esiintyminen otsikossa, niiden läheisyys otsikkoon ja toisiinsa, todennäköisten hakulauseiden muodostumisen myötä), samoin kuin synonyymit, jotka vahvistavat, että tekstin sisältö vastaa pyyntöä. Pääasiallisena ulkoisena indikaattorina pidetään suosiota globaalissa verkossa, jota osoittavat PageRank Googlessa, TIC Yandexissa ja Top100 Rambler-järjestelmässä. Eli kuinka usein sivua siirretään muilta sivustoilta, on parempi, jos niillä on korkeat arvosanat. Se mitä relevanssi on.