Når du legger inn et spørsmål på en søkemotorsideeller i søkefeltet (øverst på skjermen) i nettleseren, begynner det å oppstå hendelser som er skjult for vanlige brukere. Hvordan er informasjonen som trengs på det store internett, og hva er søkerelevans? Selve ordet kommer fra det latinske "relevo" og er oversatt til russisk som "lift" eller "lighten". Det engelske ekvivalentet av begrepet er relevans. I paragraf 3.5.1 i GOST 7.73-96 blir dette konseptet dechiffrert, og "relevans" og "relevant" har den samme definisjonen, som består i korrespondanse mellom informasjonen som er mottatt til informasjonsforespørselen fra brukeren.
Denne tilstandsstandarden inneholder andreNyttige standardiserte vilkår og definisjoner relatert til feltet for innhenting av informasjon og formidling av dette ved hjelp av automatiserte informasjonssystemer. Dokumentet hjelper deg med å forstå betydningen av mange ord i informasjons-, publiserings- eller biblioteksaktiviteter, og ikke bare en slik språkenhet som "relevans". Definisjonen av begrepene “kontinent” og “kontinent” er også dechiffrert av paragraf 3.5.2 i GOST 7.73-96. De skal tolkes som korrespondanse mellom mottatte informasjonsdata og informasjonsbehov. Ofte forveksles dette konseptet med relevans, noe som i utgangspunktet ikke er sant, siden vi i det ene tilfellet snakker om å matche forespørselen, og i det andre om å matche behovene. Også feil med spørsmålet: "hva er relevans?" å svare at dette begrepet er nær begrepet "tilstrekkelighet", det vil si den praktiske anvendeligheten av resultatet.
Но как же все-таки находится информация?Søkemotoren bruker en hær av bots - frittstående programmer som besøker nettsteder og lagrer informasjon om dem. Dette navnet kommer fra det engelske ordet "bot", det vil si forkortet fra "robot". Disse programmene finner nye nettsteder, og går deretter til hovedsiden og ser innholdet. Bots lærer sider relatert til hjem (i nettleseren laster den først) interne lenker. I tillegg ser botprogrammer på lenker som peker til andre nettsteder, det vil si eksterne lenker. Ved å holde denne informasjonen følger de den, oppdager nye nettsteder og finner ut hvordan nettressurser er relatert. Dermed studerer de utrettelig "kartet" av World Wide Web. Men hva er relevans? Hva har det med roboter å gjøre?
На конкретном примере посмотрим, что предлагают søkemotorer Yandex og Google. Til spørsmålet "hva er relevans?" i utstedelsen av Yandex var det 28 millioner svar, og Google har 155 tusen. Her kan vi si at de alle oppfyller forespørselen, men ikke alltid, det vil si at ikke alle av dem vil være kontinentale. For eksempel vil sider der en forklaring på dette konseptet blir gitt i Wikipedia CEO utvilsomt være nyttige, og et nettsted om relevante og irrelevante kostnader når du tar beslutninger er ikke relevant for dette emnet. Et mer åpenbart eksempel er da Yandex sendte ut 31 millioner svar på en forespørsel “hands up”, som innebar å motta informasjon om en musikalsk gruppe, og blant dem er det en artikkel som ber om å rekke opp hender, da dette ifølge fysioterapeuter er veldig nyttig. Et slikt svar kan ikke betraktes som et kontinent, selv om det av de 31 millioner svarene inntar 586 stillinger i saken.
Dermed er jo høyere tekstens relevansmer sannsynlig at han kommer inn i de første stillingene med søkesvar. Denne indikatoren har en kvantitativ vurdering, men algoritmene for implementering i forskjellige søkemotorer er forskjellige og ukjente for brukere, og de endres over tid, ettersom søkemotorer, prøver å stige i rangeringer, prøver å gi relevant informasjon, og reduserer tiden det tar å finne den. Svært relevante sider er de der forekomsten av et nøkkelord som samsvarer med spørringen, kan variere fra 3 til 7%. Men dette er ikke det eneste kriteriet for dokumentets relevans. Disse inkluderer en rekke interne og eksterne indikatorer. Interne indikatorer (bortsett fra tettheten av nøkkelord) er deres plassering i teksten (forekomst i overskriften, deres nærhet til overskriften og hverandre, med dannelse av sannsynlige søkefraser), samt tilstedeværelsen av synonymer, som bekrefter korrespondansen mellom tekstinnholdet til forespørselen. Den viktigste eksterne indikatoren anses å være popularitet i det globale nettverket, som er indikert av PageRank for Google, TIC for Yandex og Tor100 for Rambler-systemet. Det vil si at hvor ofte folk kommer til siden fra andre nettsteder, det er bedre hvis de har høy rangering. Det er det som er relevant.