Приликом уноса упита на страници претраживачаили у траци за претрагу (на врху екрана) прегледача почињу да се дешавају догађаји који су скривени од обичних корисника. Како су онда потребне информације на широкој Ворлд Виде Веб-у и која је важност претраживања? Сама реч потиче из латинског „релево“ и на руски се преводи као „лифт“ или „осветљење“. Енглески еквивалент израза је „релевантност“. Тачка 3.5.1 ГОСТ 7.73-96 дешифрује овај концепт, а „релевантност“ и „релевантност“ имају исту дефиницију, која се састоји у кореспонденцији примљених информација са захтевом за информацијама који је поднео корисник.
Овај државни стандард садржи и другекорисни стандардизовани термини и дефиниције који се односе на област претраживања информација и њихово ширење помоћу аутоматизованих информационих система. Документ помаже разумевању значења многих речи у информативним, издавачким или библиотечким делатностима, а не само такве јединице језика као „релевантност“. Дефиниција израза „релевантност“ и „релевантност“ такође је дешифрована у тачки 3.5.2 ГОСТ 7.73-96. Треба их тумачити као подударање примљених података о информацијама са потребама за информацијама. Често се овај концепт меша са релевантношћу, што је у основи погрешно, јер у једном случају говоримо о подударању захтева, ау другом - о задовољавању потребе. Такође је погрешно одговарати на питање „шта је релевантност?“ одговор да је овај појам близак концепту „адекватности“, односно практичној применљивости резултата.
Али како се проналазе информације?Претраживач користи армију ботова - аутономних програма који посећују веб локације и чувају информације о њима. Ово име потиче од енглеске речи „бот“, односно скраћено од „робот“. Ови програми проналазе нове веб локације, а затим прелазе на почетну страницу и прегледавају њен садржај. Ботови уче странице повезане са матичном (која се прва учитава у прегледачу) интерном везом. Такође, ботови гледају везе које воде до других веб локација, односно спољне везе. Чувајући ове информације, они их прегледавају, откривају нове веб локације и сазнају како су веб ресурси повезани једни с другима. Тако неуморно проучавају „мапу“ светске мреже. Али шта је релевантност? Какав је однос са ботовима?
На конкретном примеру, да видимо шта они нудепретраживачи Иандек и Гоогле. На питање "шта је релевантност?" Иандек има 28 милиона одговора, док Гоогле има 155 хиљада. Овде можемо рећи да сви одговарају захтеву, али не увек и потребама, односно неће сви бити релевантни. На пример, странице које објашњавају овај концепт на Википедијином СЕО-у несумњиво ће бити корисне, а веб локација о релевантним и небитним трошковима доношења одлука није релевантна за ову тему. Илустративнији пример је када је Иандек дао 31 милион одговора на захтев „руке увис“, што је подразумевало добијање информација о музичкој групи, а међу њима постоји и чланак који позива да дигнете руке, јер је ово, према речима физиотерапеута Веома корисно. Такав одговор се не може сматрати релевантним, иако сврстава 586 од 31 милиона одговора.
Дакле, што је релевантност текста већа, то је вишевероватније је да ће ући на прва места одговора за претрагу. Овај индикатор има квантитативну процену, али алгоритми за његову примену за различите претраживаче се разликују и непознати су корисницима, а такође се мењају с временом, јер претраживачи, покушавајући да се подигну на ранг листи, покушавају да пруже одговарајуће информације, смањујући време је да је потражимо. Веома релевантне странице су оне на којима се појава кључне речи која се подудара са захтевом може кретати од 3 до 7%. Али ово није једини критеријум за релевантност документа. Они укључују бројне интерне и екстерне показатеље. Унутрашњи индикатори (осим густине кључних речи) су њихов положај у тексту (улазак у наслов, близина наслова и међусобно, уз формирање вероватних фраза за претрагу), као и присуство синонима који потврђују да се садржај текста подудара са захтевом. Главним спољним показатељем сматра се популарност у глобалној мрежи, на шта указују ПагеРанк од Гоогле-а, ТИЦ од Иандек-а и Топ100 од Рамблер-а. Односно, колико често страницу посећују са других сајтова, боље је ако имају високу оцену. То је оно што је релевантно.