То зна сваки вебмастер да биљуди су почели да посећују ресурс са претраживача, неопходно је његово индексирање. У овом чланку ћемо вам рећи о томе шта је индексирање веб локација, како се врши и које је његово значење.
Дакле, сама реч „индексирање“ значиупис у регистар нечега, попис доступне грађе. Исти принцип важи и за индексирање страница. У ствари, овај процес се такође може назвати уношењем информација о Интернет ресурсима у базу података претраживача.
Дакле, једном када је корисникда би следећу фразу убацио у поље Гоогле претраге, скрипта ће јој вратити резултат, укључујући наслов ваше веб локације и њен кратак опис, који видимо у наставку.
Само индексирање („Иандек“ је, или Гоогле - улогане игра) је сасвим једноставно. Читав веб Интернет, вођен базом ип адреса, које имају претраживачи, скенирају моћни роботи - „пауци“ који прикупљају информације о вашој веб локацији. Свака од претраживача има их огроман број и раде аутоматски 24 сата дневно. Њихов задатак је да оду на вашу страницу и "прочитају" сав садржај на њој, истовремено уносећи податке у базу података.
Стога у теорији индексирање страница није довољнозависи од власника ресурса. Овде је одлучујући фактор робот за претрагу који посети локацију и прегледа је. То је оно што утиче на то колико брзо се ваша страница приказује у резултатима претраге.
Наравно, корисно је за сваког вебмастераресурс се појавио у резултатима претраге што је брже могуће. То ће утицати, прво, на време повлачења странице на прве позиције, и, друго, када започињу прве фазе монетизације веб локација. Дакле, што раније робот за претрагу „поједе“ све странице вашег ресурса, то боље.
Сваки претраживач има свој алгоритамуношење података о локацијама у вашу базу података. На пример, индексирање страница у Иандек-у врши се у фазама: роботи непрестано скенирају странице, а затим организују информације, након чега се одвија такозвано „ажурирање“, када све промене ступе на снагу. Компанија не утврђује регуларност таквих догађаја: одржавају се једном у 5-7 дана (по правилу), међутим, могу се одржати за 2 или 15 дана.
У исто време, индексирање странице у Гоогле-у иде према другачијеммодели. У овом систему претраживања таква „ажурирања“ (ажурирања базе података) се редовно врше, с тим у вези, није потребно сваки пут чекати док роботи унесу информације у базу података, а затим ће се то наручивати сваких неколико дана.
На основу горе наведеног можемо учинити следећеЗакључак: странице у Иандек-у се додају након 1-2 „ажурирања“ (то јест, у просеку за 7-20 дана), али у Гоогле-у то може да се догоди много брже - буквално за један дан.
У исто време, наравно, сваки претраживач имапостоје неке особености начина на који се врши индексирање. На пример, Иандек има такозвани „брзи робот“ - робот који за неколико сати може унети податке у проблем. Истина, није лако напустити ваш ресурс: ово се односи углавном на вести и разне важне догађаје који се развијају у реалном времену.
Одговор на питање како да унесете податке о свомсајт у индексу претраживача је и једноставан и сложен. Индексирање страница је природни феномен и ако ни не размишљате о томе, већ само рецимо водите свој блог, постепено га испуњавајући информацијама, претраживачи ће с временом савршено „прогутати“ ваш садржај.
Друга ствар је када треба убрзатииндексирање страница, на пример, ако имате мрежу такозваних „сателита“ (сајтови дизајнирани за продају веза или постављање реклама, чији је квалитет обично лошији). У овом случају морате предузети мере да роботи примете вашу веб локацију. Уобичајено се сматра следеће: додавање УРЛ-а веб локације у посебан образац (назван „АддУрл“); покретање адресе ресурса кроз директоријуме веза; додавање адресе у обележивачке директоријуме и још много тога. Како функционише свака од ових метода, предмет је бројних расправа на СЕО форумима. Као што показује пракса, сваки случај је јединствен и тешко је тачније пронаћи разлоге због којих је једна страница индексирана за 10 дана, а друга за 2 месеца.
Међутим, логика којом се можеДа би се сајт брже уврстио у индекс, заснива се на постављању веза до њега. Конкретно, говоримо о постављању УРЛ-ова на бесплатне и јавне веб локације (обележивачи, директоријуми, блогови, форуми); о куповини веза на великим и промовисаним веб локацијама (на пример, користећи Сапе размену); а такође и о додавању мапе сајта у образац аддУРЛ. Можда постоје и друге методе, али оне које су већ наведене могу се поуздано назвати најпопуларнијима. Подсетимо, генерално све зависи од странице и среће њеног власника.
Према званичном положају свих претраживачасистема, индекс укључује сајтове који пролазе низ филтера. Нико не зна које захтеве ови последњи садрже. Познато је само да се временом све оне побољшавају на такав начин да се филтрирају псеудо-странице створене за зараду продајом веза и других ресурса који не носе корисне информације за корисника. Наравно, за креаторе ових веб локација, главни задатак је да индексирају странице што је више могуће (да привуку посетиоце, продају везе итд.).
На основу претходних информација, можете то учинитизакључак о томе које веб локације највероватније неће бити укључене у резултате претраге. Исту информацију објављују и званични представници претраживача. Пре свега, реч је о веб локацијама које садрже нејединствени, аутоматски генерисани садржај који није користан посетиоцима. Након тога следе ресурси са минимумом информација створених за продају веза итд.
Тачно, ако анализирате резултате претраживачасистема, онда се у њему могу наћи све ове странице. Стога, ако говоримо о веб локацијама које неће бити присутне у резултатима претраге, треба имати у виду не само нејединствени садржај, већ и низ других фактора - много веза, неправилно организовану структуру итд.
Претраживачи претражују сав садржајкоји се налази на локацији. Међутим, постоји техника помоћу које можете ограничити приступ робота за претрагу одређеном одељку. То се ради помоћу датотеке роботс.ткт, на коју реагују пауци претраживача.
Ако ову датотеку поставите у корен веб локације,индексирање страница ће се одвијати према скрипти која је на њој написана. Посебно можете онемогућити индексирање помоћу једне команде - Дисаллов. Поред тога, датотека такође може назначити делове веб локације на које ће се примењивати ова забрана. На пример, да бисте забранили улазак у индекс целе локације, довољно је навести једну косу црту „/“; и да изузмете одељак „схоп“ из резултата, довољно је да у датотеци назначите такву карактеристику: „/ схоп“. Као што видите, све је логично и крајње једноставно. Индексирање страница је врло лако затворити. Истовремено, роботи за претрагу посећују вашу страницу, читају роботс.ткт и не уносе податке у базу података. Овим се лако може манипулисати како би се у претрази виделе одређене карактеристике веб локација. Хајде сада да разговарамо о томе како се индекс проверава.
Постоји неколико начина да се сазна коликои које се странице налазе у Иандек или Гоогле бази података. Прва - најједноставнија - је унос одговарајућег захтева у образац за претрагу. Изгледа овако: сите: домен.ру, где уместо домаин.ру напишете адресу ваше веб локације. Када поднесете такав захтев, претраживач ће приказати све резултате (странице) који се налазе на наведеном УРЛ-у. Штавише, поред једноставног пописа свих страница, можете видети и укупан број индексираног материјала (десно од фразе „Број резултата“).
Други начин је провера индексирањастранице које користе специјализоване услуге. Сада их има пуно, можете их назвати ксео.ин и ци-пр.цом. На таквим ресурсима можете не само да видите укупан број страница, већ и да одредите квалитет неких од њих. Међутим, ово вам је потребно само ако дубље разумете тему. То су по правилу професионални СЕО алати.
Такође бих желео да напишем мало о тзв„Принудно“ индексирање, када особа покушава да уведе своју веб локацију у индекс разним „агресивним“ методама. Оптимизатори не препоручују да се ово ради.
Претраживачи бар примећују претјераноактивност повезана са новим ресурсом може увести неку врсту санкција које негативно утичу на стање странице. Стога је најбоље учинити све да индексирање страница изгледа што је могуће органско, постепено и глатко.