јавете се за бесплатна консултација: 02/3224-711 
E-мaил подршка: biznis@tc.mk -  skype: trgovskicentar

Дел 2: Пречки поврзани со пронаоѓањето на содржината (crawling) и нејзино зачувување /индексирање (indexing)

Објавено на од

 

Во претходната статија зборувавме за три технички правила што се од витално значење за разбирањето na фундаменталната моќ на Google како фактор што има огромно влијание врз вашите клиенти.

 

Првото и основно правило гласи дека колку вашиот сајт е полесен за пронаоѓање на содржината (crawlability), толку полесно ќе може да ве најде Google, другите пребарувачи а со тоа и вашите потенцијални клиенти.

 

Правило број 1: можност за пронаоѓање на содржината (crawlable) и можност за зачувување (indexable)

 

Доколку сакате вашата страна или дел од страна да ја посетуваат по природен пат, и да остварувате продажба, содржината мора да биде лесна за пронаоѓање и за зачувување.

 

Дали пребарувачите со своите програми за пронаоѓање содржина ќе бидат во состојба да ја најдат вашата страна е одлучувачки фактор во однос на тоа дали таа ќе може да се рангира, дали ќе остварува посетеност и продажба преку природни пребарувања. Пребарувачите мора да се во можност да навлезат во HTML содржината на вашата страна и во линковите (crawl), со цел да ја индексираат (index) и да анализираат колку содржината е релевантна и колку страницата е корисна.

 

Кога програмите за пронаоѓање на содржината (crawlers) не можат да пристапат до вебстраната, содржината не постои во однос на сите пребарувања. И бидејќи не постои, не може да биде рангирана, да поттикнува посети или продажба.

 

Јасно е дека во наш најдобар интерес е да се осигураме дека вратите на нашата вебстрана се отворени, за пребарувачите да може да ја пронајдат и индексираат страната, така овозможувајќи рангирање, посети и продажба.

 

Секоја од следните технички пречки им ја затвора вратата на програмите за пронаоѓање на содржината (crawlers) на пребарувачите.

 

1. Грешки во страната

 

Главниот фактор за пребарувачите да можат лесно да влезат во содржината на страницата е недостаток на содржина и страни. Доколку страната не работи, или почетната страна (home page) испраќа порака дека постои грешка, програмите за пронаоѓање на пребарувачите (crawlers) нема да бидат во состојба да започнат со својата потрага по содржина. Доколку дојде до ова, повеќето пребарувачи ќе ги деградираат рангирањата на страната за го заштитат целокупното искуство на своите клиенти.

 

Најчестата грешка што се појавува го носи насловот 404 file not found и 500 internal server errror. Каква било грешка помеѓу 400 и 500 ќе ги спречи програмите за пронаоѓање на содржина да бидат во можност да пребараат дел од содржината на вашата страна или цела страна. Тимот што стои позади вашиот сервер е добро запознаен со овие грешки и работи за да го спречи нивното појавување, но конкретно грешките од опсегот на 400- најчесто се однесуваат конкретно на страната и потешко е да се отстранат. Кога ќе наидете на грешка од типот на пораки со 400- или 500- , испратете им ги на вашиот тим за техничка поддршка. Google Webmaster Tolls дава корисен извештај за сите грешки што програмите за пронаоѓање ги пронашле.

 

 

 

 

2. Забрана од датотеката Robots.txt

 

Robots.txt е мала датотетка во рамките на страната и нејзина задача е да им дава знак на програмите за пронаоѓање (crawlers) дали да пристапат или не, до одредени видови содржина. Наредба за забрана (disallow command) во датотеката на Robots.txt ќе им каже на пребарувачите да не ја пронајдат содржината што е назначена со оваа наредба.

 

Датотеката најпрво го наведува корисникот- кон кој програма за пребарување се однесува, а потоа ја назначува содржината до која може или не може да има пристап. Датотеките Robots.txt немаат влијание врз потрошувачите кога се активирани, туку само ги запираат пребарувачите да ги пребаруваат и рангираат назначените содржини.

 

За да разберете како се употребува датотеката Robots.txt следи пример. Да речеме дека една страница што продава рециклирани чанти сака да им забрани на програмите за пребарување да дојдат до индивидуалните купони бидејќи веројатно дека нивната важност ќе истече пред поголемиот дел од купувачите да ги пронајдат. Страницата го носи името RecycledTotes.com. Кога купувачите ќе дојдат до истечени купони, разбирливо е дека се вознемирени и или се повлекуваат или се жалат кај службата за корисници. Во секој случај, страницата губи од ова.

 

Забрана од датотеката Robots.txt ќе го реши проблемот. Меѓутоа датотеката Robots.txt ќе постои, па URL би било www.recycledtotes.com/robots.txt. Треба да се забрани секој купон индивидуално, или да се забрани целата категоризирана листа, со употреба на ѕвездичка како џокер. Следната слика ги дава двете можности.

 

 

Протоколот Robots.txt е многу корисен, но истовремено е опасен. Лесно може да воведе забрана на целата страна.

 

 

3. Meta Robots NOINDEX

 

Метатагот на Robots може да се конфигурира на тој начин што може да им забрани на програмите за пронаоѓање содржина (crawlers) да не ги зачувуваат/ индексираат (index) одредени индивидуални страници со содржина, со употреба на NONINDEX. Метатагот на Robots преку NONINDEX, и овозможува на програмата за пронаоѓање содржина да ја пребарува содржината, но не и да ја индексира/зачува.

За да го употребите, ставете го метатагот Robots на почетокот на HTMLстраната што не сакате да биде индексирана, како на пример страната со купони на recycledtotes.com. Погледни ја сликата подоле.

 

 

Повеќето компании го лоцираат тагот близу до насловниот, и до мета описот, со цел кореспондентната метадата на пребарувачот полесно да го забележи. Тагот е конкретен за дадената страна, и треба да се повтори за секоја страна што не сакате да биде индексирана/зачувувана. Може да се постави и на врвот на темплејтот, тогаш кога сакате да забраните зачувување на сите страни со тој темплејт.

 

Општо земено, тешко е да се постави Meta Robots NONINDEX на цела страна. Па така оваа алатка е побезбедна за користење од онаа за забрана (disallow).

 

Кај оние страни за интернет маркетинг на WordPress, всушност е многу лесно случајно да се направи цела страница да не биде индексирана. Во делот Privacy settings на WordPress има поле за штиклирање што вели побарај од пребарувачите да не ја индексираат оваа страна, со што неиндексирањето ќе се примени на секоја страна од сајтот. Доколку имате проблем со оптимизацијата на пребарувачите, проверете го ова поле.

 

Како и алатката за забрана за прегледување на содржина, така и алатката за неиндексирање нема влијание врз посетителите на страната.

 

 

 

 

 

 

 

 

 

comments powered by Disqus
Зачлени се за бесплатен билтен