Како Google индексира PDF документи?!
Од Катерина Стојановска - пет сеп 02, 12:51 pm

Документите во .pdf формат се одличен начин на презентација на информации и посебно се ефективни за таргетирање на корисници што конкретно пребаруваат .pdf документи.
Значи ако се мислевте дали да креирате .pdf документи за ваши производи, совети и начини на користење на производите, прашања и одговори, верувајте дека трудот ќе ви се исплати.
Google почна да индексира документи во 2001 и од тогаш постојано работи на унапредување на својот алгоритам со цел индексирање на најразлични формати и типови на фајлови.
Пред неколку дена Google и официјално одговори на најчестите прашања за начинот на индексирање на .pdf документите:
- Дали Google може да индексира било каков .pdf документ? Во принцип Google може да ги индексира сите .pdf документи со текстуална содржина, под услов да не се заштитени со лозинка или инкриптирани.
- Дали може да индексира текст во слика вметнати во .pdf документ? Можно е. Goоgle користи Optical Character Recognition алгоритами за да го извади текстот поставен во слика. Правилото е дека Google индексира буквално се што може да се copy-paste од .pdf во текстуален едитор.
- Дали ги индексира сликите во .pdf документот? Моментално не. Ќе мора да се направат .html страни во кои ќе ги вметнете сликите, со цел да бидат индексирани.
- Како се индексираат линкови во .pdf документи? Линковите во .pdf документи имаат сличен третман како и линковите во .html документите. Значи, линковите во pdf документи влијаат на вашиот PageRank и Google може да ги индексира и следи. Официјално, моментално не е возможно да се постави “no-follow” линкови во .pdf документи.
- Дали содржина во pdf документи може да добие висок ранк? Дa. Моментално голем број на пребарувани клучни зборови тригираат резултати со pdf документи, посебно поради одличната содржина и корисните линкови до релевантни информации.
- Како е третирана иста содржина ископирана од вебстрана и поставена во .pdf формат? Дефинитивно не копирајте иста содржина од веб во .pdf документ. Доколку мора да ја имате истате содржина и во .pdf формат, Google препорачува да направите приоритет (canonical) која содржина да ја индексира. Прочитајте повеќе за canonicalization.
- Како да си направам наслов на .pdf документот што сакам да се појави во резултатите на Google? За да врати наслов на .pdf документ во своите резултати, Google користи две опции: 1. title metadata впишан во .pdf фајлот или текстот во надворешниот (anchor) линк што насочува кон .pdf фајлот. Најдобро е да ги имате и двете.
- Како да ги тргнам pdf документите што веќе се индексирани од Google? Доколку не сакате да ви бидат прикажани .pdf документите во резултатите на Google, најлесно е да ја искористите алатката URL removal поставена како опција во Webmaster Tools.
За да научите повеќе како да ги оптимизирате вашите PDF документи, погледнете го следново видео:


