Поисковая оптимизация pdf-файлов

229
Руководитель клиентского сервиса

Ещё начиная с 2001 года, компания «Google» обновила алгоритмы своих поисковых систем. С тех пор пошло индексирование не только содержимого в формате html, но и других популярных форматов среди интернет-пользователей. Спустя несколько лет, подобную технологию реализовала, а чуть позже внедрила в работу своих поисковых роботов и  российская компания «Яндекс». 

Речь идёт об индексации файлов, имеющих следующие расширения:

  • .doc (.docx), .rtf, .xls (.xlsx), .ppt (.pptx) – документы, созданные в программной среде «Microsoft Office»;

  • .ods, .odp, .odg, .odt – форматы программного комплекса «Open Office»;

  • .flash, .pdf  - форматы и сопутствующие файлы, разработанные и поддерживаемые компанией Adobe Systems;

  • .txt – знакомый всем пользователям блокнот.

Несомненными лидерами и наиболее используемыми среди всех форматов являются pdf-файлы.

Если ввести поисковый запрос «инструкция станок ЧПУ», на второй и шестой строчках поисковой выдачи отображены проиндексированные документы, имеющие расширение .pdf.

Хорошие позиции в органической выдаче «Яндекса» говорят о больших возможностях по поисковой оптимизации документов данного формата.

Аналогичную картину можно наблюдать, введя аналогичный запрос и в поиске «Google».

Рассмотрим основные нюансы, которые важно соблюсти для того, чтобы вывести pdf-файл в ТОП поисковой выдачи.

1. Уникальность документа – как и в случае с любым сайтом, находящимся на высоких позициях в органике, данный критерий является одним из определяющих при ранжировании поисковиками.

2. Содержимое должно быть текстом, а не картинками. Если pdf-документ состоит из изображения или наборов графических иллюстраций, поисковые системы не смогут произвести его индексацию. При необходимости, любую картинку, содержащую в себе текстовую информацию можно распознать с помощью специально предназначенных для данных целей программ (например, «ABBYY FineReader», «OCR CuneiForm», онлайн-сервис «Free OCR», «FineReader Online») и, отформатировав, подправив неточности и ошибки определения, сделать в виде текста.

3. Должна отсутствовать защита содержимого паролем. Многие программы-редакторы и специализированные онлайн-сервисы могут защищать содержимое файлов от нежелательного чтения посредством установки пароля и зашифровки данных. Документ не сможет быть проиндексирован поисковыми роботами «Яндекса» и «Google». По этой причине не применяйте данный способ защиты.

4. Заполнены свойства документа. Все популярные pdf-редакторы позволяют производить данное действие, что даёт возможность сообщить поисковых систем мета-данные, а именно: заголовок (title), автор (author), тема (theme), ключевые слова (keywords).

Для того, чтобы заполнить параметры, достаточно в любом pdf-редакторе выбрать «Файл» -> «Свойства».

В результате проделанных действий появится специальное окно для редактирования и ввода данных.

Здесь же можно убедиться, что для документа не установлена защита, перейдя в соответствующую вкладку.

5. Произведена перелинковка: проставлены ссылки, ведущие, как в различные разделы данного документа, так и вне его, на страницы сайта. Данное действие помогает проиндексировать содержимое файла гораздо лучше и значительно быстрее.

6. В названии pdf-документа использованы ключевые слова, что улучшит фактор ранжирования в органике. В случае, когда не заполнено поле «Заголовок» в свойствах, имя файла и будет вставлено поисковой системой в качестве «Title».

Для примера введем в поиске ключевую фразу «инструкция токарный станок».

Видим, что в результатах поисковой выдачи имя первого файла состоит из набора цифр, а второе – еще и содержит поисковую фразу. Кроме того, имя документа, находящегося на второй позиции органической выдачи, стало и его заголовком.

7. Размер pdf-документа не превышает 10 Мб. В идеале должно быть не более 4 Мб. В результате добьется более высокая скорость загрузки со стороны посетителя, а так же удастся избежать «санкций» со стороны поисковых систем.

Многие популярные редакторы позволяют оптимизировать  содержимое файлов для их публикации в интернете за счет сжатия графических иллюстраций, картинок и схем.

В случае, когда ваш pdf-редактор данную опцию не поддерживает, можно воспользоваться бесплатными онлайн-редакторами («Smallpdf», «Pdf2go» и т.п.).

8. Разметка внутри файла. Как и в html-страницах, для лучшего ранжирования в результатах поисковой выдачи, важно использовать структурирование с разбивкой на заголовки и подзаголовки различных уровней (h1, h2, h3  и т.д.). Использование в тексте нумерованных и ненумерованных списков так же добавляет свою положительную «нотку».

Некоторые редакторы позволяют прописывать внутренние параметры-комментарии к картинкам и графическим иллюстрациям (аналог атрибута alt), чем следует пользоваться.

9. Проработка удобства чтения с мобильных устройств и планшетов – будет не лишним, так как в последние годы в работе поисковых  систем произошел ряд кардинальных перемен в сторону лучшего ранжирования тех веб-сайтов, которые адаптированы и для работы с трафиком, идущим с поиска через смартфоны и прочие портативные мобильные устройства. Таким образом, если ваш документ, станет удобен для чтения с телефонов, – вы добьетесь большей лояльности со стороны поисковиков. Поэтому, следите за размерами иллюстраций и изображений, величиной шрифтов, «плавающими абзацами», лишними разрывами, негативно сказывающихся на удобстве восприятия информации в df-документах.

На этом всё. В статье были представлены основные моменты, следуя которым вы сможете вывести свои pdf-файлы в ТОП выдачи «Яндекса» и  «Google». Помните, что, как и при продвижении html-сайта, главным атрибутом для попадания в лидеры выдачи будет качество представленной информации, уникальность и её полезность и востребованность для пользователя. Чем удобнее и проще будет читать документ посетителями, тем лучше будет поведенческий фактор и, соответственно, ранжирование в органике.

Прочитайте еще

Обзор обновлённого интерфейса Яндекс.Директ
Как «Google», так и, в свою очередь, «Яндекс» прекрасно понимают, чтобы «завоевать» интернет-пользов...Читать
Ответы на вопросы по поисковым запросам в «Яндекс Вебмастер»
Что необходимо для успешного поддержания высоких позиций веб-ресурса в поисковой выдаче по конкурент...Читать
Хотите узнать все
подробности о своём
сайте, звоните:
8 800 200 47 80
(Бесплатно по России)
или
Оформить заявку
Заказать звонокМы перезвоним в течение 30 минут
Нажимая на кнопку отправить, вы даете согласие на обработку своих персональных данных
Оформить заявкуМы перезвоним в течение 30 минут
Нажимая на кнопку отправить, вы даете согласие на обработку своих персональных данных
Хочу работать
Форматы: DOC, DOCX, XLS, XLSX, TXT, PDF

Нажимая на кнопку отправить, вы даете согласие на обработку своих персональных данных