На каждом веб-ресурсе могут появляться так называемые "битые ссылки" (англ. "broken links"), которые ведут на несуществующие веб-страницы как на этом веб-ресурсе, так и на иных сайтах в сети интернет.
В каких ситуациях возникают подобные ссылки?"Битая" или "мертвая ссылка" может возникнуть после перемены структуры ресурса (удаления или перемены адресов страниц или целых разделов), при этом на какой-то из страниц остается ссылка, указывающая на старый адрес страницы. Подобные ссылки могут быть как "внутренними" (ведущими на несуществующие страницы этого же ресурса), так и "внешними" (ведущими на несуществующие страницы иного ресурса). И в том и в другом случае, задача вебмастера - отыскать и поправить подобные ссылки, чтоб не вводить в заблуждение посетителей и не попасть под пессимизацию поисковых машин.
Как же выявить "битые ссылки"?Если на веб-ресурсе небольшое колличество страниц и на любой располагается не более 2-3 ссылок, их возможно время от времени проверять руками. Однако если на веб-ресурсе сотни ил тысячи страниц, на любой из которых расположено от 10 ссылок, такая проверка может превратиться в большую проблему. В этом случае поиск "битых ссылок" лучше это делать специальной программой. Об одной из подобных программ с названием Xenu's Link Sleuth я и хочу вам здесь поведать.
Утилита Xenu's Link Sleuth позволяет отыскать "битые ссылки", изображения, фреймы, дополнительные модули (plug-ins), фоновые рисунки (backgrounds), графические карты ресурса (local image maps), таблицы стилей (style sheets), скрипты и Java-апплеты. Утилита выводит перечень проверенных ссылок с сортировкой по различным параметрам. К тому же она позволяет создавать отчет с результатами проверки.
Преимущества программы:
- Утилита бесплатна (freeware)
- Простой и удобный пользовательский интерфейс
- Возможна повторная проверка битых ссылок (это удобно при временной недоступности проверяемого ресурса)
- Простой формат отчета
- Размер исполняемого файла программы менее 1мб
- Возможность проверки защищенных сайтов по протоколу SSL ("https://")
- Определение и вывод редиректов (т.е. пересылок на иные страницы)
- Везможно создание карты проверяемого ресурса
- Системные требования: Microsoft Windows 95/98/ME/NT/2000/XP/Vista/7, (для работы требуется библиотека WININET.DLL, входящая в состав Internet Explorer). Так-же утилита Xenu's Link Sleuth работает под Red Hat 8 и Ubuntu при помощи wine, и под Mac при помощи Crossover.
Запуск программы Xenu's Link SleuthПосле клика на значке программы возникает ее основное меню.
Для проверки ресурса нажимаем клавиши Ctrl+N или жмем на крайнюю слева кнопку "Check URL". Открывается окно, где мы указываем адрес ресурса, который требуется проверить на "битые ссылки". Если адрес ресурса кончается названием каталога, не забудьте добавить в итоге строки знак '/' или будет проверен весь родительский каталог. К примеру:
Правильно: http://www.site.com/user/
Неправильно: http://www.site.com/user
Настройки программы Xenu's Link Sleuth
- Local file - выбрать для проверки сохраненную страницу.
- Check external links - дополнительно к "внутренним" будут проходить проверку все "внешние" ссылки.
- Consider URL's beginning with this as "internal" - добавить перечень ссылок, которые утилита будет считать "внутренними". Ввод любой подобной ссылки кончается нажатием на кнопку "Add".
- Do not check any URL's beginning with this - добавить перечень ссылок или разделов, которые утилита НЕ будет проверять. Ввод любой подобной ссылки оканчивается нажатием на кнопку "Add".
- More options - открыть окно с дополнительными настройками (см. ниже).
- После зажатия на кнопку "OK" начнется поиск битых ссылок на веб-ресурсе, который может занять, в зависимости от количества страниц ресурса, скорости их загрузки и количества ссылок на любой из них, от нескольких секунд до нескольких часов.
На экране возникает перечень найденных на веб-ресурсе ссылок, каждая из которых выделяется определенным цветом:
- серого цвета - ссылка располагается в очереди на проверку или исключена из проверки согласно с заданными настройками
- зеленоватая - ссылка доступна
- багровая - найдена "мертвая" ссылка или ссылка временно недоступна.
Перемещаться по списку возможно при помощи клавиш управления курсором (Наверх, Вниз, PAGEUP, PAGEDOWN) или находящейся справа полосы прокрутки.
Внизу окна в строке статуса выводится общее число найденных и обработанных ссылок и время, прошедшее с начала проверки.
По окончанию проверки выводится соответствующее сообщение и запрос на создание отчета:
Дополнительные настройки программы Xenu's Link Sleuth

- Parallel Threads - количество одновременно запрашиваемых страниц (рекомендуется 1 - 3, чересчур большое значение может привести к существенной нагрузке на сервер и замедлению скорости загрузки страниц)
- Ask for password or certificate when needed - при потребности запрашивать пароли и сертификаты (используется для защищенных сайтов и разделов)
- Treat redirections as errors - считать редиректы ошибками
- Report - информация, которую требуется выводить в отчет (возможно указывать пункты по рисунку)
- Broken links, ordered by links - показывать "битые" ссылки, отсортированные по адресу ссылки
- Broken links, ordered by page - показывать "битые" ссылки, отсортированные по адресу страницы
- Broken local links - показывать"битые" локальные ссылки
- Redirected URL-s - показывать ссылки с редиректами
- Site Map - строить HTML-карту ресурса (при большом числе проверяемых страниц может привести к существенным задержкам времени при формировании отчета)
- Statistics - выводить в отчет различную статистическую информацию
Полученный отчет открывается в вашем браузере и состоит из разделов, которые были заданы в настройках программы:
Если было задан вывод статистической информации, то добавляется соответствующий блок.
В статистике указано число проверенных страниц с группировкой по их типам (HTML-страницы, изображения, скрипты, файлы и т.п.), суммарные размеры страниц. К тому же указывается число найденных ссылок с группировкой по их типам:
- ok - страница найдена;
- skip external - страница пропущена как "внешняя";
- forbidden request - доступ к странице запрещен;
- not found - страница не найдена.
Полученный отчет возможно сохранить для дальнейшей обработки в Excel.
|