Что такое парсер, граббер, их виды и задачи использования

Парсер - программа, выполняющая анализ контента сайтов в интернет и выкачивающая содержимое по заданным параметрам. Используется также термин «граббер», оба слова считаются синонимами.

Программы парсинга обычно используются для следующих целей:

1. Поддержание постоянно обновляемой актуальной информации на веб-странице (например, курса валют или прогноза погоды).

2. Автообновление содержимого страниц сайта – новостей, добавление информации с RSS-каналов, сайтов сходной тематики и т.п.

3. Интеграция разрозненной информации – обычно для новостных сайтов, которые дают ссылки на новости других изданий, не скрывая их источника. Смысл – удобство посетителя.

4. Первичное наполнение ресурса – позволяет быстро провести заполнение информационной базы сайта с нуля до значимых величин объема информации.

Парсеры подразделяются, в зависимости от форматов массива анализируемых данных, на парсеры XML, RSS, парсеры документов Excel и др. Современные программы совмещают в себе функции анализа контента, конвертации форматов и экспорта данных. Также многие парсеры несут в себе возможность  уникализировать получаемый контент с помощью словарной базы синонимов. Еще одной возможностью программ для парсинга является функция быстрого создания из полученных данных готовых сайтов, с возможностью их немедленного размещения в интернете.