Drupal: Модуль Parser — парсинг сайтов в ноды

Описание

Модуль Parser предназначен для парсинга любых html страниц в ноды. Собственно на этом описание модуля можно закончить =)

Принцип работы парсера похож на работу поисковиков — он загружает одну из страниц сайта, ищет на ней ссылки и начинает ходить по ним в глубь. Встретив страницу, которая попадает под условие "распарсить страницу в ноду", модуль создает объект ноды и начинает выполнять пользовательский php код, добавляя к ноде поле за полем. Картинки выкачиваются на сервер, создаются отсутствующие термины, значения приводятся к нужному типу.

подробнее