8) Подпрограмма extract () — это обработчик события text, именно она извлекает и выводит результаты поиска. В стеке вызова этой подпрограммы находится копия объекта синтаксического анализатора и декодируемый текст. После изъятия из текста пробельных символов проверяется значение последнего тега, хранящееся под ключом $last_tag в объекте синтаксического анализатора. Если последним тегом является “а”, то происходит обработка элемента <а>, содержащего номер RFC. Выводится этот текст, а затем — символ табуляции. Если последним тегом является “strong”, то происходит обработка раздела документа, содержащего название RFC. Выводится это название, а затем символ конца строки.
Новая версия сценария search_rfc.pl более чем в два раза превышает по объему первоначальную, но в ней нет никаких новых средств. Для чего же она нужна? В данном случае полномасштабный синтаксический разбор документа с результатами поиска является роскошью. Однако иногда приходится выполнять синтаксический анализ сложного документа HTML, и регулярные выражения становятся слишком громоздкими, В этих случаях модуль HTML::Par ser позволяет значительно упростить работу.
Получение изображений с удаленного сервера по URL
Для увязки всей информации, представленной в разделе, рассмотрим последний пример — приложение, которое создает зеркальную копию всех изображении документа HTML, находящегося по указанному URL. Получив список из одного или нескольких URL из командной строки, сценарий mirror_images.pl выполняет выборку каждого документа, проводит его синтаксический анализ для поиска все встроенных изображений, а затем копирует эти изображения в текущий каталог с использованием метода mirror ().
2014-04-23 19:33:35
это интересно Для дома или офиса бывает не лишним установить индивидуальные почтовые ящики , обеспечивающие требуемую безопасность и обладающие декоративной гармонией. Материал таких ящиков не выгорает на солнце, и поставка выполняется в подарочной упаковке. Доставить товар можно в любой край или регион России.