Вместо вызова подпрограммы при активизации синтаксическим анализатором каждого события, указать синтаксическому анализатору, чтобы он заполнил информацией, передаваемой обработчику, некоторый массив, а затем без лишних сложностей исследовать этот массив после завершения синтаксического анализа.
Для этого необходимо указать в качестве второго параметра метода handler () ссылку на массив. После завершения синтаксического анализа этот массив будет содержать по одному элементу для каждого вхождения указанного события, а каждый элемент будет представлять собой анонимный массив, содержащий информацию, указанную параметром $args.
После инициализации синтаксический анализатор активизируется с помощью метода parse_file ( ) или parse ().
$result = $parser->parse_file($file)
$result = $parser->parse ($data)
$parse->eof
Методы parse_file ( ), parse () и eof() действуют точно так же, как в модуле HTML::TreeBuilder. Если при выполнении кода обработчика события возникает необходимость преждевременно завершить синтаксический анализ, в обработчике события может быть вызван метод объекта синтаксического анализатора.
Для дополнительной настройки работы синтаксического анализатора могут применяться следующие два метода.
$bool = $parser->unbroken_text ([$bool])
При обработке фрагментов текста информационного наполнения, модуль html::Parser обычно передает их обработчику события text по одному, разбивая текст по словам. Если в качестве параметра вызова метода unbroken_text () будет указано истинное значение, это правило поведения изменится и весь текст между двумя тегами будет передаваться обработчику в одной операции, что позволяет упростить некоторые операции сопоставления с образцом.