Код парсера:
Вобщем, по идее,
if (preg_match_all('[/h1]', $content, $matches))
{
print_r($matches[1]);
}
должен обходить всю страницу... но этого не происходит ... подскажите pls как еще можно цикл представить....
Код |
---|
<? set_time_limit(0); if (preg_match_all('~</h1>">(.*?)<div>~i', $content, $matches)) { print_r($matches[1]); } /* получаем содержимое нужной нам страницы в переменную $content $content = file_get_contents("http://vefire.ru/letter/1/"); // Определяем позицию строки, до которой нужно все отрезать (используем функцию strpos()). $pos = strpos($content, '</h1>'); /*Отрезаем все, что идет до нужной нам позиции (функция substr в данном случае принимает два параметра: строка для обработки и //номер позиции. Функция вернет строку, НАЧИНАЯ с указанной позиции) */ $content = substr($content, $pos); // Точно таким же образом находим позицию второй строки $pos = strpos($content, '<div>'); // Отрезаем нужное количество символов от нулевого $content = substr($content, 0, $pos); // выводим полученную строку. echo $content; $fps = fopen("1.html","w+"); fwrite($fps,$content); fclose($fps); ?> |
Вобщем, по идее,
if (preg_match_all('[/h1]', $content, $matches))
{
print_r($matches[1]);
}
должен обходить всю страницу... но этого не происходит ... подскажите pls как еще можно цикл представить....
Изменено:
Константин Ерыгин - 22 Марта 2011 19:57