Парсер Yandex блогов

Автор: admin. 28 Ноя 2008 в 15:09

Если вы хотите собрать базу яндекс блогов ( yandex blog base), то предлагаю вам программку для сбора URL блогов.

<?php

error_reporting(E_ALL);

$page=1;

while(true)
{
$content = file_get_contents(”http://blogs.yandex.ru/top/?page=$page”);

preg_match_all(’/<a href=\”(.*)\” class=\”container\”/’, $content, $piece);

//print_r($piece[1]);

$fl = fopen(”links.txt”, “a+”);
foreach($piece[1] as $v)
{
fputs($fl, $v.”\n”);
}
fclose($fl);

echo(”Complite page = “.$page.”, links = “.count($piece[1]).”\n”);
$page++;
}

?>

Программу можно запускать там, где есть php в режиме cgi. Примерно так:

php-cgi yandex_blogs.php

База блогов Яндекса ( не полная) здесь.

Популярность: 61%

Рубрики: База

Обсуждение
Отзыв Анатолий 27 апреля 2009

Спасибо за парсер :)

Отзыв Holy Diver 12 июля 2009

Вот бы оно и посты с яндекса парсило =)

Отзыв Mons 12 ноября 2009

Спасибо за сорцы, очень даже пригодилось.

Отзыв Николай 3 марта 2010

Ссылка сдохла

Ваш отзыв