Определяем Google PR и Яндекс ТиЦ в PHP
06 Мар 2008Вот несколько простых функций, которые позволяют скрипту получить значения классических пузомерок (ТиЦ, PR) для страницы или сайта средствами PHP, может кому-нибудь пригодятся. Не требуют от сервера ничего сверхъестественного — PHP и возможности внешних соединений будет вполне достаточно.
GetPR.phps — получение Google PR в виде числа.
GetCY.phps — получение тулбарного Яндекс ТиЦ в виде числа.
Ещё Яндекс ТиЦ можно получить из каталога в виде картинки вот таким образом:
<img src=http://www.yandex.ru/cycounter?$uri>
Картинка, взятая по этому адресу покажет favikon`ку сайта, закешированную Яндексом.
<img src=http://favicon.yandex.net/favicon/$uri/>
$uri в этих примерах — нужный адрес сайта без http:// и www.
Посмотреть как это всё работает и сколько времени на это уходит можно вот на этом скрипте, который работает именно таким образом.
Спонсор: Мегаплан, удобная система управления задачами.
«Недосол – на столе, пересол – на спине» — гласит русская народная поговорка. Но, что делать если пересолил? Можно ли спасти пересоленное блюдо?
Довольно полезно, спасибо.
Класс, спасибо!
Вы достали меня оба, добро пожаловать в блэклист.
Спасибо за скрипты!
А что на тестовой страничке означает:
«Yandex CY (cat):»
Точнее, как работает эта информационная строчка :)
Написано же в статье… Получение ТиЦ картинкой из каталога.
Просто подумал, что последняя строчка на тестовой страничке означает наличие или отсутствие сайта в каталоге яндекса.. При проверке своего сайта после «Yandex CY (cat):» ничего нет.
Упс.. моя ошибка.. Была включена резалка баннеров и я не увидел рисунок, извиняюсь.. :)
Спасибо за коды.
Только всёже не понятно:
1) Почему тИЦ иногда 0 показывает хотя фактическое значение другое?
2) Почему долго определяет тИЦ?
Отличный вопрос. 0 может показывать по причине глюков яндекса — у него периодически отличается тулбарный ТиЦ от каталога и с WWW и без http://WWW...
А вот почему время плавает — вопрос… парсинг штука ненадёжная, надо бы попробовать тулбаром прикинуться.
вот так можно через тулбар взять ТИЦ
привожу функцию. передавать ей нужно значение с «http://»
=====
function GetTCY($url) {
$url=»http://bar-navig.yandex.ru/u?ver=2&show=32&url=».$url;
$Result=file_get_contents($url);
return $Result ? (int) substr(strstr($Result, ‘value=»‘), 7) : false;
}
=====
получаемый ответ от яндекса — xml такого вида:
О, спасибо, попробую расшифровать то что WordPress не обрезал :-)
А можно на почту непокоцанный скриптик ?
date.naoki(@)gmail.com
пжлста :)
только я вот не изучил еще вопрос бана яндекса…
но судя по всему бана по запросам к тулбару — нет )
Гы… посмотрел внимательно — это таже самая функция и парсинг того же самого XML бара. И задержки те же =(
[…] дней назад я выкладывал скрипты для определения средствами PHP показателей Яндекс ТиЦ […]
При массовой проверке, опытным путем выяснил задержки надо ставить rand(600,3000), (600,1200) гугль забанил
ps проверял 9000 сайтов.
за скрипт большое спасибо (на его основе сделал массовую проверку), (если автору интересно могу скинуть исходники массовой проверки)
Пришлите пожалуйста, можно на date.naoki [сабака] gmail.com .
А проксилист не прикрутили ? У меня никак руки не доходят =)
нет, прокси прикрутить тож времени нет
да и так нормально, оставил на ночь, с утра все готово было -) (9,296 сайтов)
А какой скрипт используете в вашей «Массовой проверке ТиЦ» (которая /temp/mass-cy-pr-check.php)?
Результат на 70 станиц появляется сразу, без delay.
Как там обходится бан если не секрет?
http://labs.zhilinsky.ru/scripts/cy-pr/mass.phps
о, фига се, а кто ты такой, Жилинский? Фамилия оч знакомая!
за код биг сенкс
удачи
[…] того, нашел очень полезные скриптики у него на сайте: Определяем Google PR и Яндекс ТиЦ в PHP и Проверка ТиЦ на PHP — ещё […]
На многих сайтах видел, если сайт не в индексе, то выдаёт значение n/a . Пытался получать это значение через поск в гугле site:bla-bla-.ru , но парсить не получается. Подскажите решение ?
А есть пример сайта, который не в индексе гугла и имеет ненулевой PR?
сейчас попробуем)
Работает, но что то у меня врет на единицу. В чем может быть байда?
Этот скрипт уже сильно устарел. Вот этот сейчас работает нормально: http://labs.phurix.net/articles/pagerank