Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- <?
- if (isset ($_REQUEST["all_url"]))
- {
- $res = $_REQUEST["all_url"];
- $res = trim($res);
- $res = explode("\n", $res);
- // начало работы с каждым адресом поочереди
- foreach ($res as $key => $url) {
- $home_site = parse_url($url);
- $home_site = $home_site['host']; // URL адреса по которому ищем ссылки
- /*
- $ch = curl_init (); // инициализация
- curl_setopt ($ch , CURLOPT_URL , $url); // адрес страницы для скачивания
- curl_setopt ($ch , CURLOPT_USERAGENT , "Mozilla/5.0 (Windows; U; Windows NT 5.1; ru-RU; rv:1.7.12) Gecko/20050919 Firefox/1.0.7"); // каким браузером будем прикидыватьсяs
- curl_setopt ($ch , CURLOPT_RETURNTRANSFER , 1 ); // нам нужно вывести загруженную страницу в переменную
- $content = curl_exec($ch); // скачиваем страницу
- curl_close($ch); // закрываем соединение
- */
- $content = file_get_contents($url);
- if ($content) {
- // поиск ссылок в исходном коде
- $result = preg_match_all("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/",$content, $m);
- if ($result) {
- $count_url = count($m[1]);
- $i = 0;
- $j = 0;
- $d = 1;
- $count = 0;
- $count2 = 0;
- while($i<$count_url) {
- //$str1 = stristr($m[1][$i],"http://");
- //$str2 = stristr($m[1][$i],"www.");
- //$str3 = stristr($m[1][$i],$home_site);
- echo ++$j.". ".$m[1][$i]."<br>";
- // поиск внешних ссылок
- if ((stristr($m[1][$i],"http://") || stristr($m[1][$i],"www.")) && !stristr($m[1][$i],$home_site)) {
- $count = $d++;
- //echo "------->".$m[1][$i]."<br>";
- }
- $i++;
- }
- $count2 = $count_url - $count;
- echo "<br><b>".$url."<br></b> Внешних: ".$count.". ";
- echo "Внутренних: ".$count2.".<br>------------------------------------<br>";
- }
- else {echo "Не получены ссылки с сайта <b>".$url."</b><br><br>";}
- }
- else {echo "Не получен исходный код с сайта <b>".$url."</b><br><br>";}
- }
- }
- ?>
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement