#php obtener todos los links de una url by empresario.mx

Fuente: empresario.mx

Un código básico de como obtienen algunos spiders la dirección url del código html

<?php
$html = file_get_contents('http://www.coudlain.com'); 
$dom = new DOMDocument(); // creamos un nuevo documento 
@$dom->loadHTML($html); // cargamos el código html 
// obtenemos todo de la pagina 
$xpath = new DOMXPath($dom); 
$hrefs = $xpath->evaluate("/html/body//a"); 
for ($i = 0; $i <$hrefs->length; $i++) {
	$href = $hrefs->item($i);        
	$url = $href->getAttribute('href'); 
	// finalmente obtenemos la url        
	echo $url.'<br>'; // la desplegamos en pantalla 
}
?>

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s