Abril 22, 2009 por tolito
Categoría:
Vamos a ver como gracias a la "DOM Extension" de PHP podemos extraer todos los enlaces de una página web con un sencillo script PHP, sin necesidad de complicarnos con expresiones regulares.
Aquí os dejo un ejemplo muy sencillo comentado para que veáis como funciona:
<?php
//Decimos a libxml que no muestre errores
$original_config = libxml_use_internal_errors(true);
libxml_clear_errors();
//Cargamos el archivo html
$html = new DOMDocument();
$html->loadHtmlFile('http://www.chungarratadas.com');
//Usamos DOMXPath para buscar los enlaces (/a)
$xpath = new DOMXPath($html);
$enlaces = $xpath->query('//a');
//Recorremos todos los enlaces encontrados y mostramos la url(href)
foreach ($enlaces as $enlace)
{
echo $enlace->getAttribute('href')."<br/>";
}
//Devolvemos a su estado original el reporte de errores de libxml
libxml_clear_errors();
libxml_use_internal_errors($original_config);
?>
Un saludo a todos!

Últimos Comentarios
hace 7 semanas 2 días
hace 8 semanas 1 día
hace 8 semanas 3 días
hace 10 semanas 5 horas
hace 12 semanas 4 días
hace 13 semanas 6 días
hace 14 semanas 1 día
hace 14 semanas 3 días
hace 14 semanas 4 días
hace 15 semanas 1 día