20-11-2015, 05:16 PM
Me ha pedido un amigo un pequeño crawler didáctico y este es uno bastante simple que creo que puedes ver la potencia que tiene un robot en PHP con pocas líneas se puede hacer mucho!
Código PHP:
<?php
/* Robot para sacar Chistes de la web chistes.com */
/* Por nicolasmarin.com */
// Recorremos los primeros 1000 chistes de la web
for($i = 1; $i <= 1000; $i++)
{
/* Se puede obtener el codigo HTML con la funcion file_get_contents
Tambien se puede emplear la libreria cURL que tiene muchas mas opciones */
$response_html = file_get_contents("http://www.chistes.com/Chiste.asp?ID=$i");
/* Empleando expresiones regulares vamos a sacar dentro del HTML la clasificacion y el chiste */
preg_match('/<div class="clasificacion">.*"_top">(.*)<\/a>/siU', $response_html, $clasificacion);
preg_match('/height="100" hspace="5" vspace="5" align="left" \/>(.*)<\/div>/siU', $response_html, $chiste);
/* Imprimimos todos los datos extraidos del chiste */
echo "CHISTE NUMERO: $i<br/>\nCLASIFICACION: $clasificacion[1]<br/>\nCHISTE: $chiste[1]<br/>\n";
}
?>