No encuentro ahora el post de @Sauron pero el sistema era escribir en google
site:blogger.com/profile/ "palabra clave"
y obteniamos un millar de enlaces a perfiles donde luego podiamos comprobar links rotos a blogs que seguian. La cosa es que si os fijais en cada uno de esos perfiles casi todos tienen un pequeño link que dice "correo electronico" con el tipico mailto:correo@gmail
Asi que cambiamos por esta configuracion site:blogger.com/profile/ @gmail y obtenemos como 1kk de direcciones de correo listas para scrappear. se puede variar por @yahoo, hotmail o lo que os de la gana, incluso he visto algun @google y @microsoft asi que telita xD
http://youtu.be/GSGxleayGOI
https://www.google.es/search?sourceid=ch...20gmail.es
A ver si cuando llege a casa intento extraer esas direcciones, el scrapeador de mails de la web no me funciona, scrappe box no es una opcion. Yo suelo utilizar mucho en mi trabajo Extractor98 un software gratuito de publysoft pero exige que la pagina se haya guardado antes como texto, luego el se encarga de extraer las direcciones de correo. Bueno ya me contareis que haceis con todas esas dirs xD
TOCINO & SPAM!!!