1. Viendo los disallows del fichero robots.txt
http://DOMINIO-OBJETIVO.com/robots.txt
Muchos de los webmasters queriendo que google no rastree su contenido premium los incluye en el fichero de robots.txt para que no queden indexados.
2. Usando el buscador de Wordpress
Como la mayoría de estos sitios se crean usando la plataforma gratuito de Wordpress, puedes usar su buscador:
http://DOMINIO-OBJETIVO.com/?s=download
3. Buscando en Google
Viendo las páginas indexadas
site:DOMINIO-OBJETIVO.com
Si devuelve muchas páginas indexadas y ninguna es la que nos interesa podemos filtrar las que aparezca el texto ebook
"ebook" site:DOMINIO-OBJETIVO.com
Ficheros PDF del dominio
filetype:pdf site:DOMINIO-OBJETIVO.com
Ejemplo con acceder al temario que tratan en Quondos:
http://www.quondos.com/sitemap.xml
Lo malo de este caso es que si que llevan un control con usuarios registrados que han pagado, por lo que no podemos ver sus artículos , sólo leer sus títulos a través de las url amigables.