Foro Black Hat SEO

Versión completa: Scrapear con phyton
Actualmente estas viendo una versión simplificada de nuestro contenido. Ver la versión completa con el formato correcto.
Páginas: 1 2
No soy programador, aunque html y php si que ando un poco. El tema es que me quería meter a aprender a scrapear bien, con phyton y scrappy básicamente. Hay mucho manual en google, pero nada como la información de primera mano.

1 .Algun consejo?
2. Por qué tool empezar xpath, pyton básico?
3. Carlos estás perdiendo el tiempo, dedicate a hacer webs..
4. Alguien me enseñaría en Madrid, quedando 4-5 días o lo que necesitemos? a un precio fair para los dos...
Yo todavía no me he puesto mucho con Python y lo parte de lo que me he puesto ha sido para esto hace unos pocos días ya que necesito hacer un bot a pleno rendimiento para sacar mails cosa para la que PHP no está a la altura aunque es completamente válido, pero te puedo decir que aquí https://github.com/scrapy/scrapy/wiki tienes tutos.

Y para empezar tendrás que instalar Python si usas Windows porque creo que no viene por defecto, si usas una distro Linux ya viene y si usas Mac creo que también, después pues a escribir código xD. Puedes ejecutar código directamente en la consola escribiendo python, y te saldrá la consola de Python (>>>) y para salir escribes exit(), y para ejecutar un archivo externo, por ejemplo 'bot.py' escribes python bot.py en la consola y te lo ejecuta

No te he dicho mucho, pero lo poco que es espero que te sirva de ayuda Sonrisa
Os recomendaría que vieseis la posibilidad de hacer el scraper en Golang. Este lenguaje esta pegando muy fuerte para el backend (apis...)
(04-05-2014, 02:58 AM)Sauron escribió: [ -> ]Os recomendaría que vieseis la posibilidad de hacer el scraper en Golang. Este lenguaje esta pegando muy fuerte para el backend (apis...)
Antes de utilizar Go prefiero utilizar NodeJS, instalas jQuery y ya tienes el mejor motor para 'navegar' el HTML que pueda existir. Además de que Node es rápidisimo y no es un mundo nuevo si ya sabes Javascript.
Yo ni si quiera he mirado Go, pero me suena que leí hace un tiempo que no tiene excepciones porque los autores dijeron que eran innecesarias al ser excepciones xD y éstas se suelen utilizar bastante.
@lobogris la verdad no sabía que nodejs era tan eficiente Sonrisa, pero creo que go le gana:
http://jaxbot.me/articles/benchmarks_nod..._3_14_2013

De todas maneras la verdad cada vez soy menos fan de lo que hace Google y este lenguaje ha salido de ellos, así que no creo que me pase a hacer scraper en golang...
(04-05-2014, 10:40 PM)Sauron escribió: [ -> ]@lobogris la verdad no sabía que nodejs era tan eficiente Sonrisa, pero creo que go le gana:
/articles/benchmarks_nodejs_vs_go_vs_php_3_14_2013

De todas maneras la verdad cada vez soy menos fan de lo que hace Google y este lenguaje ha salido de ellos, así que no creo que me pase a hacer scraper en golang...
NodeJS es muy rápido, más que Ruby y por ahí se andará con Python, pero estos tres tanto como Go son lenguajes tan rápidos en los cuales decidir en base a su velocidad es lo de menos porque prácticamente no lo vas a notar, quiero decir que habría que decidir más frente a consumo de recursos y para qué se van a usar. En cambio PHP pues ya se ve que se nota bastante xD, aunque personalmente para la programación web me quedo con éste (o Rails en su defecto) por la razón de que es con el que mejor me llevo además de su facilidad.
Y sí, creo que yo tampoco programaré nunca en Go por la misma razón xD, de Google me quedo con Angular y Polymer y es más que suficiente xD.

P.D: Al mencionarme no envía notificaciones?
yo te are un post para scrapear con phyton pero no es recomendable..
(30-08-2014, 03:00 AM)StarSplish escribió: [ -> ]yo te are un post para scrapear con phyton pero no es recomendable..

¿porque no es recomendable scrapear con phyton?
(30-08-2014, 03:00 AM)StarSplish escribió: [ -> ]yo te are un post para scrapear con phyton pero no es recomendable..

(20-09-2014, 01:06 PM)arkako escribió: [ -> ]¿porque no es recomendable scrapear con phyton?

Y me dejó con la duda... Astuto
¿Qué es scrapear?
Páginas: 1 2