Selenium y Web Scraping en Zaragoza Python Days

La semana pasada fui vilmente engañado para que preparara una charla en el retorno a la actividad del grupo de usuarios de Python en Zaragoza, a sus reuniones las han bautizado como Zaragoza Python Days y la primera fue ayer lunes en Dlabs.

No es que sea yo muy pythonista, pero he hecho mis cositas, y desde hace un tiempo es mi lenguaje por defecto cuando estamos hablando de Web Scraping, por la cantidad y diversidad de librerías que existen. Como voy publicando en mis retros semanales, llevo bastante tiempo trabajando con Selenium para estos menesteres, por lo que tenía de cajón el tema que iba a tratar. Aproveché a comentar también el porqué para el caso de ShuttleCloud se había optado por esta solución y comentar, a vista de pájaro, algunas cosas de su arquitectura.

También preparé una sencilla demo, sacar los cumpleaños de los contactos de una cuenta de facebook. No me maté mucho: creé una cuenta “fake” de facebook y pedí a algunos amigos que me aceptaran esa cuenta, habría que hacer modificaciones para sacar los de una cuenta real (empezando por soportar paginación)… pero como ejemplo de como hacer un scraping sencillito con selenium creo que estuvo bien.

Empezando la charla (Foto de David Lechón)

La verdad que el número de asistentes, sin ser ni masivo ni mucho menos, estuvo bastante bien y el feedback recibido de la charla ha sido mucho mejor de lo que esperaba. También salieron algunas preguntas interesantes que me ayudaron a aclarar algunas cosas que durante la charla pasé por alto o a las que no les había dado demasiada importancia.

Por cierto, que me encanta ver gente más joven que viene empujando fuerte estén liándose también a organizar grupos y saraos. Hay buena cantera :).