0 votos
Buenas! Estuve leyendo el post sobre JSOUP (Java) y me pareció muy bueno. Así que me puse manos a la obra y decidí probarlo. Ahora tengo una duda..¿cómo podría scrapear el contenido de una web que se actualiza dinámicamente? Por ejemplo, sacar datos de una tabla que, al hacer click en cierto botón, actualiza la misma.

Gracias y saludos

Agustín
preguntado por abarazal Ago 27, 2015 en Java

1 Respuesta

0 votos
Hola Agustín.

Jsoup permite rellenar formularios, seleccionar checkbox, selectores, etc. vamos que permite hacer prácticamente las mismas acciones que podríamos hacer si estuviésemos navegando en esa web.

Lo que entiendo que quieres hacer es obtener el contenido de una tabla tras hacer un "onclick" en un button o submit. Para ello debes primero hacer ese onclick y luego leer el contenido.

Yo no me sé de memoria todas las posibles opciones ha realizar en formularios y demás. Si que las he tenido que hacer hace años (antes de que saliese Jsoup) pero concretamente nos las he utilizado con Jsoup. He visto por ahí que Jsoup permite similar estas acciones. Te dejo un par de enlaces que creo que te pueden ayudar o por lo menos encaminarte a encontrar una solución a tu problema.

http://stackoverflow.com/questions/11660469/get-content-from-javascript-onclick-hyperlink

http://stackoverflow.com/questions/30297661/extract-onclick-attribute-using-jsoup

SL2
respondido por Ricardo Moya [Admin] Ago 30, 2015
Hola Ricardo. Gracias por tu pronta respuesta.

Yo más bien me refería a obtener los datos que, en tiempo real (minuto a minuto), cambian en un campo de una tabla, por ejemplo, sin que el usuario tenga interacción con la página (osea ningún onclick, etc).
Pues ahí lo único que se me ocurre es que hagas peticiones cada minuto o cada "X" tiempo. Lo único ten cuidado con que te pillen la IP y te corten las peticiones. Lo suyo en este caso es que utilices 2 o 3 proxies y vayas rotando las peticiones con diferentes IPs.

SALUD & SL2