OT: Web scraping con HMG
Moderator: Rathinagiri
- edufloriv
- Posts: 240
- Joined: Thu Nov 08, 2012 3:42 am
- DBs Used: DBF, MariaDB, MySQL, MSSQL, MariaDB
- Location: PERU
OT: Web scraping con HMG
Saludos amigos,
Quisiera saber si alguien tiene experiencia realizando web scraping usando HMG. Es para realizar un proceso de extracción de datos de una página de licitaciones del gobierno (.gob.pe).
Por favor contactarse conmigo para explicar de que se trata el trabajo y me puedan cotizar el costo, ya que yo no tengo experiencia en esto, sé que puedo hacerlo, pero en este momento tengo en ciernes varios proyectos pendientes y ya no dispongo de tiempo para investigar este campo. Así que me es más viable recurrir a alguien que ya tiene código escrito.
Agradeciendo su gentil atención, estaré a la espera. ( si desean pueden contactarse conmigo a eduflorivarrobagmailpuntocom ).
Cordiales saludos a todos.
Quisiera saber si alguien tiene experiencia realizando web scraping usando HMG. Es para realizar un proceso de extracción de datos de una página de licitaciones del gobierno (.gob.pe).
Por favor contactarse conmigo para explicar de que se trata el trabajo y me puedan cotizar el costo, ya que yo no tengo experiencia en esto, sé que puedo hacerlo, pero en este momento tengo en ciernes varios proyectos pendientes y ya no dispongo de tiempo para investigar este campo. Así que me es más viable recurrir a alguien que ya tiene código escrito.
Agradeciendo su gentil atención, estaré a la espera. ( si desean pueden contactarse conmigo a eduflorivarrobagmailpuntocom ).
Cordiales saludos a todos.
Eduardo Flores Rivas
LIMA - PERU
- edufloriv
- Posts: 240
- Joined: Thu Nov 08, 2012 3:42 am
- DBs Used: DBF, MariaDB, MySQL, MSSQL, MariaDB
- Location: PERU
Re: OT: Web scraping con HMG
Saludos,
Aquí los detalles de la necesidad del cliente:
URL :
https://prodapp2.seace.gob.pe/seacebus- ... lico.xhtml#
Paso 1: Realizar consulta con los siguientes criterios:
Paso 2: Extraer los datos devueltos (LISTA A):
Paso 3: Por cada detalle de la LISTA A hay que ejecutar la acción "Ficha de Selección":
Paso 4: El paso 3 devuelve otra página con datos similar a esta, al cliente le interesa los campos marcados en rojo, estos campos deben ser parte del excel final:
Paso 5: En algunos casos también el paso 3 devuelve dentro del resultado una LISTA DE POSTORES, estos datos también le interesan al cliente:
Paso 6: El excel resultado final debe ser igual a este:
Dentro del excel final hay datos de los POSTORES que deben ser extraidos de OTRA URL usando el número de RUC del postor:
https://apps.osce.gob.pe/perfilprov-ui/
Ese es a grandes rasgos el proyecto.
Cordiales saludos.
Aquí los detalles de la necesidad del cliente:
URL :
https://prodapp2.seace.gob.pe/seacebus- ... lico.xhtml#
Paso 1: Realizar consulta con los siguientes criterios:
Paso 2: Extraer los datos devueltos (LISTA A):
Paso 3: Por cada detalle de la LISTA A hay que ejecutar la acción "Ficha de Selección":
Paso 4: El paso 3 devuelve otra página con datos similar a esta, al cliente le interesa los campos marcados en rojo, estos campos deben ser parte del excel final:
Paso 5: En algunos casos también el paso 3 devuelve dentro del resultado una LISTA DE POSTORES, estos datos también le interesan al cliente:
Paso 6: El excel resultado final debe ser igual a este:
Dentro del excel final hay datos de los POSTORES que deben ser extraidos de OTRA URL usando el número de RUC del postor:
https://apps.osce.gob.pe/perfilprov-ui/
Ese es a grandes rasgos el proyecto.
Cordiales saludos.
Eduardo Flores Rivas
LIMA - PERU
Re: OT: Web scraping con HMG
Everything is scriptable from a hbWUI program except de captcha ( that's why they put it on). To avoid robots.
Angel Pais
Web Apps consultant/architect/developer.
Web Apps consultant/architect/developer.
- edufloriv
- Posts: 240
- Joined: Thu Nov 08, 2012 3:42 am
- DBs Used: DBF, MariaDB, MySQL, MSSQL, MariaDB
- Location: PERU
Re: OT: Web scraping con HMG
Hi Angel,
Thanks for your time. I guess the "tesseract" can't read that captcha either, since it's black letters on a gradient gray background. Don't you know another similar program?
Best regards.
----------------------------------------------------------------------------------------------
Hola Angel,
Gracias por tu tiempo. Supongo que tampoco el "tesseract" puede leer ese captcha, ya que es de letras negras sobre un fondo gris en gradiente. ¿ No conoces otro programa similiar ?
Cordiales saludos.
Thanks for your time. I guess the "tesseract" can't read that captcha either, since it's black letters on a gradient gray background. Don't you know another similar program?
Best regards.
----------------------------------------------------------------------------------------------
Hola Angel,
Gracias por tu tiempo. Supongo que tampoco el "tesseract" puede leer ese captcha, ya que es de letras negras sobre un fondo gris en gradiente. ¿ No conoces otro programa similiar ?
Cordiales saludos.
Eduardo Flores Rivas
LIMA - PERU
Re: OT: Web scraping con HMG
Hola edufloriv, todo lo referente a Scraping lo hago con PHP, si queres te envio por este medio un scraping que uso en una aplicacion financiera que uso para sacar el valor del Dolar (por ejemplo), por suerte se puede scrapear bastante, pero uso PHP y aveces Javascript, si te interesa te lo paso.
Re: OT: Web scraping con HMG
Hola. Saludos.
Estoy interesado en el codigo php que ofreces.
Si no es mucha molestia, Por favor envíame a asesormix@gmail.com.
Te lo agradezco.
Estoy interesado en el codigo php que ofreces.
Si no es mucha molestia, Por favor envíame a asesormix@gmail.com.
Te lo agradezco.
- serge_girard
- Posts: 3342
- Joined: Sun Nov 25, 2012 2:44 pm
- DBs Used: 1 MySQL - MariaDB
2 DBF - Location: Belgium
- Contact:
Re: OT: Web scraping con HMG
Jorge,
Please send scraping PHP sample!
Serge
Please send scraping PHP sample!
Serge
There's nothing you can do that can't be done...
Re: OT: Web scraping con HMG
Eduardo, I am not sure if this is relevant. What I have at the start of my program I create a text file in a specific folder.
When my clients when in certain websites they can print there selections to that file, then put directly on there invoice.
I have written import files for each website they what to import from.
This may be a bit old fashioned as I do not know coding for the web but it works very well.
Franco
When my clients when in certain websites they can print there selections to that file, then put directly on there invoice.
I have written import files for each website they what to import from.
This may be a bit old fashioned as I do not know coding for the web but it works very well.
Franco
All The Best,
Franco
Canada
Franco
Canada
Re: OT: Web scraping con HMG
Sorry,
My explanation above is not quite right. I create a printer port which is file. Clients print to that printer then in my program I import
and adjust the file to fill the fields in the specific table to lines of the file.
My explanation above is not quite right. I create a printer port which is file. Clients print to that printer then in my program I import
and adjust the file to fill the fields in the specific table to lines of the file.
All The Best,
Franco
Canada
Franco
Canada