viernes, 23 de agosto de 2013

GOOGLE DIGITALIZARÁ CINCO MILLONES DE LIBROS AL AÑO USANDO LOS ‘CAPTCHA’. queleer



recaptcha


Hasta hace poco, los ‘captcha’ no tenían otra utilidad más allá de evitar fraudes por internet. Las palabras que te obligan a escribir cada vez que quieres registrarte en un sitio buscan diferenciar a usuarios humanos de posibles robots informáticos que quieran introducir spam o boicotear algún servicio.
Sin embargo, uno de los inventores de la herramienta ha querido que los ‘captcha’ tenga algo más de utilidad. Luis von Ahn pensó que millones de internautas resolviendo palabras cada día pueden traducirse en miles de libros digitalizados y unos cinco millones de libros anuales.
La iniciativa se llama ’reCAPTCHA’ y como explica su página “es un servicio gratuito que ayuda a digitalizar libros o periódicos”. Según la organización, cada día se resuelven unos 200 millones de ‘captchas’ alrededor del mundo y aunque el tiempo que cada persona utiliza es ínfimo (unos diez segundos) el agregado supone la friolera de 150.000 horas diarias.
El proceso de digitalización pasa por el escaneado del original. Las imágenes que resultan de ese primer proceso son tratadas por un sistema de reconocimiento óptico de caracteres (OCR por sus siglas en inglés). Y como nada es perfecto, los ordenadores tienen problemas con laspalabras menos usadas.

FUENTE:  queleer

No hay comentarios:

Publicar un comentario

Related Posts Plugin for WordPress, Blogger...