Noticias y Tendencias

¿Sabías que estás digitalizando los libros del mundo?

Im not a robot, Password

¿Alguna vez has tenido que llenar un formulario en internet y te pide transcribir unas letras distorsionadas para comprobar que no eres un robot? El famoso captcha. Cuando lo haces, contribuyes a la digitalización de los libros que hay en el mundo. ¿Increíble no?

Pues sí, esas letras distorsionadas se llaman CAPTCHAS que por sus siglas en inglés significan Completely Automated Public Turing Test to tell computers and humans apart, o en español Prueba de Turing completamente automática y pública para diferenciar computadoras de humanos. Puede sonar confuso el nombre, pero es un test o filtro controlado por una máquina con el objetivo de evitar que programas informáticos nocivos llenen formularios en internet de manera automatizada y masiva, aprovechando que las computadoras no tienen la capacidad de traducir un texto distorsionado.

Pero hablemos un poquito de la historia…

Luego de que Luis Von Ahn creara ese filtro, programó su evolución como un proyecto en la universidad, llamado RECAPTCHA, con lo cual fundó una startup que en 2009 fue adquirida por Google.

Hasta aquí no pudiera parecer tan interesante, pero aquí les comparto unos datos que lo hacen especial.

  • El tiempo promedio que empleamos para llenar un RECAPTCHA es de 10 segundos.
  • 200 millones de RECAPTCHAS son llenados por día en todo el mundo, que, si lo multiplicamos por esos 10 segundos, dan más de 555 mil horas diarias consumidas en el llenado. ¡Impresionante!   

Ante eso, Luis Von, por cierto, fundador de Duolingo, se preguntó cómo es que podía utilizar ese tiempo en favor de la humanidad, pues bien, cuando llenamos un RECAPTCHA no solo comprobamos que no somos un robot, sino que además contribuimos a que se digitalicen los libros que hay en el mundo y ni siquiera nos damos cuenta.

Actualmente existen programas que están tratando de digitalizar todos los libros que se han escrito, como era de esperarse, Google y Amazon cuentan con dichos programas donde lo que hacen es escanear hoja por hoja los libros físicos y después con un programa de reconocimiento de texto convierten las imágenes en libros digitales, sin embargo, el procedimiento no es tan efectivo ya que las hojas de los libros muchas veces no están en buen estado, ya sea porque la tinta no es tan legible, el libro tiene algunas manchas de café o son tan antiguos que las hojas ya tienen una pigmentación amarilla y por eso la computadora no puede descifrar alrededor de un 30% de las palabras.

Aquí es justamente donde entra el RECAPTCHA, las palabras que no puede descifrar se dirigen a los RECAPTCHAS, de esa manera llenamos los filtros de seguridad y a su vez contribuimos a la digitalización de 2 millones de libros al año, digitalizados por gente llenando RECAPTCHAS en todo el mundo, trabajando gratis para Google, pero en beneficio de la humanidad.

Por último, quiero agregar que esto además de ser un dato curioso, nos puede enseñar una lección, RECAPTCHA fue una idea para resolver un problema que evitara el spam y los ataques cibernéticos de programas maliciosos y finalmente los gigantes vieron una oportunidad para aprovechar la idea del trabajo hormiga masivo y así lograr que ese proceso tan aparentemente sencillo resolviera un problema mayor. Nos deja ver cómo al aplicar el flujo de trabajo anidado, las acciones pequeñas pueden llevar a saltos exponenciales.

Fernanda Vázquez

Ingeniero en Innovación y Desarrollo Empresarial, actualmente se desempeña como Coordinadora de Generación de Contenido en Marketing. Disfruta de temas relacionados con el desarrollo personal, innovación, emprendedurismo y negocios.