reCAPTCHA: inteligencia colectiva aplicada
domingo 24 de junio de 2007
Un CAPTCHA es un sistema que evita que un programa informático (también conocido como bot) haga automáticamente algunas labores reservadas exclusivamente a humanos como:
- Poner comentarios en un foro/blog.
- Enviar noticias a sitios web especializados tipo digg, slashdot...
- Darse de alta en algún servicio y utilizarlo para fines propagandísticos (por ejemplo un servidor de correo gratuito).
- Y en general cualquier proceso que implique el rellenado automático de un formulario (susceptible, por tanto, de ser plagado de publicidad).
Dicho sistema consiste en la presentación, al usuario, de una imagen representando una palabra escrita, plagada de diferentes distorsiones y colores), que el usuario debe transcribir con caracteres (demostrando así, su capacidad inteligente). Algo así como esto:
Dicho sea de paso, algunas veces la inteligencia que demuestra un humano al realizar las tareas anteriormente mencionadas (como escribir en un foro o postear en un blog) está por debajo de la de un bot, pero esto es otra historia que no me atrevo a contar por no herir sensibilidades.
Dicho sea de paso, algunas veces la inteligencia que demuestra un humano al realizar las tareas anteriormente mencionadas (como escribir en un foro o postear en un blog) está por debajo de la de un bot, pero esto es otra historia que no me atrevo a contar por no herir sensibilidades.En definitiva, cada vez que queremos postear a blogger, o rellenar un formulario de inscripción, o cualquier tarea de este tipo, estamos desperdiciando "ciclos de CPU de nuestro cerebro" para realizar una tarea que tan sólo intenta verificar si hay un humano al otro lado. ¿Por qué no aprovechar todo este esfuerzo colectivo haciendo útil la tarea de traducir un captcha?
Algo así es lo que debió de pensar un grupo de ingenieros* de la Carnegie Mellon (la Universidad más prestigiosa en Computer Science del mundo) al darle una vuelta de tuerca más al proyecto: crear el concepto de reCAPTCHA.
La idea es sencilla: utilizar como imagen a reconocer, un texto escaneado con objeto de que sea el propio humano el que haga el proceso de reconocimiento de caracteres. Éste, de forma resumida es el siguiente:
Algo así es lo que debió de pensar un grupo de ingenieros* de la Carnegie Mellon (la Universidad más prestigiosa en Computer Science del mundo) al darle una vuelta de tuerca más al proyecto: crear el concepto de reCAPTCHA.
La idea es sencilla: utilizar como imagen a reconocer, un texto escaneado con objeto de que sea el propio humano el que haga el proceso de reconocimiento de caracteres. Éste, de forma resumida es el siguiente:
- En cada proceso de reCAPTCHA que intervenga el humano, se le muestran dos palabras: una de la que se conoce su significado, y otra que no.
- Dicho par de palabras se valida si y sólo si la primera se escribe correctamente. El significado asignado por el humano a la segunda se almacena.
- El par de palabras se muestra numerosas veces, hasta que se tienen datos a un suficiente nivel de significancia estadístico de que la transcripción de la palabra es una concreta. En ese momento se acepta como válida, y el proceso sigue, proponiendo esa palabra y la siguiente a las peticiones subsiguientes al servidor de reCAPTCHA.
Todo esto es útil porque permite que humanos realicen una tarea que a día de hoy, a las máquinas les sigue costando trabajo: el del reconocimiento óptico de caracteres. Y lo mejor de todo, sin ningún coste adicional para el usuario (ya que a fin de cuentas, ese esfuerzo lo iba a realizar de otra manera). Imaginaos las ventajas: con el tiempo suficiente sería posible digitalizar completamente bibliotecas completas con un nivel de confianza superior al de cualquier programa electrónico... ¡Otra forma más de preservar nuestra cultura!Este ese otro ejemplo de la inteligencia colectiva que ya mencionamos por aquí (inteligencia por medio de las masas), aunque en este caso, el uso de un pensamiento colectivo no es perjudicial/competitivo, como en el caso de decisiones de grupo, sino cooperativo. La "moraleja" es que cómo a base de pequeños y nimios esfuerzos de una multitud se puede llegar a realizar una tarea que a priori parece destinada a inteligencias superiores, o a máquinas de altísima potencia computacional.
Estoy deseando que blogger lo implemente ya :).
________________________
* Entre los que se encuentran Manuel Blum, uno de los creadores originales de la idea del CAPTCHA, y premio Turing (como el Nobel de computación) por su contribución al campo de la teoría de la complejidad, y Ben Maurer, uno de los miembros más activos de la comunidad de Ubuntu Linux, dedicado fundamentalmente a la optimización de recursos en las librerías GTK (mejorar el uso de memoria y la eficiencia).
por Alfonso E. a las 23:30
Etiquetas internet, redes sociales
4 comentarios:
Publicar un comentario en la entrada
Suscribirse a:
Enviar comentarios (Atom)

Pues no me he enterado del recaptcha. A ver en este ejemplo tendria que escribir para la primera palabra following no? pero luego que pasa con la segunda?
Por cierto, muy apañada la universidad de melón carnoso (que es el mote cariñoso que le puse a esta universidad hace ya tiempo xD)
Pues tiene muy buena pinta, aunque como le pasó a LP no sé qué pasaría luego con la segunda. Supongo que habría que escribir 2 palabras, lo que haría más pesado aún ese trabajo de "demostrar si eres humano".
Realmente hay cantidad de tareas que realizamos en internet que podrían ser reutilizadas, como esta, para obtener mayor beneficio. ¿Cuánta energía podríamos obtener de los millones de clicks diarios que se hacen en ratones? (vaya ejemplo...)
Ahora que dices eso... cuanta energía se habría obtenido en los ratones de bola (hablo en pasado por que ya están prácticamente obsoletos) si se les hubiese incorporado una dinamo xD
pf ya lo intente de mil maneras y reCAPTCHA es una basura puesto q de ninguna manera pude ingresar, cya.