GOTCHA, CAPTCHA, reCAPTCHA: Soy una máquina, ponme un test de Turing y lo superaré (o mis programadodres se encargan de lograrlo)

Por Francisco R. Villatoro, el 12 septiembre, 2008. Categoría(s): Ciencia • General • Informática • Noticias ✎ 1

El test de Turing, que según nuestro amigo Carlos de la Singularidad Desnuda «es uno de los más clásicos intentos de caracterizar la inteligencia humana y determinar si un sistema artificial puede considerarse «inteligente»,» tiene su expresión práctica más conocida en los CAPTCHAS (Completely Automated Public Turing test to tell Computers and Humans Apart, Prueba de Turing pública y automática para diferenciar a máquinas y humanos), es decir, cadenas alfanuméricas distorsionadas que deben ser leídas, entendidas y tecleadas como clave de acceso a ciertos sitios web. Casi todos hemos tenido que superar un CAPTCHA alguna que otra vez. La idea no es muy antigua, de Luis von Ahn, Manuel Blum, Nicholas J. Hopper, and John Langford, «The CAPTCHA Web Page,» 2000); os recomiendo a los interesados el artículo técnico de Luis von Ahn et al. «CAPTCHA: Using Hard AI Problems for Security,» EUROCRYPT 2003, Lecture Notes in Computer Science, 2656: 294-311, 2003 .

Igual que con los virus y los antivirus (es imposible programar un antivirus para eliminar un virus que aún no ha sido desarrollado, con lo que los hackers que saben cómo funcionan los antivirus actuales pueden programar virus «inicialmente» indetectables) los captchas (tests de Turing) han de ir mejorando constantemente ya que los hackers pueden desarrollar algoritmos para superarlos. «Echa» la ley, «echa» la trampa.

¿Siempre habrá cosas (tareas) que podrán hacer los humanos pero no las máquinas (computadores)? ¿Siempre habrá humanos capaces de lograr que las máquinas resuelvan tareas que «se suponía» que las máquinas no podían resolver?

Ya hay software capaz de superar muchos de los CAPTCHAs que encontramos «todos los días» en Internet, por ello, los investigadores que inventaron los CAPTCHAa han tenido que inventar los reCAPTCHAs («hablando de cojo…, recojo…»). No es noticia, ni debería serlo, pero la noticia es que lo han publicado en Science (os recuerdo, índice de impacto en 2006 de 30.028): Luis von Ahn, Benjamin Maurer, Colin McMillen, David Abraham, and Manuel Blum, «reCAPTCHA: Human-Based Character Recognition via Web Security Measures,» Science, Vol. 321. no. 5895, pp. 1465-1468, 12 September 2008.

Bueno, seamos sinceros, en realidad el artículo publicado en Science tiene una utilidad práctica más allá de la seguridad informática (en otro caso no lo hubieran publicado en Science, tiene que haber una «noticia» detrás para que sea publicado).

¿Por qué no usar a las personas que resuelven los CAPTCHAs como «computadoras humanas» para resolver problemas prácticos?

Sí, has leído bien, por qué no usar a las personas que resuelven los acertijos de los CAPTCHAs para que no sólo tengan acceso a un recurso sino que además resuelvan un problema práctico (aunque sin ser conscientes de ello).

¿Qué problema pueden resolver? Obviamente, el mismo que un OCR (sistema óptico de reconocimiento de caracteres). Un humano actúa como un OCR con una alta precisión (más del 99% de aciertos según los autores del artículo).

¿Y tiene que saberlo la persona que «es utilizada» como OCR? No, ¿o sí? En cualquier caso los autores han «engañado» a unos «cuantos humanos» gracias a unos 40.000 sitios web que utilizan los «reCAPTCHAs» y han sido capaces de usarlos como «OCR humano» para transcribir unos 440 millones de palabras. ¿Has sido tú uno de ellos? Quizás yo mismo lo haya sido.

¿Es ético/moral que nos utilicen? ¡Para qué otras cosas nos utilizarán en Internet!

Según los investigadores, todos los días se resuelven unos 100 millones de CAPTCHAs en la web. Proyectos de digitalización de libros, como el Google Books Project, se pueden aprovechar de este trabajo «gratis» utilizando los «reCAPTCHA».

Por supuesto, ahora que lo sé (igual que tú que quizás te acabas de enterar), engañaré a los reCAPTCHAs de vez en cuando, no quiero que me utilicen. ¡Faltaría más!

Bueno, lo siento, los investigadores lo saben, así que utilizan un sistema de votación: la misma palabra distorsionada es propuesta a varios humanos y sólo cuando la mayoría dan una misma respuesta ésta es considerada válida. ¡No son listos los autores! ¡Qué cabr….!

Permitidme la frase en inglés con la que acaba el artículo en Science: «We hope that reCAPTCHA continues to have a positive impact on modern society by helping to digitize human knowledge

¡No quiero ser un «mono» en manos de estas «hermanitas de la caridad»!

¿Y tú?



1 Comentario

  1. el recaptcha soluciona un problema, si fueses admin de un web site no te gustaria ser atacado diariamente, si etico o no? pues viene al caso «bajo aviso no hay engaño» cuando se te presenta un recaptcha le puede dar clic en el icono para informate si cultura no se preocupa por enterarse no es problema mas que de ellos, por ultimo deberias estar buscando en tu biblioteca los libro que no estan en la red, escanearlos y que la gente de todo el mundo haga algo mas que ver tonterias en la red sino el conocimiento en los libros se puede perder ya que todos prefiere buscar en la red que en un biblioteca. Saludos 😉

Deja un comentario