¿Has notado que el CAPTCHA es ahora más difícil? Descubre las razones

 


El CAPTCHA es una invención que realizó el Guatemalteco Luis Vohn Ahn para poder detectar cuando, en lugar de un humano, algún programa o bot automatizado está utilizando una computadora. A esta prueba se le conoce como Turing inverso, ya que la entidad que juzga si el usuario es un humano o una computadora es una máquina. Sin embargo, estos últimos años (y meses) ha sucedido que la dificultad de estos es demasiado alta, en lo personal, perdí acceso a mi cuenta de Nvidia hace unos meses por fallar esta autenticación varias veces, pero, ¿por qué pasa eso?



El CAPTCHA fue inventado aproximadamente en 1998; este nació debido a la necesidad de poder identificar a usuarios falsos que estaban creando cuentas masivamente mediante programas automatizados, además de crear spam en sitios web. Por lo que, inicialmente, fue implementado en la creación de cuentas de sitios web, antes de enviar correos electrónicos, compras en línea, comentar o ingresar a algún sitio web. Se basaba únicamente en el reconocimiento de una palabra altamente distorsionada, ya que esta es una habilidad que nos definía como humanos porque fuimos entrenados desde pequeños a hacerlo y, en teoría, era algo que no podría realizar una computadora.

Luego, en 2009, nació ReCAPTCHA, promoviendo otro uso útil de esta autenticación, ya que, se tenían que resolver 2 palabras en vez de una. Esto hacía que, aleatoriamente, una de las palabras se utilizara para autenticarte en el sitio web y la otra para digitalizar diarios o libros viejos. 

El proceso de digitalización de libros era automático, si varias personas acertaban la misma palabra para esa secuencia de caracteres, se tomaba como correcta. Con esta tecnología se lograban autenticar cientos de diarios del New York Times, en días. Lo anterior llamó la atención en Google, haciendo que, en 2009, decidiera comprar ReCAPTCHA, utilizándolo para digitalizar libros, que es lo que ahora conocemos como Google Books. Sin embargo, a veces sucedían combinaciones de palabras ofensivas o chistosas, de las cuales dejaré un par a continuación.

 




Como con la segunda versión de captcha se dieron cuenta que, al agregar una palabra extra a descifrar, la aprobación del test bajó de un 97 % a un 92 %; además, se dieron cuenta de que la prueba podría no ser tan segura, por lo que Google aumentó la dificultad de los caracteres a reconocer y los puso a prueba. La sorpresa fue que el algoritmo tuvo una precisión del 99.8 % en reconocer las palabras, mientras que las personas solo tuvieron éxito alrededor del 33 % de las veces. Debido a eso, se llevó a cabo una nueva versión de captcha, la cual, consistía en reconocer imágenes y qué era lo que contenían estas o,  incluso, ver hasta dónde llegaba cierto objeto. Esta nueva versión del captcha se usaría para ayudar a los carros inteligentes de Google y para subtecnologías que implementa Google Maps.



Sin embargo, en 2016, el profesor de Ciencias de la Computación en la Universidad de Illinois, Jason Polakis, publicó un artículo en donde utilizaba un algoritmo con base en la búsqueda en reversa de imágenes de Google para poder resolver el mismo, teniendo este un 70 % de éxito. Además, varios investigadores rompieron este captcha, mediante la opción de audio que este tiene, con solo utilizar el mismo reconocimiento de voz de Google. Todo esto causó que, en definitiva, se hicieran pruebas mucho más difíciles y que no fueran fáciles de burlar. Esto también hizo que se comenzaran a buscar nuevas maneras para reconocer humanos en sitios web.



En 2019 nació una nueva versión de captcha llamada ReCAPTCHA invisible, basándose, por primera vez, en el comportamiento de las personas y calificándolo. Por lo que, si el comportamiento era sospechoso, muy rápido o tendía a parecerse al de una computadora, les asignaba un test de captcha de imágenes. Este se utiliza bastante en la actualidad, en muchos sitos webs. Además, basándose en la tecnología anterior, en 2020 nació No CAPTCHA reCAPTCHA, siendo el más utilizado hoy en día. Este le pide al usuario marcar un recuadro y, cuando esto sucede, la prueba recopila el último comportamiento que tuvo el usuario antes de marcar una casilla, si es sospechoso, le asigna un captcha de imágenes. De esta manera, la forma de reconocer a humanos y computadoras es el comportamiento.



Este es un tema que causa mucho debate, ya que, prácticamente, le estamos enseñando al computador cómo comportarse como humano. Por lo que muchos creen (incluyendo al mismo Luis Von Ahn) que, en algún futuro, ya no habrá una forma de diferenciar entre una computadora y un humano. Sin embargo, estas pruebas de comportamiento todavía no están preparadas para diferenciar al 100 % un humano de una computadora. Incluso si uno interactúa muy rápido en una página al hacer la prueba de captcha, esta siempre hará que resuelvas una prueba de imágenes. Por lo que, si no deseas perder el tiempo en captchas, puedes hacer pocos clics o, incluso, mover el mouse lento, esto me funciona una gran parte de las veces, por lo que, esto nos tiende a decir que todavía le faltan ajustes a estas pruebas. Así que, por el momento, creo que no tenemos que preocuparnos por esto.


-Megabruh

No hay comentarios:

Con la tecnología de Blogger.