¿Has notado que el CAPTCHA es ahora más difícil? Descubre las razones
El CAPTCHA es una invención que realizó el Guatemalteco Luis Vohn Ahn para poder detectar cuando, en lugar de un humano, algún programa o bot automatizado está utilizando una computadora. A esta prueba se le conoce como Turing inverso, ya que la entidad que juzga si el usuario es un humano o una computadora es una máquina. Sin embargo, estos últimos años (y meses) ha sucedido que la dificultad de estos es demasiado alta, en lo personal, perdí acceso a mi cuenta de Nvidia hace unos meses por fallar esta autenticación varias veces, pero, ¿por qué pasa eso?
El CAPTCHA fue inventado aproximadamente en 1998; este nació debido a la necesidad de poder identificar a usuarios falsos que estaban creando cuentas masivamente mediante programas automatizados, además de crear spam en sitios web. Por lo que, inicialmente, fue implementado en la creación de cuentas de sitios web, antes de enviar correos electrónicos, compras en línea, comentar o ingresar a algún sitio web. Se basaba únicamente en el reconocimiento de una palabra altamente distorsionada, ya que esta es una habilidad que nos definía como humanos porque fuimos entrenados desde pequeños a hacerlo y, en teoría, era algo que no podría realizar una computadora.
Luego, en 2009, nació ReCAPTCHA, promoviendo otro uso útil de esta autenticación, ya que, se tenían que resolver 2 palabras en vez de una. Esto hacía que, aleatoriamente, una de las palabras se utilizara para autenticarte en el sitio web y la otra para digitalizar diarios o libros viejos.
El proceso de
digitalización de libros era automático, si varias personas acertaban la misma
palabra para esa secuencia de caracteres, se tomaba como correcta. Con esta
tecnología se lograban autenticar cientos de diarios del New York Times, en
días. Lo anterior llamó la atención en Google, haciendo que, en 2009, decidiera
comprar ReCAPTCHA, utilizándolo para digitalizar libros, que es lo que
ahora conocemos como Google Books. Sin embargo, a veces sucedían combinaciones de palabras ofensivas o chistosas, de las cuales dejaré un par a continuación.
Como con la
segunda versión de captcha se dieron cuenta que, al agregar una palabra extra a
descifrar, la aprobación del test bajó de un 97 % a un 92 %; además, se dieron
cuenta de que la prueba podría no ser tan segura, por lo que Google aumentó la
dificultad de los caracteres a reconocer y los puso a prueba. La sorpresa fue que el algoritmo tuvo una precisión del 99.8 % en reconocer las palabras,
mientras que las personas solo tuvieron éxito alrededor del 33 % de las veces. Debido
a eso, se llevó a cabo una nueva versión de captcha, la cual, consistía en reconocer
imágenes y qué era lo que contenían estas o, incluso, ver hasta dónde llegaba cierto
objeto. Esta nueva versión del captcha se usaría para ayudar a los carros
inteligentes de Google y para subtecnologías que implementa Google Maps.
Sin embargo, en 2016, el profesor de Ciencias de la Computación en la Universidad
de Illinois, Jason Polakis, publicó un artículo en donde utilizaba un algoritmo con base en la búsqueda
en reversa de imágenes de Google para poder resolver el mismo, teniendo este un
70 % de éxito. Además, varios investigadores rompieron este captcha, mediante la
opción de audio que este tiene, con solo utilizar el mismo reconocimiento de
voz de Google. Todo esto causó que, en definitiva, se hicieran pruebas mucho más difíciles
y que no fueran fáciles de burlar. Esto también hizo que se comenzaran a buscar
nuevas maneras para reconocer humanos en sitios web.
En 2019 nació
una nueva versión de captcha llamada ReCAPTCHA invisible, basándose, por primera
vez, en el comportamiento de las personas y calificándolo. Por lo que, si el
comportamiento era sospechoso, muy rápido o tendía a parecerse al de una
computadora, les asignaba un test de captcha de imágenes. Este se utiliza
bastante en la actualidad, en muchos sitos webs. Además, basándose en la
tecnología anterior, en 2020 nació No CAPTCHA reCAPTCHA, siendo el más
utilizado hoy en día. Este le pide al usuario marcar un recuadro y, cuando esto sucede, la prueba recopila el último comportamiento que tuvo el usuario antes
de marcar una casilla, si es sospechoso, le asigna un captcha de imágenes. De esta manera, la forma de reconocer a humanos y computadoras es el comportamiento.
Este es un tema que causa mucho debate, ya que, prácticamente, le estamos enseñando al computador cómo comportarse como humano. Por lo que muchos creen (incluyendo al mismo Luis Von Ahn) que, en algún futuro, ya no habrá una forma de diferenciar entre una computadora y un humano. Sin embargo, estas pruebas de comportamiento todavía no están preparadas para diferenciar al 100 % un humano de una computadora. Incluso si uno interactúa muy rápido en una página al hacer la prueba de captcha, esta siempre hará que resuelvas una prueba de imágenes. Por lo que, si no deseas perder el tiempo en captchas, puedes hacer pocos clics o, incluso, mover el mouse lento, esto me funciona una gran parte de las veces, por lo que, esto nos tiende a decir que todavía le faltan ajustes a estas pruebas. Así que, por el momento, creo que no tenemos que preocuparnos por esto.
-Megabruh
No hay comentarios: