2
Jul 15

Google Fotos y el racismo: Crónica de un error anunciado

Ayer salió a la palestra una noticia de actualidad sobre Google Fotos y el hecho de que ésta aplicación etiquetara como "gorilas" a algunas personas negras. Durante estos días han corrido ríos de tinta en la red sobre el supuesto racismo de Google a la hora de hacer sus aplicaciones, pero hay que tener en consideración algunos temas sobre IA para entender el error, que nada tiene que ver con el racismo.

Lo primero y fundamental es aclarar a la gente que la IA tiene poco de inteligente y mucho de artificial. Si algo enseña este campo es que los seres vivos somos máquinas increibles, capaces de realizar cálculos a velocidades vertiginosas y sin casi errores, algo que una máquina es incapaz hoy por hoy. Para que esto sea posible, muy probablemente tendremos que esperar a que otros campos como la neurociencia nos alumbren sobre como funciona nuestra "CPU biológica", el cerebro.

Por otra parte, la IA es un campo que aunque se lleva investigando desde los 60 sigue en pañales, ya que hasta hace menos de una década siquiera teníamos equipos para ejecutar estos algoritmos en unos tiempos aceptables (cuando digo aceptables, me refiero a bajar de las horas y semanas incluso que podían tardar ciertos procesamientos). Aún hoy muchos algoritmos siguen sin poderse ejecutar en tiempos asumibles. Por tanto, la IA es un campo aún en investigación y aunque las empresas intenten sacar productos comercializables, hay que tener en cuenta que no tendremos tasas de acierto del 100%, es más, es algo que dificilmente podremos tener a corto y medio plazo.

googlevil

El error racial de Google Fotos no es el único, además. Hace unos meses Flickr tuvo el mismo problema: etiquetar a un negro como un mono. ¿Por qué ocurre esto? Empecemos por el principio.

¿Qué es un clasificador?

Un clasificador es un algoritmo que, dado un dato de entrada, nos devuelve como salida una etiqueta o clase de pertenencia. Para que este algoritmo asigne una etiqueta a un determinado dato, necesita de un entrenamiento previo con unos datos suficientemente robustos para ser capaz de identificar esa clase en todos los casos (datos ya etiquetados). Por ejemplo, para un ordenador una cara de frente y otra de perfil, o una cara de una persona blanca o asiática, con una negra, nada tienen que ver. Igual ocurre con cosas tan nímias como la iluminación: no es igual una cara iluminada con el sol de mediodía, que una cara iluminada con fluorescentes. ¿Por qué? Porque para el ordenador esa foto a clasificar no es más que una matriz numérica, en donde cada campo indica la intensidad de un píxel, nada más. El no sabe de temas raciales y culturales.

La elección de los datos de entrenamiento sigue siendo una temática ampliamente investigada en el campo, ya que por norma general no se puede contar con muchos datos que tengan las variaciones suficientes para que un clasificador tenga tasas de acierto perfectas, ni tampocos somos capaces de encontrar descriptores (vectores numéricos que representan cierta característica discriminante del dato, los bordes de una imagen, por ejemplo) robustos para que los clasificadores sean tan óptimos como el cerebro humano.

Por tanto, ¿qué ha pasado con Google Fotos? Sinceramente no tengo ni idea como será el clasificador de Google internamente (ojalá :P), pero sí se que es una red neuronal convolucional, por lo que me puedo imaginar a grandes rasgos los problemas que han causado que una máquina sin ética ni moral pueda ser "racista".

Para empezar, imagino que uno de sus descriptores pueda ser el color, más que nada porque el color es algo casi inherente a la visión artificial. Aunque Google use fotos de todo tipo de razas, hay que de nuevo recordar que el ordenador lo único que ve son celdas (píxeles) con valores numéricos del 0 al 255. Los asiáticos y blancos tendremos umbrales de color similares, mientras que las personas negras no están comprendidas dentro de estos umbrales. Por tanto, habrá muchos más ejemplos de caras que tengan umbrales similares (asiáticas, europeas, etc.) y otro grupo que no, por lo que si no se asigna un peso pequeño a este descriptor, el algoritmo lo utilizará como indicativo de una cara humana, rechazando a una gran parte de la población por motivos de color. Es un tema de proporción de imágenes colgadas en Google, quién tiene más población con acceso a internet, etc. Nos guste o no, por desgracia la mayoría de población negra no tiene acceso a un ordenador, al menos no en la misma proporción que europeos y asiáticos. No obstante, estoy segura que aquí Google ha sabido muy bien compensar los datos y pesos para que el color no fuera muy discriminante.

Por otra parte, se habrán tenido en cuentas descriptores de forma, ya sean con bordes, esquinas, etc. Nos guste o no, los seres humanos somos una especie de primate, por lo que nuestros rasgos son muy similares a los de nuestros parientes los monos. Por su parte, como sabéis, los gorilas son de un predominante color negro.

Los clasificadores están basados en probabilidades. Este mira la probabilidad / peso de un dato para cada etiqueta, y se queda con el valor más alto. Por tanto, ¿es raro que en determinadas circunstancias de gestos, iluminación, etc. el clasificador "monos" de valores más altos que el de "humanos"? Por supuesto que no. Como ya contestó Yonatan Zunger, arquitecto jefe de Google+, también tienen problemas con caras blancas, que son etiquetadas a veces como perros y focas. Si el algoritmo es tan "tonto" de confundirnos con una foca, ¿cómo no va a fallar con un primate?

Por tanto, el problema en el algoritmo de reconocimiento facial de Google no es que no se tuvieran en cuenta todas las razas y sexos posibles, sino el hecho de sacar un producto al público de un campo que sigue hoy en día en desarrollo, y del que no podemos asegurar tasas de acierto perfectas. Como afirmaba antes, el ordenador no sabe de temas éticos y culturales, por lo que igual que puede fallar etiquetando blancos como focas sin que nadie se sienta insultado, puede también dar resultados que sí afecten a cierto colectivo, como el caso de los primates, sin que nosotros podamos saberlo a priori.

La pregunta por tanto es, ¿debemos limitar la investigación de estos productos al campo académico porque a veces puedan fallar y darnos resultados incorrectos?

Artículo publicado en El Boletin:

Google Fotos y el racismo: crónica de un error anunciado

Share
20
Oct 14

Focalizando esfuerzos: Science, Bitch!

¡Hola frustrados!

Hacía mucho tiempo que no dedicaba un huequito en el blog para hablar de mi vida y milagros y ya iba siendo hora, que esto es un blog personal. Los cambios en mi día a día al final afectan a las temáticas de este blog, así que toca informar de ciertos cambios en "mi linea editorial" xD. Es algo que llevo tiempo queriendo hacer, pero que he estado posponiendo por lo recientes que estaban ciertas cosas y lo mucho que me costaba poder hablar de ello con frialdad.

En primer lugar, seguiré hablando de sociedad y política, pero el tema tan recurrente de los últimos tiempos, Podemos, pasa a mejor vida, ya que dejé mi Círculo hace un par de meses. No entraré mucho en detalles, pero parece que como era la "trotska" del círculo, algunos decidieron reinterpretar el relato de Rebelión en la Granja y, al igual que Snowball, me tocó salir corriendo. Se que este tema despertará las ancias carroñeras de más de un lector que pueda pasar por mi blog, pero es un tema en el que no quiero extenderme más porque lo que menos me apetece ahora mismo es seguir hablando de un movimiento, ya no social, sino de personas, que tanto me ha decepcionado y me ha demostrado que España sigue igual de podrida que siempre. Ahora entiendo por qué mi bisabuela, y en general, la gente con principios e ideales, acababa siempre huyendo de cualquier movimiento político. A nadie sin intereses personalistas le apetece pegarse con quienes los tienen, y menos cuando el resto mira pasivo lo que ocurre sin mover un dedo. España tendrá el movimiento político que se merece, y Podemos apunta a un neo-PSOE en toda regla. Tiempo al tiempo.

Snowball escape"Que sus jodaaaan"

Por mi parte, y sin la gran carga que tenía con Podemos (que ni me permitía tener un horario sano de sueño), he decidido centrarme en mi carrera profesional y dar un giro de 180%. Aún soy joven y tengo tiempo para cambiar a un sector donde de verdad sienta que aporto avances a la sociedad. Si a través de la política es inviable, al menos lo hare a través de mi profesión.

Me he matriculado en un Máster de Visión Artificial y aunque está resultando duro porque tras 5 años fuera de la universidad las matemáticas y la física se olvidan, está siendo, eso sí, muy gratificante. Por otra parte, esto de estudiar con el Plan Bolonia y trabajar al mismo tiempo es casi una leyenda urbana. En mi caso soy de esos seres mitológicos a los que les dan reducciones de jornada sin tocarme el salario para que pueda estudiar (si, soy la chica de la curva en formato estudiantil), y aún así me faltan horas de la semana para poder llevar las cosas al día.

La verdad es que me encanta trabajar en un campo más "ingenieril" y científico, que me suponga un reto mental y me obligue a estrujarme la cabeza. De nuevo vuelvo a ver determinados conceptos físicos que gobiernan nuestro día a día más claros. Estoy aprendiendo un montón de cosas que ni olí en la carrera, como los tratamientos de señales y ondas (me siento muy teleñeco ultimamente xD), que al fin y al cabo pueden darte una comprensión muy completa de nuestro mundo. Tu, yo, o la mesa de tu ordenador, somos al fin y al cabo ondas. Ya lo afirmó Broglie hace 100 años y los reafirmó Einstein con la teoría que le daría el Nóbel, el efecto fotoeléctrico. Me hace inmensamente feliz (llamadme friki) comprender esta realidad, una felicidad por aprender que desde que salí de mi carrera no había vuelto a sentir.

science-bitchAdemás, el hecho de poder seguir el método científico es maravilloso: te evita tener que estar discutiendo sobre pajaritos preñados. Los pajaritos son oviparos y así lo demuestra el método científico. Nada más que hablar. Gracias a esto, por ejemplo, jamás se le dará un premio Nobel de Medicina a un magufo de la homeopatía, por muy mainstream que sea. En otros campos, como el político, las cosas funcionan al revés de lo que la razón marca. En mi casa seguimos las leyes de la termodinámica. Allá otros si quieren discutir si la Tierra es plana o no.

Pero las cosas buenas tienen también su reverso tenebroso. La Visión Artificial es un campo tan nuevo y con tanto que desarrollar, que me resulta complicado saber hacia que rama tirar. Todas son útiles y todas aportan un montón a la sociedad. Eso sí, tengo claro que una vez lo acabe quiero trabajar en este área y dejar atrás mi carrera en el desarrollo software por muchos años que ya lleve. Si no puedo aquí, será en el extranjero, pero quiero que mi futuro pase por hacer un trabajo que de verdad me motive y me haga feliz.

Es curioso pero como suele pasarme con las cosas que me ilusionan mucho, ya estoy haciendo planes a largo plazo que aún ni se si podré cumplir. Como tengo una Ingeniería Técnica este Master me convalida solamente con una ingeniería superior según el Plan Bolonia, por lo que tendría que hacer otro máster para poder optar a un doctorado. No descarto cuando acabe este master apuntarme a la UNED en Inteligencia Artificial, e incluso irme fuera a hacer una tésis doctoral cuando tenga ambos. Como digo, son elucubraciones ya a muy largo plazo que dependen, para empezar, de que consiga sacar el Master que estoy ahora cursando xDDD

Así que no os sorprendáis si empiezo a tocar temas de Computer Vision y escribo más sobre informática y ciencia que sobre política, porque ahora es lo que me motiva y me hace feliz. Eso sí, no esperéis más actividad en el blog, porque con el cambio de aires tengo si cabe aún menos tiempo libre que antes xD No obstante, os prometo que seguiré con las pildoritas de POO. Al fin y al cabo es de lo que de verdad se, y tengo un compromiso con vosotros que llevo posponiendo demasiado tiempo con sueños y fantasías que el método científico me gritaba que eran eso, cosas inviables e imposibles de llevar a cabo con los parámetros y variables actuales. Si algún día la gente está a la altura, quizás vuelva a molestarme en intentar cambios por más vías que la profesional, pero sinceramente, y siguiendo de nuevo el método científico a través de los experimentos que la sociedad ha repetido en su historia, dudo mucho que eso ocurra.

Share