El desarrollo de modelos de lenguaje fue creciendo y, sin darnos cuenta, aquello novedoso se incorporó de manera vertiginosa en nuestra cotidianeidad. Así, es que la inteligencia artificial forma parte de las conversaciones y prácticas en la esfera pública y privada, donde el impacto se expande a distintas esferas del trabajo, las artes, la docencia, la economía, el marketing, entre tantas más. Esta dimensión sociotécnica implica ser analizada y debatida, conocer qué debemos adoptar/aceptar de estas nuevas tecnologías y qué aspectos es posible limitar y considerar en nuestra interacción, sobre todo teniendo en cuenta el rol de las instituciones educativas y formadoras y la perspectiva crítica, propia de las Ciencias Sociales. Algoritmos, probabilidad, estadísticas, predicción, software y programación irrumpen en nuestra cotidianidad digital y al mismo tiempo son herramientas y tendencias para técnicas de investigación masiva y de mercado.
Para ello, una primera aproximación a esta temática es conocer experiencias de investigación vigentes en nuestra unidad académica. Desde la Secretaría de Investigación y Publicación Científica invitamos a dialogar a Anabella Abarzúa, quien dirige un proyecto de investigación que reflexiona sobre la huella digital que dejamos mediante el uso de smartphones y otros dispositivos electrónicos. El equipo de trabajo se enfoca en las implicaciones éticas y metodológicas del big data en las Ciencias Sociales, promoviendo la colaboración interdisciplinaria para comprender y gestionar estos datos de manera integral y responsable.
Anabella Abarzúa es Licenciada en Ciencia Política y Administración Pública (UNCuyo) y realizó el doctorado en Ciencias Sociales en la Universidad de Buenos Aires (UBA). Es investigadora asistente del CONICET en el Instituto de Ciencias Humanas, Sociales y Ambientales (INCIHUSA/CONICET) y se desempeña como Jefa de Trabajos Prácticos de Metodología para la Investigación en Ciencia Política (UNCuyo). Actualmente dirige, junto a la codirección de Beatriz Soria, el proyecto de investigación “Big data y Ciencias Sociales: un abordaje crítico para la innovación metodológica”, desarrollado en el marco de proyectos bienales de la Secretaría de Investigación, Internacionales y Posgrado (SIIP-UNCuyo).
¿Cómo surgió la idea de iniciar este proyecto de investigación sobre la huella digital y el big data en ciencias sociales?
Hace mucho tiempo venía con la curiosidad de que era el Big Data, desde 2017. ¿Qué es? ¿De qué se trata? Pospandemia y con el surgimiento del chat GPT para la docencia, hubo una ebullición muy grande de comentarios sobre la inteligencia artificial y ahí nos metimos un poco en la discusión de cómo afecta esto a las Ciencias Sociales. De a poco, fuimos armando lecturas y teniendo discusiones. Cuando llegó la convocatoria de los proyectos, pensamos presentarnos y sumar esta línea de investigación, que surge de la curiosidad y ante el contexto de transformación, para reflexionar desde nuestro lugar de cientistas sociales, cómo nos afecta y qué tenemos para decir sobre este fenómeno.
¿Qué objetivos se plantearon con este proyecto? ¿Qué les queda pendiente?
A grandes rasgos, se resume en la idea de abordar la relación big data-ciencias sociales sin ser conservadoras y sin caer tampoco en ideas vinculadas a la "magia de los datos". En términos más técnicos, sintetizar lecturas y generar una interpretación propia acerca de la cuestión del dato, sintetizar una agenda de investigación. En términos más analíticos, dar cuenta del debate y de la cuestión acerca de la construcción del dato. Y en términos del quehacer y lo pendiente, generar instancias de formación para nuestro equipo de investigación, para nosotras como investigadoras, y también espacios de formación en nuestros lugares de trabajo.
¿Cómo describirías el proceso de construcción del dato?
Hay muchos manuales de metodología para responder esto. Destacaría que es imprescindible que las técnicas y la propia construcción del dato estén al servicio del problema de investigación. Y que sin una perspectiva que alimente y sostenga el problema no se pueden construir datos significativos, es decir que generen conocimiento científico.
Dado el creciente debate sobre la privacidad y la protección de datos, ¿Cómo creen que deberían abordarse estas cuestiones en la formación académica de futuros investigadores en ciencias sociales?
El tema de la privacidad de los datos, si se toma desde el punto de vista jurídico, está el debate sobre si los datos son privados o no, porque yo en el momento que los publico adhiero a que se publiquen, se recolecten, se almacenen, se procesen, se analicen y se usen para generar productos. La definición de datos privados tradicional del derecho hace aguas en relación a estas nuevas formas de compartir datos y aparece la discusión sobre qué es un dato, qué es íntimo, qué es privado. Después, desde el punto de vista científico, muchas de estas investigaciones basadas en datos "no tradicionales" no siempre cuentan con los protocolos tradicionales que tenían las ciencias sociales. Por ejemplo, al responder una encuesta te piden permiso para obtener esos datos, te informan que los mismos van a ser publicados sólo de manera agregada, de acuerdo a la ley de secreto estadístico, o cuando haces una entrevista en profundidad tenés que pedir un consentimiento, pedirle a la persona que revise la desgravación o que revise los fragmentos que vos tomaste a ver si está de acuerdo en que se publiquen, hay todo un protocolo.
Aunque haya un protocolo en algunos casos, no siempre se cumplen ¿Aparece el debate ético?
Cuando tomamos datos masivos de internet, cuando obtenemos información de las páginas web a través de las líneas de código (scraping) o le pedimos a las personas que nos compartan sus perfiles de determinadas redes sociales, muchas veces no se tiene tan en cuenta o no existe ese protocolo de cuidar los datos y la privacidad. No es que los investigadores digan “no nos importa”, sino que es un campo nuevo que está en disputa y hay que ver cómo cuidamos esos datos y cómo los publicamos, cómo hacemos que las personas no puedan ser identificadas a partir de los datos que como comunidad científica publicamos. Para mí es todo un debate ético que se va a resolver también a medida que avancen este tipo de investigaciones. Otra cosa es lo que hacen las empresas privadas, que no tienen escrúpulos en acumular, procesar y señalarte a partir de tus datos, hasta que hagas clic y lo compres.
Dado que su equipo está compuesto por investigadoras de diversas disciplinas, ¿Cómo han logrado integrar perspectivas interdisciplinarias en el estudio de la huella digital?
El equipo está formado por sociólogas y politólogas. Además, también lo integra un estudiante de comunicación. En realidad, no es un diálogo tan extraño entre la ciencia política y la sociología, no es como si estuviéramos hablando con ingenieros o ingenieras. Sí hay una diferencia en las agendas de investigación disciplinares. La sociología se hace otras preguntas o tiene otras grandes tradiciones de problemática, de pensamiento, y la ciencia política, otras. En ciencia política se está discutiendo mucho la democracia, la gobernanza, datos abiertos para la gestión, toda la cuestión electoral y la interferencia de las grandes plataformas en los procesos eleccionarios. Y la sociología se pregunta más, quizás, por el modelo productivo que implica conocer cuál es el impacto social de estas tecnologías. Pero el diálogo es sencillo, somos ciencias sociales y es sencillo debatir entre nosotras. Lo importante es que compartimos la formación como investigadoras. Eso es clave.
¿Cómo han integrado la formación de estudiantes en este proyecto? ¿Cuál ha sido su rol en el desarrollo y ejecución de la investigación?
Lo más valioso que aportó Agustín, por ejemplo, fueron los debates que traía desde la materia Informática y Sociedad, desde ese lado de la formación y algunos debates acerca de las redes sociales. En algunas lecturas que estuvimos haciendo desde México, conocimos cómo los centros de estudios más innovadores en materia de medios o de comunicación social son los que empezaron un poco con el debate del paso de los mass media a las redes sociales.
¿Qué aporte tiene este proyecto en la formación académica de los estudiantes?
Uno de los propósitos y resultados fue la electiva que dictamos dos años seguidos. La materia buscaba tener una mirada amplia sobre este fenómeno. Por eso empezábamos con conceptos relacionados a la datificación de las sociedades, para luego abordar ejemplos empíricos de este fenómeno, y terminábamos con una breve introducción a las técnicas de las ciencias sociales computacionales. Nos parece importante que los estudiantes de grado tengan acceso a esta formación, ya que el mercado laboral les exige eso.
¿Qué autores recomendarían a otros investigadores interesados en abordar temas similares?
Hay un manual que se llama “Hipermétodos” del mexicano Rodríguez Cano, que es como un gran inventario de técnicas y de innovaciones que se fueron haciendo con el tiempo y toma los antecedentes desde el principio de los estudios de Internet, desde los '90, identificando cuatro grandes “paradigmas” para las ciencias sociales computacionales. Otra lectura interesante, para mí, es el “Atlas de la Inteligencia Artificial” de Kate Crawford. Ahí la autora se pregunta por el impacto social de la inteligencia artificial e intenta desmitificar la idea de que mi celular funciona a partir de la magia, que todo es virtual o está en la nube y no tiene materialidad. Entonces va trazando la materialidad de estas tecnologías y los enclaves de poder de ellas.
Después hay muchas charlas TED o también debates interesantes acerca del impacto de la inteligencia artificial o de estas tecnologías en los procesos electorales. Por ejemplo, hay una charla muy buena de una periodista llamada Carole Cadwallar en la que analiza la intervención de Facebook y de Cambridge Analytica en el proceso del Brexit. Hace toda una investigación periodística en terreno para la BBC, donde prueba la disonancia cognitiva que se da entre lo que las personas ven en internet, en redes, las cuestiones con las que nos bombardean permanentemente y su realidad empírica y cotidiana.
¿Cuál es el valor de nuestra facultad, teniendo en cuenta su perfil teórico/crítico, respecto al análisis de datos?
El plus que tenemos es la capacidad de interpretación, la capacidad analítica. Una formación técnica sin la capacidad de análisis que te da la formación teórica, es una cáscara. Estás a merced del gráfico que te largue el software, pero no vas a ser capaz de interpretar un patrón o de entender una secuencia histórica en esos datos. Me parece que el fuerte de la formación de la Facultad, aunque depende mucho de las carreras y de la orientación de cada, es esa capacidad analítica, de interpretación que te da la formación teórica. Tener marcos teóricos, tener una perspectiva teórica formada para interpretar, es muy valioso.
¿Qué problemáticas han identificado al trabajar con estos datos masivos en el contexto académico?
Hablamos de big data o de trabajar con big data y no tenemos capacidad de guardar datos, de almacenarlos. Si querés dar un curso del programa de análisis estadístico R, tenés que pedir la sala informática, que a veces no alcanza para todos. Esas han sido algunas de las dificultades, que por ahí con mayor financiamiento podamos lograr mejorar.