8
Pantallazos

¿Ficción o realidad? El pensamiento datero y la política de datos

¿Ficción o realidad? El pensamiento datero y la política de datos
Foto: Banco Mundial LAC en Flickr | Victor Idrogo - Banco Mundial

Están con nosotros, son la estela de nuestras interacciones cotidianas. Planes de datos que se esfuman con cada video llamada, números epidemiológicos apremiantes, datos de encuestas de opinión, la ‘pepa’ del periodista, datos de millones de especímenes en el laboratorio, datos ambientales controversiales, bases que se resisten a ser interoperables, datos que alimentan los estudios de mercado, datos personales que la ley busca proteger, algoritmos creados para analizar mesas electorales, datos que no se pueden cambiar en el DNI por prejuicios de género, los datos que aceptas entregar al hacer clic en una página web.

A cada paso que damos dejamos rastros digitales, y muchas decisiones, como leer este artículo, las tomamos siguiendo los rastros que otros dejan. Empero, por razón de su ubicuidad y su cantidad ingente, los datos se nos han alienado, se han convertido en algo exterior a nosotros, como si no participáramos masivamente en el proceso mismo de su producción.

Quizá por eso, desde hace algún tiempo, los “grandes datos”, y la automatización de procesos que habilitan, han comenzado a generar aprensión pública. Sobre todo, por las implicancias éticas del uso de datos personales con fines comerciales y de disciplinamiento. Una aprensión que, como ha notado J. Wajcman, llega a alcanzar un tono catastrófico.1

Sin embargo, cuando racionalizamos esta aprensión, quedamos atrapados en un callejón sin salida: los datos son una ficción, una mera construcción social, resultado de sesgos o intereses que cargan sus portavoces o son un reflejo objetivo de la realidad, su representación más directa. O cero o uno; un binarismo que a cualquier programador informático le parecería inquietante. Antes que en un dilema informático, estamos atrapados en uno epistemológico, aquél de si es posible decir algo verdadero (entiéndase, indiscutible) sobre el mundo que nos rodea. El problema con esta manera de plantear el tema es que lo vuelve un mero ejercicio intelectual sobre la relación entre los datos y la mente: o los datos están sobredeterminados por la mente o la mente está infra-determinada por los datos. Esta manera de ver las cosas deja de lado, a posta, su dimensión pública, que T. Kuhn se esforzó en recuperar introduciendo la noción de “paradigma” a comienzos de la década de 1960. Si priorizamos esta dimensión, la pregunta más útil sería ¿con qué vocabulario cuenta una comunidad equis para conversar sobre las consecuencias políticas y económicas del ingente flujo de datos que produce cotidianamente? Una formulación del tipo nos podría ayudar a pasar de la aprensión al compromiso con un asunto de interés.

La idea principal que quiero proponer es que, si evitamos la distinción entre ficción y realidad a la hora de evaluar el flujo de datos, entonces podremos enfocar la discusión sobre el modo en que los datos mismos son producidos: desde su recolección hasta su comunicación. Un cambio de enfoque así, requiere de una definición digamos más política de la producción de datos, o sea, una que vea esta producción como una forma, bastante práctica de hecho, como algunas personas participan en la organización de la vida colectiva. La premisa que está detrás de este argumento es que hoy en día producir datos (a pequeña o gran escala) es un medio para ejercer poder sobre el orden social, aunque el modo como esos medios operan no son siempre conocidos. El desafío es empezar a conocerlos.

Por fortuna, una propuesta como ésta conecta con una cultura de datos que está ya arraigada en nuestro país. Me refiero a la figura del “datero”, la cual nos da las claves para entender un tipo de sistemas de información que podemos denominar ingenioso, en el sentido atribuido por G. Nugent.2

Gracias al datero sabemos que los datos:

(1) son algo que debe ser producido por personas de carne y hueso, en lugares específicos, con la ayuda de artefactos diferentes (los más simples: lápiz, papel, cronómetro);

(2) nunca se comunican en bruto, sino usando una jerga particular que, si bien es entendida por los involucrados, permanece cerrada para el resto del auditorio;

(3) evolucionan rápido (desde su registro hasta la toma de decisiones), y que su velocidad significa oportunidad;

(4) están sujetos a una crítica socio-técnica: la confianza en el informante y la calidad de lo informado se evalúan conjuntamente;

(5) configuran un servicio por sí mismo que tiene un valor monetario, el cual se concreta en el momento de la transacción;

(6) participan de un orden socio-económico más grande, conocido como la “guerra del centavo”,3 una expresión elocuente de la precariedad del transporte urbano en Lima.

Saber todo esto no es para nada poco. De hecho, este conocimiento no dista demasiado del legado intelectual que los estudios de la ciencia y tecnología y, en particular, la sociología de las redes de información, han buscado sintetizar por décadas.4 Una crítica a este planteamiento, sin embargo, podría señalar la limitación del ingenio para servir como base de la comprensión de procesos de innovación más complejos y que se desenvuelven a escala multinacional o global. Por ejemplo, aquellos que producen “grandes datos”, que automatizan procesos productivos industriales y de servicios, que logran empujar las fronteras tecnológicas haciendo máquinas “más inteligentes”, y que dirigen, en suma, toda la transformación digital que la economía mundial está experimentando en la actualidad.

Cierto que es posible trazar algunas diferencias entre el ingenio y la innovación, en especial en lo tocante al horizonte temporal. El ingenio se experimenta como una serie de horizontes de corto plazo (v.gr: la transitoriedad de un “por mientras” constante); en cambio, la innovación se experimenta como un conjunto de escenarios, abiertos y múltiples, con pretensiones de solidez (v.gr: la incertidumbre del entorno que se transforma en riesgos controlables). Sin embargo, antes que agudizar esta separación, lo más urgente es pensar en más y mejores articulaciones. Es decir, reconocer rutas de innovación legítimas en las trayectorias, recursos y aprendizajes del ingenio.5

Esto en la práctica significa aceptar que, para existir, los grandes datos requieren también de un número grande de dateros que, a este punto, serían mejor representados como una red de máquinas y personas encargada de su producción. De hecho esta es la premisa que comparten quienes estudian la “política de los datos”.

Este es el caso de Neilson y Rossiter (2019) quienes sostienen que, para desarrollar la automatización, la inteligencia artificial y el machine learning, se requiere datos, muchos datos. Y que esos datos no están allí en el subsuelo esperando ser capturados sin más, como la metáfora extractivista de la “minería de datos” sugeriría; requieren trabajo, muchas veces trabajo menudo. Y no sólo el trabajo de ingenieros informáticos y de analistas, sino sobre todo del conjunto de personas que en su vida cotidiana dejan rastros digitales.

De hecho, cuando se habla del poder de los grandes datos no se piensa en una empresa como Amazon que registra todos mis movimientos (que sí lo hace), porque le interese particularmente, sino porque, al acceder a datos de miles de millones de personas como tú o yo, es capaz de generar patrones de comportamiento en el mercado y hacer que sus sistemas de información sean capaces de predecir lo que un individuo hará. En este sentido, lo que hace de los grandes datos un activo para el capitalismo digital no es la suma de datos individuales, sino lo que emerge del conjunto.

Contrariamente a lo que pensarían los sociólogos clásicos, la sociedad no es algo que está por encima del individuo, sino que, más cerca de la visión de Gabriel Tarde, la sociedad es una asociación de mónadas individuales, que se imitan y diferencian entre sí sin parar. Para Amazon, que recolecta datos sin parar también, parte del trabajo sociológico de asociación se lo hacemos nosotros.

Ahora bien, que requieran trabajo implica que los grandes datos, así como los pequeños, nunca están completamente crudos. Es más, no deben estarlo si quieren ser de utilidad. Tanto el datero, el estadístico, y el analista de grandes datos saben lo mismo: que la frase “esto es lo que dicen los datos”, de suyo, es una frase vacía, cliché. Los datos deben ser preparados, de lo contrario no dirán nada. Sin corte, sin clasificación, sin comparación, no hay análisis. Lo importante para nosotros, entonces, es conocer sus diferentes grados de cocción y todo el conglomerado de personas, técnicas e instituciones que intervienen. De hecho, ésta es la piedra angular del estudio de la política de datos.

Una consecuencia de esto es que nos obliga a revisar el sentido negativo que solemos atribuir a la “cocina de los datos”. Decir que una organización ha cocinado los datos de una encuesta electoral es lo mismo que acusarla de falsedad. Y claro que hay intereses económicos suficientemente fuertes como para cambiar datos políticamente relevantes. Pero, en realidad esto no es cocinar los datos. Es, a todas luces, falsificarlos. Cualquier daño a la fe pública merece castigo.

De ahí que, no podamos concordar con quienes se empeñan en decir que “los datos son los datos” o “los hechos son los hechos”. La flojera intelectual, si bien no merece castigo, sí es un demérito. No podemos concordar, porque el trabajo cotidiano de técnicos y científicos enseña que un dato es, ante todo, un logro: el fin de una larga cadena, cuya articulación, siempre frágil, es la que ata el mundo exterior con el laboratorio. Y lo mismo pasa con los hechos: un hecho siempre tiene que ser hecho (esto es, fabricado), minuciosamente, ante la mirada atenta de colegas, financistas y críticos.

Visto desde esta óptica, devolver a la cocina de los datos el valor creativo que la palabra “cocina” tiene en la cultura gastronómica bien podría ser una manera de no hacer más concesiones a los trucos de la epistemología ni a los clichés de los analistas de datos que presentan suculentos algoritmos sin dejar ver su cocina.

Finalmente, una vez que hemos restablecido el valor de los datos como una forma de participar del orden social, o lo que es lo mismo, como una forma de ejercer poder, podemos empezar a preguntarnos cosas más interesantes. ¿El patrimonio de datos generado en la vida cotidiana debería ser considerado público o privado? ¿Sobre qué regímenes de propiedad de datos se están levantando los procesos de automatización que transformarán la industria? ¿En qué se diferencia la producción de datos realizada en un centro de investigación científico, en una agencia de marketing, en un departamento de I+D, y en un living lab? ¿Una economía de datos está mejorando la calidad del trabajo? En mi opinión estas cuestiones nos alejan del miedo que genera la alienación de los datos y, en cambio, nos comprometen activamente con el proceso de su producción y sus efectos sobre las cosas de interés público.

Footnotes

  1. Cf. Wajcman, J. (2017). Automation: is it really different this time?

  2. Para una recensión crítica del último libro de G. Nugent, La desigualdad es una bandera de papel, ver: La vindicación del ingenio de Guillermo Nugent en Revista Quehacer Nº7

  3. Bielich, C. (2009). El transporte público limeño y la guerra del centavo. En: Argumentos. Revista de análisis y crítica, 2, mayo

  4. Para una introducción a este tema, ver: Yrivarren, J. (2019). Una sociología de los sistemas de información científica. Sobre la adopción de repositorios de acceso abierto en el Perú. En: Revista Nombres, 5(1), 161-186

  5. Yrivarren, J. (2015). Ingenio e innovación. Los atrapanieblas como objetos-fluidos. Revista de Sociología, 25, 129-145.

siguiente artículo

Sobre la gestión de la emergencia sanitaria por Covid-19 en Perú