Selecciona Edición
Conéctate
Selecciona Edición
Tamaño letra
ANÁLISIS

La sintaxis de los datos

Con el Big Data pasamos de la “web semántica” a la “web sintáctica”

La sintaxis de los datos Ampliar foto

Hace tiempo me regalaron un juego de imanes para la nevera que consistía en una caja de 510 imanes, con una palabra cada uno, para poder combinarlos y formar frases y mensajes en la puerta del frigorífico. La verdad es que, después de unas primeras pruebas, el juego quedó abandonado, porque se tardaba mucho tiempo en encontrar la palabra deseada para construir el mensaje que uno quería.

Una forma de simplificar y acelerar el proceso de búsqueda hubiera sido meter en diferentes cajas o bolsas de plástico las diferentes categorías de palabras-imanes: artículos, nombres, adjetivos, verbos, adverbios, preposiciones, conjunciones, etc. Pero, aun así, está claro que el proceso de búsqueda física de palabras es mucho más lento que el proceso mental… o que un proceso digital.

Quizá por eso, había quien renunciaba a hacer frases elaboradas con esos imanes y los usaba simplemente para hacer la lista de la compra en la puerta de la nevera, utilizando tan solo aquellas palabras (nombres) de los productos que solía comprar y colocándolos en dos grupos o columnas, a izquierda o derecha, según hubiera “reservas” en la nevera o hubiera que comprarlos.

Little Data, Big Data e Inteligencia Artificial

Los datos son las palabras sueltas y representan la unidad básica de información. Las oraciones se construyen a partir de la unión (coherente) de varias palabras y es así como pasamos de una información básica a una información más completa (conocimiento) sobre algo o sobre alguien, al establecer distintas relaciones entre esas palabras o datos, que no están como “lanzadas al aire” o yuxtapuestas.

El Big Data ha aumentado la posibilidad de tratar grandes volúmenes de datos y establecer más relaciones entre ellos

Algo parecido pasa con el tratamiento informático de los datos. Las Bases de Datos que conocíamos y usábamos hasta ahora cabían en una hoja Excel (“Little Data”) y se ordenaban en registros (horizontales) y campos (verticales), con una relación entre ellos de mera yuxtaposición. Si imprimiéramos la hoja Excel y cogiéramos una tijera y cortáramos por las líneas, tendríamos algo parecido al juego de imanes.

El Big Data ha aumentado la posibilidad de tratar grandes volúmenes de datos y establecer más relaciones entre ellos (o correlaciones) y, aunque sin duda supone un gran paso en el tratamiento de la información, obteniendo “datos enriquecidos”, sin embargo, seguimos en la fase de “balbuceo” de los niños, cuando empiezan a hablar y lo hacen solo con palabras sueltas: papá, mamá, agua, mío, no,…

La Inteligencia Artificial permite, entre otras cosas, procesar, entender (“intelligere”) y elaborar información en lenguaje natural. Es decir, poder pasar de comunicarnos, como los niños o como los apaches, con palabras sueltas, a hacerlo con oraciones elaboradas, en las que, al valor semántico y morfológico de cada palabra se le añade su valor sintáctico (el lugar que ocupa en la oración).

Hemos pasado de una “web semántica” a una “web sintáctica”, en la que al significado se le añade más información

Así es como estamos pasando, poco a poco, casi sin darnos cuenta, en un salto de una relevancia que quizá todavía no se aprecia ni se valora suficientemente, de la “web semántica”, en la que lo importante era el significado de las palabras, en sí mismas y en su contexto, a la “web sintáctica”, en la que al significado se le añade más información, derivada de la posición y la función de la palabra en una oración.

Aplicaciones prácticas y consecuencias jurídicas

Si, en vez de o aparte de categorías morfológicas o semánticas, usamos categorías sintácticas para el tratamiento y análisis de datos, convendremos en que no tiene ni ofrece el mismo valor informativo un “atributo”, en las oraciones copulativas, que un “complemento” (directo, indirecto o circunstancial), en las oraciones predicativas o un complemento del nombre, en cualquier tipo de oración.

Un atributo tiene una relación muy intensa con el sujeto, definiendo o identificando lo que una persona “es” o cómo “está”, mientras que lo que se “predica” de alguien (complementos del verbo) tiene una relación menos intensa con el sujeto; aporta información complementaria. Por ejemplo, no es lo mismo decir: “Juan es español” (atributo), que decir: “Juan está en España” (complemento circunstancial de lugar).

Del mismo modo, como el Derecho debe responder y aplicarse a la realidad de las cosas, no deben tener la misma “intensidad de protección” los datos que afectan al ser o a la identidad de alguien (y a su honor, intimidad y propia imagen), que otros datos que son meramente complementarios o circunstanciales. De hecho, siempre se han distinguido datos personales especialmente protegidos, por su naturaleza, pero también podría tenerse en cuenta la intensidad de la relación con el sujeto.

¿Portabilidad o cancelación?

Otra consecuencia jurídica tiene que ver con la sempiterna pregunta ¿de quién son los datos? Porque hay datos que los ciudadanos aportan (rellenando un formulario) y hay datos que las empresas elaboran, aplicando sus algoritmos sobre esos datos. ¿De quién son los datos?: ¿de quien los aporta o de quien los trabaja?, ¿del sujeto “afectado”, o de la empresa que ha invertido recursos en elaborarlos?

Como decía en un artículo anterior, una cosa es ser el “propietario” de los datos y otra, ser un “afectado” o interesado, como en el caso de las fotografías. Los datos que aportan los clientes son como los alimentos crudos del mercado o la materia prima con la que un chef prepara un plato, pero el producto elaborado y la receta con la que se ha hecho (el algoritmo) parecen, más bien, que son del chef.

El Reglamento europeo de Protección de Datos reconoce un nuevo derecho de los ciudadanos a la portabilidad de “sus” datos (artículo 20). Pero se refiere solo a los datos “que haya facilitado a un responsable del tratamiento”. ¿Qué pasa con los datos que la empresa ha elaborado a partir de aquellos?, ¿se los debe entregar?, ¿o sólo los debe cancelar, si así se lo pide el afectado o interesado por esos datos?

¿Qué pasa con los datos que la empresa ha elaborado? ¿Los debe cancelar, si lo pide el interesado?

Mi opinión es que la empresa no tiene que entregar al cliente que quiere marcharse a otra empresa los datos elaborados por ella, sino solo los facilitados en su momento por el cliente (los alimentos crudos o la materia prima), porque lo contrario sería facilitar a la competencia (por ingeniería inversa), el conocimiento de los algoritmos utilizados, que constituyen un activo estratégico de cada empresa, como son las recetas de un chef.

Eso sí, creo que, si un cliente quiere marcharse de una empresa y llevarse sus datos, tiene derecho a que la empresa cancele todos los datos que ha elaborado a partir de los que él ha facilitado, tanto a través de los formularios como de la tecnología que la empresa ha puesto a su disposición, para prestarle sus servicios (por ejemplo, los datos que los bancos o aseguradoras recopilan a través de sus tarjetas). 

Borja Adsuara es profesor, abogado, consultor y experto en derecho y estrategia digital.

Más información