La protección jurídica de los modelos de datos utilizados en el proceso de aprendizaje de las inteligencias artificiales generativas (IAG)

En este artículo vamos a definir qué son los modelos de datos utilizados en el aprendizaje profundo, también conocido como deep learning, de los sistemas de inteligencia artificial generativa (IAG) y si existe la posibilidad de protegerlos a través de las distintas figuras que establece la legislación vigente aplicable.

Primero de todo debemos saber que la inteligencia artificial generativa (IAG) es aquella que se enfoca en la generación de contenido y predicciones a partir del análisis de datos existentes. Para esto se fundamentan en la creación y utilización de redes neuronales generativas, las cuales se basan en el aprendizaje profundo o deep learning para extraer patrones, correlaciones, modelos de regresión, etc de los datos disponibles de manera automática.

Ahora bien, en el caso que nos ocupa, a modo de símil podríamos decir que el modelo de datos es el “cerebro” de una AIG. La función de un modelo de datos es definir cómo se estructuran, almacenan, condicionan, definen y relacionan todos los datos ingeridos por la inteligencia artificial.

Como ya hemos comentado el deep learning se basa en la ingesta, procesamiento e interpretación de una gran cantidad de datos. Para hacernos una idea, la inteligencia artificial generativa ChatGPT cuenta con un conjunto masivo de datos formado por más de 45 TB de información. Una inteligencia artificial utiliza toda esta cantidad de datos para identificar variables, patrones y correlaciones para, a través de un proceso de aprendizaje, poder generar de manera automática cualquier contenido, realizar predicciones, modelos de regresión y clasificar variables. Cuanto mayor sea la cantidad y calidad de los datos de los que disponga la inteligencia artificial mejor será su entrenamiento y proceso de aprendizaje por lo que mejores serán los resultados que arroje.

Teniendo esto en cuenta, es de vital importancia que todos los datos que ingiere masivamente una IA estén perfectamente definidos, estructurados y relacionados, de esta misión se encarga el modelo de datos, el “cerebro”. Es por esto que el modelo de datos es un aspecto fundamental de una IA y puede ser el elemento diferencial que permita que una IA triunfe o no.

Teniendo en cuenta la importancia del modelo de datos ¿existe algún mecanismo para proteger nuestro modelo de datos en la regulación actual?

Propiedad intelectual – derechos de autor

Como ya sabemos, desde 1996 la Directiva sobre la protección jurídica de las bases de datos permite proteger la estructura de las bases de datos por medio de derechos de autor de propiedad intelectual. Para que una base de datos pueda gozar de esta protección se exige que la base de datos a proteger sea una creación intelectual en la que su estructura revista de un carácter original, es decir, que se base en criterios de ordenación de datos, almacenamiento, selección, etc. diferentes respecto al resto de bases de datos existentes.

¿Podría entonces gozar un modelo de datos de protección mediante derechos de autor? 

Para poder gozar de esa protección debemos analizar si un modelo de datos podría equipararse técnicamente a una base de datos. Para ello partimos de la definición de base de datos efectuada en el artículo 12.2 de la Ley de Propiedad Intelectual:

“2. A efectos de la presente Ley, y sin perjuicio de lo dispuesto en el apartado anterior, se consideran bases de datos las colecciones de obras, de datos, o de otros elementos independientes dispuestos de manera sistemática o metódica y accesibles individualmente por medios electrónicos o de otra forma”

En este sentido debemos tener en cuenta que un modelo de datos no se enmarcaría en dicha definición ya que no almacena la información recogida y utilizada para entrenar a la IA. El modelo de datos genera una serie de información abstracta, consistente en un conjunto de parámetros, patrones, relaciones, etc.,  elaborada a partir de la información ingerida. Teniendo en esto en cuenta no podrían los modelos de datos gozar de esta protección.

Adicionalmente, la ley vigente permite la protección conforme a derecho sui generis del contenido de las bases de datos. Esta protección tiene la finalidad de proteger el esfuerzo que ha realizado el inversor en la confección de la base de datos. En lo que respecta a nuestro caso, esta protección podría tener cabida únicamente para todas aquellas agrupaciones de datos utilizadas para entrenar a la IA, ya que ha sido necesario una inversión considerable de medios económicos, materiales y humanos para la obtención y compilación de todos los datos. 

Patentes

Aunque no existe ningún pronunciamiento concreto acerca de la posibilidad de patentar un modelo de datos, procedemos a analizar si cumple con todos los requisitos exigidos por la Ley de Patentes. Para poder ser objeto de patente debe cumplir con los siguientes tres requisitos:

  1. Novedad: se considera novedosa aquella invención cuyo funcionamiento técnico no haya sido divulgado o sea accesible al público mediante descripción escrita u oral, por utilización o por cualquier otro medio, con anterioridad a la presentación de solicitud de patente. En este sentido un modelo de datos si puede ser susceptible de ser considerado novedoso.
  1. Actividad inventiva: En el artículo 4.1 se excluye expresamente de la categoría de invento los métododos matemáticos. Como explicamos al inicio el deep learning se basa en las redes neuronales generativas para poder llevar a cabo el aprendizaje automático, estas redes neuronales siguen por definición métodos matemáticos y estadísticos que permiten interpretar los datos y realizar predicciones mediante modelos de regresión. Teniendo esto en cuenta, no sería patentable un modelo de datos al considerarse un método matemático de organización, almacenamiento y procesamiento de datos.
  1. Aplicabilidad industrial: Consiste en la posibilidad de ser producido o utilizado en cualquier rama de la actividad económica. En nuestro caso un modelo de datos en sí mismo no tiene una aplicación concreta que resuelva un problema técnico por lo que no cumpliría tampoco con este requisito.

Teniendo todo esto en cuenta un modelo de datos no puede ser patentado en su forma pura pero si este modelo de datos formase parte de una solución técnica más amplia si podría ser patentado siempre y cuando dicha solución sea novedosa, una actividad inventiva y tenga un aplicación concreta que resuelva un problema concreto.

 Secreto empresarial

Tal y como contamos hace tiempo en este artículo de nuestro blog, la aprobación de la Directiva (UE) 2016/943 y su correspondiente transposición en España a través de la Ley de Secretos Empresariales abría una nueva vía a los desarrolladores y empresas para la protección de sus softwares, incluyendo los propios códigos.

Esta Ley de Secretos Empresariales define como susceptible de protección como secreto empresarial a cualquier información o conocimiento tecnológico, en nuestro caso, que cumpla con los siguientes requisitos:

  1. Ser secreto
  2. Tener valor empresarial precisamente por ser secreto 
  3. Haber sido objeto de medidas razonables para mantenerlo en secreto

En el caso de la protección de un modelo de datos, este es secreto y tiene valor precisamente por este hecho, ya que si no fuese secreto podría ser utilizado por distintas inteligencias artificiales y por ello perdería su valor, ya que este se debe a su exclusividad. En relación al tercer requisito, la ley no define qué debemos entender por “medidas razonables” pero dentro de este término podríamos enmarcar distintas medidas a adoptar encaminadas a mantener el modelo de datos en secreto. Estas medidas pueden ser por ejemplo la limitación del acceso a dicho modelo a aquellas personas que verdaderamente necesiten trabajar en su desarrollo, implementar medidas de seguridad técnicas que dificulten la averiguación o la realización de actividades de ingeniería inversa y, por supuesto, firmar acuerdos de confidencialidad tanto con empleados y colaboradores como con personas externas al proyecto que tengan acceso a dicho modelo.

Esta protección tiene ciertas ventajas como por ejemplo la no exigencia de un procedimiento de registro o su duración indefinida, siendo el único requisito para la aplicación de esta protección que el modelo de datos se mantenga en secreto y se adopten medidas razonables para evitar que sea revelado a terceros.

Conclusión

Como hemos podido observar, el modelo de datos de una IA es sin duda uno de sus componentes técnicos más importante y su calidad depende de lo bien desarrollado y programado que se encuentre. Al ser esta una tecnología muy novedosa no se encuentra regulada ni protegida por ninguna de las leyes aplicables en vigor y esta situación se traduce en una total inseguridad jurídica y por consiguiente desincentiva la investigación y ralentiza el avance en el desarrollo e implementación de mejores modelos de datos por miedo a posibles robos o copias. En lo que concierne a la Unión Europea sería el momento de valorar el beneficio de otorgar a los desarrolladores y empresas más mecanismos de protección de sus modelos de datos, al ser estos una pieza fundamental en el aprendizaje de las inteligencias artificiales y su consiguiente éxito. En lo que se refiere a la situación actual, las empresas y desarrolladores deben ser muy cautelosos con las medidas que toman para mantener su modelo de datos en secreto ya que una vez revelados perderían la única protección de la que gozan en base a la Ley de Secretos Comerciales.

Artículo de Ignacio Muñoz Casquero, Senior Legal Counsel, Legal Army

Read more

Related posts that might interest you

All our news