Inteligencia Artificial y Derechos de Autor
Primero, una aclaración: En este artículo usaré “inteligencia artificial” e “IA” para referirme a determinados algoritmos de aprendizaje automático en el sentido utilizado hoy en día. Sin embargo, personalmente no creo que la palabra IA sea apropiada para estos algoritmos. Preferiría utilizar términos más específicos. Sin embargo, en aras de la legibilidad, continuaré usando los términos en esta publicación.
En los últimos dos años se ha producido un enorme aumento e interés en el uso de la inteligencia artificial, especialmente en el contexto de algoritmos de aprendizaje automático, como modelos de lenguaje de gran tamaño (LLM) y algoritmos generativos. Hemos cubierto estos tipos de algoritmos en artículos anteriores de este blog. Lo interesante de ellos es que debido a la cantidad de datos que han podido recopilar, pueden generar datos en una gran cantidad de contextos. Esto incluye el código fuente. En este artículo me gustaría hablar sobre algunas implicaciones para los derechos de autor cuando se utiliza material generado.
En el mundo del software libre y el código abierto, es común recibir aportes de código de una serie de contribuyentes. A menudo la relación con estos contribuyentes es laxa, aunque algunas organizaciones utilizan contratos o acuerdos para gestionar estos aportes. Pero en muchos casos, no está claro quién escribió el código que en realidad fue contribuido.
En las empresas que producen software o servicios propietarios, esto funciona de manera diferente. Por lo general, los empleadores incluirán lenguaje en los contratos de trabajo que garantiza que los derechos sobre el código escrito por un empleado pertenecen a la empresa u organización.
Pero, ¿qué tiene que ver todo esto con el contenido generado por IA y, específicamente, con el código fuente? Algo en lo que la mayoría de los programadores realmente no piensan es que los derechos de autor son fundamentales para la forma en que gestionamos los derechos legales del código fuente. La totalidad del movimiento de código abierto y software libre se basa en la idea de licencias, como la licencia BSD o la GPL. Estas especifican lo que otras personas pueden y no pueden hacer con el código fuente. En un entorno propietario, la licencia se utiliza para restringir el acceso al código fuente, por ejemplo para que no pueda distribuirse legalmente. Por supuesto, esto también significa que un incumplimiento puede dar lugar a demandas.
La conexión entre derechos de autor y licencia es bastante sencilla. La persona que posee los derechos de autor de algo puede ceder los derechos legales sobre cómo se utilizará. En otras palabras, la licencia. Entonces, no importa si estamos hablando de una empresa privada o un proyecto de Software Libre, la licencia la asigna la persona que tiene los derechos de autor del código fuente. En la práctica, esto a menudo se hace implícitamente, por ejemplo enviando código que se incorpora a un proyecto con una licencia específica. Pero la cesión de licencia sigue ahí. Esto es algo que se vuelve más visible si un proyecto quiere cambiar su licencia. Esto implica ponerse en contacto con todos los contribuyentes de ese proyecto para asegurarse de tener permiso para cambiar la licencia. En un entorno privado, esto resulta más fácil, ya que el contrato de trabajo suele dar a la empresa plenos derechos para cambiar de licencia cuando lo desee.
Entonces, ¿cómo se conecta esto con los algoritmos de IA? Simplemente así: El contenido generado por un algoritmo no tiene derechos de autor. Dado que el algoritmo no se considera un creador humano, nada de lo generado por él puede tener derechos de autor, nadie lo puede reclamar. Entonces, incluso si tú escribiste el prompt para generar código fuente u otro material, eso no te otorga derechos de autor. En la práctica, el contenido generado no tiene derechos de autor.
La implicación de ésto es sólo un paso. Dado que el contenido generado por IA no tiene derechos de autor, tampoco puede tener licencia. Sin embargo, no está claro qué derechos de distribución y uso se aplican a este tipo de contenido si no tiene ninguna licencia. Algunos observadores han planteado que no tener licencia es lo mismo que ser de dominio público, lo que significa que cualquiera puede hacer cualquier cosa con este tipo de contenido. Pero otros consideran que el dominio público también es un tipo de licencia, y por esa razón, la perspectiva es que no se puede hacer ninguna cosa con el contenido, ya que no tienes ninguna licencia que te otorgue derechos para usarlo. No importa en qué dirección se vaya, se vuelve problemático.
Por esta razón, dudaría mucho en aceptar contribuciones de código realizadas con IA. Si es para un proyecto de código abierto, significaría que partes del código fuente deben tener una licencia diferente (o más específicamente, no tenerla). Licenciar el aporte bajo la licencia del proyecto no es correcto y podría traer consigo dudas legales. Por supuesto, si una persona contribuye con código generado por IA con falsos pretensiones, diciendo que es código escrito por él/ellx, pueden conducir a otro tipo de problemas.
En el contexto de una empresa privada, el departamento jurídico debe tener mucho cuidado con estas situaciones, ya que podría invalidar, potencialmente, las licencias propietarias si los empleados usan código generado por IA mezclado con código propietario.
No importa cómo se vea esto, es un problema grave y los gerentes de proyectos deben tener cuidado para evitar problemas legales en estas situaciones. Hasta que la situación se aclare, mi perspectiva es que es demasiado arriesgado utilizar código fuente generado por IA.