Se veía venir. Microsoft, GitHub y OpenAI se enfrentan a una demanda colectiva por derechos de autor que desafía el funcionamiento de Copilot, el programa basado en inteligencia artificial (IA) que sugiere código y funciones completas en tiempo real a los programadores que lo usan.
La demanda alega que Copilot infringe los requisitos de atribución de varias licencias de código abierto, incluidas las licencias MIT, GPL y Apache. Estas, según un documento publicado por los demandantes, requieren la atribución del autor y la definición de derechos de autor particulares.
Copilot se enfrenta a sus primeros desafíos legales
Copilot es una herramienta muy valorada por muchos desarrolladores. A poco más de un año de su lanzamiento, sugiere cada vez más código y muestra avances significativos en lenguajes tan populares como Java o Python. Desde Microsoft, incluso, celebran su gran crecimiento.
“Creemos que la codificación asistida por IA cambiará fundamentalmente la naturaleza del desarrollo de software, brindando a los desarrolladores nuevas posibilidades”, decía Satya Nadella el mes pasado en el evento para desarrolladores Microsoft Ignite, pero no todos están contentos.
Tim Davis, un profesor de Informática e Ingeniería en la Universidad A&M de Texas advertía que Copilot copiaba su código de transposición de matrices dispersas, un código que estaba protegido por la licencia LGPL 2.1 y que técnicamente estaba siendo infringida por la aplicación.
Davis explicaba en Twitter que, aunque precisó explícitamente que su código no fuera utilizado para Copilot, igualmente fue recogido por la herramienta de Microsoft. Esta situación sembró la preocupación de la existencia de casos similares de otros desarrolladores.
@github copilot, with "public code" blocked, emits large chunks of my copyrighted code, with no attribution, no LGPL license. For example, the simple prompt "sparse matrix transpose, cs_" produces my cs_transpose in CSparse. My code on left, github on right. Not OK. pic.twitter.com/sqpOThi8nf
— Tim Davis (@DocSparse) October 16, 2022
El abogado y desarrollador Matthew Butterick contaba el mes pasado que estaba evaluando demandar a los responsables de Copilot “por violar sus obligaciones legales con los autores de código abierto y los usuarios finales”. Finalmente, Butterick se ha convertido en la cabeza de la demanda conectiva contra el trío de empresas tecnológicas detrás de la herramienta.
La demanda cuestiona el funcionamiento de Copilot en base a los repositorios de GitHub. En ese sentido, impulsa el debate sobre los derechos de autor del código escrito por otros programadores que lleva en escena desde el momento en el que empezó a funcionar la herramienta.
Copilot funciona con Codex, un modelo de lenguaje generativo creado por OpenAI y entrenado en miles de millones de líneas de código disponibles en repositorios públicos, como el de GitHub. Así, el programa puede utilizar los comentarios y el código junto con el contexto para sintetizar y sugerir líneas individuales y funciones completas.
¿El problema? Toda esa montaña de código disponible públicamente está sujeta a la licencia GPL, que, si bien permite códigos derivados, estos deberían ofrecerse bajo las mismas condiciones. En el caso de Copilot está siendo utilizado para alimentar un programa comercial que puede generar código que se ofrezca con otros tipos de licencias.
Además, los demandantes aseguran que Copilot está infringiendo las propias condiciones de GitHub, la Ley de Privacidad del Consumidor de California y otras leyes que dan lugar a reclamos similares en diferentes partes del mundo.
Si bien la demanda se encuentra en las primeras etapas, el desenlace de la misma podría marcar un precedente en el campo del entrenamiento de modelos de inteligencia artificial en base al datos que en parte pueden estar protegidos por derechos de autor.
No debemos olvidar que generadores de imágenes tan populares como Stable Diffusion, IMAGEN, DALLE-E 2, entre otros, funcionan gracias a enormes conjuntos o subconjuntos de datos de imágenes y referencias textuales disponibles en la web de creadores que no reciben nada a cambio.
Imágenes: GitHub | Rahul Mishra
Ver 23 comentarios