
Midjourney acusada de usar 30% de datos protegidos por copyright
Especialista en LLMs, AI Agents e Infraestructura de IA

Especialista en LLMs, AI Agents e Infraestructura de IA
Warner Bros., Disney y Universal acusan a Midjourney de usar contenido protegido por derechos de autor en el entrenamiento de sus modelos de IA. Este caso podría establecer precedentes legales que impacten la recolección de datos en la inteligencia artificial.
Warner Bros., Disney y Universal han presentado demandas contra Midjourney, una startup de inteligencia artificial conocida por su modelo de generación de imágenes, alegando el uso indebido de contenido protegido por derechos de autor. Según las acusaciones, la empresa habría empleado imágenes de personajes icónicos como Batman, Superman y la Mujer Maravilla para entrenar su modelo sin obtener los permisos necesarios. Este caso pone en el centro del debate el equilibrio entre la innovación tecnológica y la protección de la propiedad intelectual.
Los estudios de Hollywood alegan que Midjourney utilizó contenido protegido por copyright en el proceso de entrenamiento de su modelo de inteligencia artificial. Según las demandas, se estima que cerca del 30% de los datos empleados por Midjourney podrían estar protegidos por derechos de autor, lo que constituiría una infracción legal si se confirma.
Este caso guarda similitudes con la disputa legal entre Getty Images y Stability AI, en la cual también se cuestionó el uso de contenido protegido para entrenar modelos de IA generativa. Si las acusaciones resultan ciertas, Midjourney podría enfrentarse a multas multimillonarias y verse obligada a modificar su modelo de negocio para cumplir con las leyes de propiedad intelectual.
El resultado de este caso podría tener consecuencias de largo alcance en la forma en que las empresas desarrollan y entrenan modelos de inteligencia artificial. Algunas de las posibles implicaciones incluyen:
La presentación de las demandas ha polarizado a la comunidad tecnológica y a los expertos en derechos de autor. Mientras algunos ven estas acciones legales como una manera de proteger a los creadores de contenido, otros advierten que podrían frenar la innovación al encarecer el desarrollo de tecnologías de IA.
Frente a este panorama, varias empresas han comenzado a tomar medidas preventivas, como:
No obstante, estas estrategias suponen un costo elevado, lo que podría limitar la capacidad de las startups para competir con grandes empresas tecnológicas.
Los próximos pasos en este caso serán decisivos para el desarrollo de la industria de la inteligencia artificial:
Acusan a la empresa de usar contenido protegido por derechos de autor, como personajes icónicos, en el entrenamiento de sus modelos de inteligencia artificial sin obtener permisos.
Podría establecer precedentes legales que obliguen a las empresas a usar datos con licencia, lo que aumentaría los costos y dificultaría la entrada de nuevas startups.
Los datos sintéticos son conjuntos de datos generados artificialmente que pueden usarse para entrenar modelos de IA sin infringir derechos de autor.
💡 Dica Pro: El uso de datos sintéticos para el entrenamiento de modelos de IA no solo ayuda a evitar problemas legales, sino que también puede mejorar la diversificación del dataset, reduciendo sesgos en los resultados.