Firma Scarpa

Derecho de cita e IA generativa: el marco que ya no sirve

El derecho de cita nació para el diálogo humano. La IA no dialoga: sintetiza. Y eso lo cambia todo.

Cada vez que un modelo de lenguaje genera un texto, reproduce —sin saberlo, sin quererlo, sin intención alguna— fragmentos de millones de obras protegidas. El ordenamiento jurídico tiene para eso una respuesta: el derecho de cita. El problema es que esa respuesta fue diseñada para personas, no para máquinas. Y la distancia entre ambos supuestos es mayor de lo que la doctrina ha querido reconocer.

En el informe La Cita Algorítmica: Fricciones entre el Derecho de Autor y la Inteligencia Artificial Generativa en la Interfaz de Entrenamiento y Output, publicado por derechoartificial.com en mayo de 2026, analizo en profundidad esta tensión estructural. Lo que sigue es el desarrollo completo de esa investigación: el marco normativo, la jurisprudencia más reciente, el análisis comparado y las propuestas de reforma que considero necesarias.

El paradigma que se rompió sin que nadie lo anunciara

Durante décadas, el sistema de derechos de autor funcionó sobre un presupuesto implícito: quien crea, es humano. La excepción de cita, regulada en el artículo 10(1) del Convenio de Berna, no exige que el autor sea una persona física de forma expresa, pero toda su arquitectura —la intención dialéctica, la mención de la fuente, la proporcionalidad— presupone un sujeto que razona, que elige, que atribuye.

Los modelos de lenguaje de gran tamaño (LLM) y los sistemas de difusión de imágenes operan bajo una lógica radicalmente distinta. No comprenden, no valoran ni seleccionan en el sentido cognitivo del término. Funcionan, como ha formulado Luciano Floridi, bajo el principio del agere sine intelligere: actuar sin entender. Son máquinas estadísticas que mapean patrones lingüísticos, visuales o sonoros a partir de corpus masivos de obras preexistentes, y generan resultados que emulan la creatividad humana sin experimentarla.

Este desajuste ontológico no es un problema filosófico abstracto. Tiene consecuencias jurídicas inmediatas y muy concretas: las excepciones al derecho de autor vigentes fueron construidas para un tipo de uso que la IA simplemente no realiza. La IA no cita, no critica, no ilustra. Sintetiza. Y esa diferencia, aparentemente técnica, es en realidad el núcleo de todo el conflicto.

El Convenio de Berna ante un destinatario que no imaginó

El artículo 10(1) del Convenio de Berna establece la licitud de las citas de obras legítimamente accesibles al público, con la condición de que se realicen conforme a los usos honrados y en la medida justificada por el fin perseguido. La doctrina internacionalista, encabezada por Aplin y Bently, sostiene que esta disposición tiene carácter cuasi-mandatorio para los miembros de la Unión de Berna: no es una excepción facultativa, sino un mínimo exigible.

Hay un detalle histórico que merece atención porque se cita mal con frecuencia: el requisito de que las citas fueran "cortas" desapareció en el Acta de Bruselas de 1948, no en la Conferencia de Estocolmo de 1967, como señalan erróneamente algunos manuales. El texto vigente (Acta de París 1971) no impone ningún límite cuantitativo rígido. Permite incluso la reproducción de obras completas si se satisface el criterio de proporcionalidad y el propósito perseguido es la crítica, la ilustración o la investigación.

Ahora bien, el artículo 10(3) impone una condición que los sistemas de IA omiten sistemáticamente: la mención de la fuente y del nombre del autor. Esta obligación de atribución es el primer "punto de ruptura" en la cadena de legalidad de los modelos de lenguaje. La IA genera, pero no atribuye. Y sin atribución, no hay cita en el sentido del Convenio; hay reproducción no autorizada.

Dicho esto, el problema más profundo no es técnico sino funcional. Para que opere la excepción de cita, el uso de la obra ajena debe tener una finalidad dialéctica: ilustrar una afirmación, defender una postura, permitir una comparación intelectual. El TJUE, en las sentencias Pelham I y Spiegel Online, precisó que debe existir un "vínculo directo y cercano" entre la obra citada y las reflexiones del usuario. Una máquina que genera texto probabilístico no establece ese vínculo porque no tiene reflexiones. El output automático se presenta como contenido final, no como referencia secundaria integrada en un discurso crítico. Esto hace inoperante el derecho de cita tradicional frente a los outputs de IA, con independencia de cuántos fragmentos protegidos contengan.

La tríada normativa europea y sus límites estructurales

La Unión Europea ha construido el marco regulatorio más sofisticado del mundo en este ámbito, mediante una trilogía de instrumentos que conviene analizar con precisión porque los tres presentan tensiones significativas cuando se aplican a la IA generativa.

La Directiva 2001/29 (InfoSoc) definió las excepciones tradicionales. Su artículo 5(3)(d) recoge el derecho de cita para fines de crítica o reseña. La interpretación restrictiva del TJUE —intención dialéctica, vínculo directo— ya ha sido suficientemente desarrollada. Lo que conviene subrayar aquí es que esta interpretación no es caprichosa: responde a la lógica del sistema, que concibe las excepciones como espacios acotados que no deben vaciar el contenido del derecho exclusivo.

La Directiva (UE) 2019/790 (DAMUD) introdujo las excepciones de Minería de Textos y Datos (TDM). El artículo 3 permite el TDM para investigación científica en instituciones sin ánimo de lucro. El artículo 4 crea una excepción general para cualquier entidad —incluidas empresas comerciales— siempre que el titular no haya ejercido un opt-out legible por máquina. El debate actual es si el entrenamiento de IA generativa encaja en este marco. La respuesta honesta es: no del todo.

Las excepciones de TDM fueron concebidas para un análisis "no consumptivo": extraer hechos, tendencias y correlaciones sin reproducir la expresión creativa de las obras. Los LLM hacen algo diferente: internalizan, codifican y recombinan elementos expresivos, estructurales y estilísticos de las obras para generar nuevos contenidos sintéticos que compiten directamente con los originales. Aplicar la excepción de TDM a este proceso sin matización alguna vulneraría el "test de los tres pasos" del artículo 9.2 del Convenio de Berna y del artículo 5.5 de la Directiva InfoSoc. El uso no constituiría un "caso especial" y afectaría la explotación normal de las obras al desplazar a los autores del mercado.

La Comisión Europea, en su Orientación de abril de 2025 (SWD(2025) 120 final), reconoció implícitamente este problema al señalar que los Estados miembros deben evaluar caso por caso si el entrenamiento generativo supera los límites de la TDM. No es una respuesta; es una admisión de que el marco existente no responde.

El Reglamento (UE) 2024/1689 de Inteligencia Artificial (AI Act) completa el cuadro. Su artículo 53 obliga a los proveedores de modelos de IA de uso general a implementar políticas de cumplimiento que respeten los opt-outs del artículo 4(3) de la DAMUD. La dimensión extraterritorial de esta obligación es relevante: se aplica con independencia del lugar donde se haya realizado el entrenamiento, lo que busca evitar que las empresas se trasladen a jurisdicciones con estándares inferiores para "lavar" sus datos. Sin embargo, el AI Act no especifica un formato técnico único para los opt-outs, dejando un margen de inseguridad que solo la estandarización internacional podrá resolver.

A esto se añade, en el plano del Derecho internacional público, el Convenio Marco del Consejo de Europa sobre Inteligencia Artificial y Derechos Humanos (CETS núm. 225, 2024), primer tratado internacional jurídicamente vinculante en materia de IA. Este instrumento añade una capa de obligaciones internacionales que incluyen el respeto a los derechos de propiedad intelectual como expresión de los derechos fundamentales garantizados por el Convenio Europeo de Derechos Humanos.

¿Leer es copiar? La pregunta que el derecho no puede eludir

La pregunta parece ingenua. La respuesta no lo es.

Los modelos de lenguaje no almacenan copias literales de las obras en una base de datos relacional. Transforman la información en vectores: representaciones numéricas abstractas que capturan patrones estadísticos y relaciones semánticas. Los desarrolladores de IA suelen esgrimir esto para sostener que el entrenamiento no constituye una reproducción en el sentido del artículo 2 de la Directiva InfoSoc.

La doctrina mayoritaria discrepa. El entrenamiento requiere actos de reproducción necesariamente, ya sean permanentes —al crear el dataset— o temporales —al cargar las obras en RAM para su análisis—. Algunos autores, como Dornis, van más lejos: los propios pesos del modelo (weights) y los espacios latentes resultantes pueden considerarse "reproducciones indirectas" si permiten la reconstitución de elementos expresivos de la obra original.

El TJUE, en Infopaq y Pelham I, ha consolidado una interpretación amplia del derecho de reproducción: incluso fragmentos mínimos o copias transitorias quedan comprendidos en el artículo 2 de la Directiva InfoSoc si permiten la percepción de la creación intelectual del autor. La premisa de que "aprender no es copiar" resulta técnicamente plausible —la máquina no guarda una copia— pero jurídicamente incompleta: para que la máquina "aprenda", primero debe necesariamente "reproducir".

Aquí es donde el análisis se complica. En el contexto europeo, el asunto Like Company v. Google Ireland (C-250/25), actualmente pendiente ante el TJUE, examina por primera vez si la visualización de resúmenes generados por IA que incorporan fragmentos originales vulnera el derecho exclusivo de reproducción y comunicación pública. El Tribunal Regional de Múnich, en GEMA v. OpenAI (2025), ya subrayó que las excepciones de TDM poseen un alcance estrictamente instrumental y preparatorio, sin que puedan amparar la generación de resultados que compitan directamente con los autores en el mercado.

El mecanismo del opt-out: una promesa técnica difícil de cumplir

El artículo 4 DAMUD hace depender la licitud del entrenamiento de que el titular no haya ejercido una reserva de derechos "legible por máquina". Sobre el papel, es un mecanismo elegante: da a los titulares control sobre sus obras sin imponer una barrera de licencia previa a todos los usos. En la práctica, el mecanismo tiene problemas serios.

La fragmentación es evidente. Mientras algunos desarrolladores respetan etiquetas como ai.txt, otros ignoran prohibiciones expresadas en lenguaje natural en los términos de servicio, alegando que la tecnología disponible entre 2021 y 2023 no permitía procesar semánticamente tales avisos de forma inequívoca. Los estándares técnicos disponibles —robots.txt, metadatos IPTC/EXIF, el TDM Reservation Protocol propuesto por el W3C— no están unificados ni son universalmente interpretados del mismo modo.

El caso Kneschke v. LAION (OLG Hamburg, 10 de diciembre de 2025) arrojó luz importante sobre este punto. El tribunal consideró que las reservas de derechos expresadas en lenguaje natural en sitios web de stock no eran "legibles por máquina" bajo el estándar técnico de 2021. No era un opt-out válido. Lo que refuerza, de forma indirecta, la necesidad de protocolos técnicos explícitos y estandarizados.

La sentencia también zanjó, al menos provisionalmente, la cuestión de la "investigación comercial". LAION es una asociación sin ánimo de lucro. El tribunal determinó que la creación del dataset LAION-5B es una etapa metodológica y verificable orientada a la obtención de conocimiento, calificable como investigación aplicada al amparo del artículo 3 DAMUD. Y precisó que el hecho de que el dataset pueda ser utilizado posteriormente por terceros con fines comerciales —como Stability AI— no anula la protección de la excepción para el organismo investigador, siempre que no exista una "influencia determinante" de la empresa comercial sobre la entidad investigadora.

Conviene precisar que la sentencia del OLG Hamburg no es firme: el demandante ha anunciado recurso ante el Bundesgerichtshof (BGH, Az. I ZR 45/26), pendiente de admisión. En caso de admitirse, el BGH podría eventualmente plantear cuestión prejudicial al TJUE sobre la compatibilidad de esta interpretación con el artículo 3 DAMUD. El fallo es un precedente relevante, pero no jurisprudencia consolidada.

Memorización algorítmica: cuando la máquina reproduce sin querer

En la fase de output, el problema cambia de naturaleza. Ya no se trata de si el entrenamiento fue lícito, sino de qué produce la máquina y si ese producto infringe derechos ajenos.

El fenómeno de la "memorización algorítmica" ha sido documentado empíricamente: cuando una obra aparece con alta frecuencia en el corpus de entrenamiento, o cuando el modelo sufre sobreajuste (overfitting), el sistema es capaz de reproducir fragmentos sustanciales —o incluso la totalidad— de esa obra ante un prompt específico. El caso GEMA v. OpenAI (2025) es paradigmático: el Tribunal Regional de Múnich acreditó que el sistema generaba letras de canciones protegidas de forma casi idéntica a los originales, operando como sustituto directo del consumo de la obra.

Conviene distinguir aquí dos figuras que se confunden con frecuencia y que tienen regímenes jurídicos distintos.

La infracción del derecho de reproducción (patrimonial) ocurre cuando el output reproduce, sin autorización, una parte sustancial de una obra protegida, con independencia de si se menciona o no al autor. Se rige por el artículo 2 de la Directiva InfoSoc y la jurisprudencia Infopaq y Pelham I. Conforme a Infopaq, incluso once palabras pueden ser sustanciales si constituyen la expresión de la creación intelectual del autor.

El plagio —violación del derecho moral de paternidad— consiste en la usurpación de la autoría: presentar la obra ajena como propia, omitiendo la atribución. Se rige por el artículo 6 bis del Convenio de Berna. En los outputs de IA pueden concurrir ambas figuras, pero también pueden disociarse: un modelo puede reproducir un fragmento literal sin mencionar la fuente (infracción patrimonial más plagio moral) o puede generar una obra sustancialmente similar atribuyendo correctamente al autor (solo infracción patrimonial).

El reto jurídico estriba en que esta reproducción no es fruto de un acto de copia consciente, sino de una síntesis probabilística que "emula" la forma expresiva sin comprender su significado. El Tribunal Regional de Múnich, en GEMA, consideró que la generación de letras casi idénticas constituía reproducción no autorizada con independencia de la ausencia de intención de plagiar por parte del sistema. Lo que resulta relevante de esta argumentación es que traslada el análisis del elemento subjetivo al resultado objetivo: la reproducción infringe no porque la máquina quisiera copiar, sino porque el output reproduce efectivamente.

Un estudio de caso: Bécquer y la trampa del dominio público

Para ilustrar la aplicación concreta de estos criterios, considérese el siguiente escenario, basado en la jurisprudencia real.

Un usuario introduce en un sistema de IA generativa el prompt: "Escribe un poema de 14 versos sobre la fugacidad del amor, con rima consonante ABAB, que comience con 'Podrá nublarse el sol eternamente' y que evoque el estilo de Gustavo Adolfo Bécquer." El sistema genera un poema que incorpora literalmente ese primer verso —idéntico al de la Rima LIII de Bécquer— y continúa en un estilo reconociblemente becqueriano.

¿Infracción del derecho de reproducción? Bécquer falleció en 1870, por lo que sus obras están en dominio público. No existen derechos patrimoniales que infringir. Si el mismo fenómeno se produjera respecto de un autor vivo o de una obra protegida —lo que es perfectamente posible con autores contemporáneos— sería necesaria la evaluación de la sustancialidad del fragmento copiado. Conforme a Infopaq, incluso un verso puede ser sustancial.

¿Derecho de cita? El output reproduce el primer verso exacto sin mencionar la fuente ni al autor, y la IA no desarrolla un discurso crítico o ilustrativo sobre el verso original, sino que lo incorpora como parte de un texto nuevo sin intención dialéctica alguna. El derecho de cita no es aplicable.

¿Pastiche? Aquí la respuesta es más matizada, y aquí es donde entra en juego la sentencia más importante del último año en este ámbito.

Pelham II y la excepción de pastiche: una apertura con condiciones

La sentencia de la Gran Sala del TJUE en Pelham II (C-590/23, 14 de abril de 2026) es el pronunciamiento más relevante para el ecosistema de la IA generativa que ha producido la jurisprudencia europea en años. Conviene advertir que, en el momento de redactar este análisis, la sentencia no ha sido publicada en la recopilación oficial European Court Reports ni cuenta con número ECLI definitivo. El análisis que sigue se sustenta en la nota de prensa del TJUE (CURIA, CP 60/26) y en los primeros comentarios doctrinales, por lo que debe considerarse provisional hasta la publicación oficial.

Dicho esto, lo que el Tribunal estableció tiene implicaciones de largo alcance. Definió el pastiche como un concepto autónomo del Derecho de la Unión que permite el uso de obras preexistentes siempre que concurran tres condiciones objetivas: la evocación de la obra original, una diferencia perceptible respecto de ella, y la existencia de un diálogo artístico o creativo objetivamente reconocible.

La innovación principal para el ecosistema de la IA reside en la irrelevancia de la intención subjetiva. El TJUE clarificó que no es necesario demostrar que el creador —o la máquina— "quiso" hacer un pastiche; basta con que el carácter de pastiche sea objetivamente perceptible para un sujeto familiarizado con la obra original. Esto abre la posibilidad de que los outputs de transferencia de estilo —generar una imagen "al estilo de Van Gogh" o una canción con la estética de Oasis— queden amparados por esta excepción, siempre que no constituyan un plagio encubierto y respeten el equilibrio justo entre la libertad de las artes y el derecho de propiedad.

El pastiche resuelve así el problema de la "ausencia de mente" en la IA, trasladando el análisis del elemento subjetivo al objeto mismo y a su percepción por el público.

Ahora bien, las condiciones son relevantes. Volviendo al caso Bécquer: el primer verso es literal, el estilo es notoriamente becqueriano y eso satisface el requisito de evocación. Sin embargo, la incorporación del verso exacto como núcleo expresivo del poema difícilmente cumple el criterio de "diferencia perceptible" exigido por el TJUE. El pastiche requiere algo más que una copia encubierta disfrazada de homenaje. El amparo sería probable pero discutible.

Esta ambigüedad no es un defecto de la sentencia; es un reflejo honesto de que el análisis debe hacerse caso por caso, atendiendo a la medida en que el output evoca sin reproducir, transforma sin suplantar.

El modelo comparado: cinco jurisdicciones, cinco apuestas distintas

Lo que más me llama la atención del panorama regulatorio global es que ningún sistema ha acertado a dar una respuesta completa. Cada jurisdicción ha apostado por un principio ordenador distinto, y cada apuesta tiene sus propias fracturas.

Japón se ha posicionado como la jurisdicción más favorable para el desarrollo de la IA mediante el artículo 30-4 de su Ley de Derechos de Autor (reformada en 2018). Esta norma permite la explotación de obras protegidas en cualquier forma y sin licencia, siempre que el propósito del usuario no sea el "disfrute personal" ni provocar que terceros "disfruten de los pensamientos o sentimientos expresados en la obra". El entrenamiento de modelos de IA es libre, sea comercial o de investigación. Sin embargo, la Agencia de Asuntos Culturales de Japón aclaró en sus directrices de 2024 y 2025 que el artículo 30-4 protege la fase de input pero no exime de responsabilidad si el modelo genera outputs que reproducen de forma reconocible la expresión creativa de una obra original. Máxima libertad para entrenar máquinas, rigor absoluto para lo que producen: es un compromiso asimétrico, inteligente en su diseño, pero que traslada todo el peso del control a la fase de output.

Estados Unidos confía en la ductilidad judicial del fair use (17 U.S.C. § 107), con su análisis flexible de cuatro factores. Las plataformas de IA invocan el precedente de Authors Guild v. Google para argumentar que el entrenamiento no explota el valor estético de las obras sino que analiza patrones estadísticos no protegibles. Sin embargo, la doctrina del fair use se encuentra en un punto de inflexión tras Warhol Foundation v. Goldsmith (2023), que restringe la defensa del uso transformador cuando existe una competencia comercial directa. La pregunta relevante —¿compite la IA generativa directamente con los autores?— es precisamente la más difícil de responder.

El Reino Unido emplea el modelo de fair dealing, que solo se aplica a una lista cerrada de propósitos estatutarios. La ausencia de una excepción comercial de TDM equivalente al artículo 4 de la DAMUD sitúa a las empresas tecnológicas británicas en una posición de desventaja competitiva, forzando un debate nacional sobre la necesidad de reforma que, a la fecha de este análisis, no ha concluido.

China ha construido un modelo de indulgencia moderada para el entrenamiento pero de alta responsabilidad para las plataformas en la fase de salida. El caso GIC Ultraman Case (Guangzhou, 2024) es el ejemplo más claro: el tribunal condenó al proveedor del servicio de IA por no bloquear prompts que solicitaban imágenes del personaje Ultraman, considerando que la plataforma tenía el deber de cuidado de prevenir infracciones previsibles. La jurisprudencia china integra la propiedad intelectual dentro del marco general de seguridad algorítmica, con consecuencias de responsabilidad estricta que no tienen equivalente en Europa.

Brasil y el Sur Global apuestan por un tercer camino. El Proyecto de Ley 2338/2023 propone una excepción amplia para TDM con fines de investigación y desarrollo sin exigir reserva expresa del titular, siempre que el uso no cause perjuicio económico injustificado a los autores. Subyace a esta posición la preocupación —legítima, creo— de que un sistema estricto de reservas perjudique el desarrollo de modelos de lenguaje en portugués o español al restringir el acceso a la cultura local. En las Conversaciones sobre PI e IA de la OMPI (2023-2025), las delegaciones del Sur Global han resistido la imposición de estándares de licencia obligatoria que podrían consolidar el monopolio tecnológico de un reducido número de corporaciones globales. Para estos países, el derecho de cita y las excepciones de TDM no son solo herramientas técnicas: son instrumentos de soberanía cultural en un ecosistema digital profundamente desigual.

India se encuentra en fase de transición. La Copyright Act de 1957 no contiene excepción específica para TDM. La propuesta de Digital India Act (diciembre de 2025) introduciría una excepción de fair dealing para TDM con fines de investigación, innovación y desarrollo de IA, siempre que el uso no sustituya comercialmente la obra original. Mientras no se apruebe, la inseguridad jurídica persiste.

Responsabilidad civil: el usuario, el desarrollador y la trampa de la "autoría híbrida"

La determinación de quién responde por un output infractor genera una distribución compleja de responsabilidades que la doctrina está comenzando a articular.

Por un lado, la teoría de la "autoría híbrida" sugiere que el usuario, al ejercer un "control creativo" mediante el refinamiento de prompts y la selección de resultados, asume la responsabilidad por el uso final del contenido. Si el usuario induce deliberadamente al modelo a replicar una obra específica, la infracción le es directamente imputable. Esto es coherente: quien solicita una reproducción es responsable de haberla solicitado.

Por otro lado, los desarrolladores no están exentos. La jurisprudencia comparada —especialmente en China— ha comenzado a reconocer la "infracción contributiva" por parte de las plataformas que no implementan sistemas eficaces de filtrado. En la Unión Europea, el artículo 53 del AI Act refuerza esta tendencia al imponer obligaciones de transparencia y cumplimiento del derecho de autor que delimitan el estándar de diligencia debida para los proveedores de modelos de uso general. El precedente de L'Oréal v. eBay (C-324/09) —donde el TJUE estableció que el operador de un mercado en línea puede ser considerado responsable si, teniendo conocimiento de infracciones, omite actuar con diligencia— apunta en la misma dirección cuando se traslada al contexto de la IA.

La responsabilidad tiende, así, a ser compartida: el desarrollador responde por la arquitectura que facilita la infracción si no ha implementado filtros razonables; el usuario responde por la explotación específica del resultado. A lo que debe añadirse la posible concurrencia del artículo 82 del RGPD cuando el output infractor involucre tratamiento de datos personales de los autores afectados, generando una doble vía de reclamación.

Propuestas de reforma: tres pilares para una citación tecnológicamente neutra

El marco normativo actual presenta "puntos ciegos" estructurales que generan inseguridad jurídica para todos los actores del ecosistema. La solución no es una excepción más, construida sobre la lógica del "prohibición y excepción". Es un cambio de paradigma hacia la "transparencia y compensación". Propongo tres pilares.

El primer pilar es la atribución automatizada mediante metadatos. La obligación del artículo 10(3) de Berna —mencionar la fuente y el autor— se ha convertido en el principal punto de fricción en los outputs de IA. Para restaurar este derecho moral de forma operativa, es necesario transponer al plano normativo los estándares técnicos de procedencia ya existentes. El estándar C2PA (Coalition for Content Provenance and Authenticity, Especificación Técnica v1.4, 2025) permite incrustar metadatos criptográficamente firmados en archivos digitales, registrando de forma inmutable y verificable la cadena de custodia del contenido: qué modelo lo generó, cuándo, y qué categorías de fuentes de entrenamiento se utilizaron.

Propongo que la licitud de un sistema de IA generativa dependa legalmente de la implementación de estos protocolos de procedencia. Este modelo de "citación por diseño" obligaría a los proveedores a incrustar dichos metadatos en cada output. La remoción injustificada de estos metadatos debería calificarse no solo como infracción de propiedad intelectual, sino también como práctica comercial desleal en el sentido de la Directiva (UE) 2019/2161. Dicho esto, la imposición de C2PA debe modularse conforme al principio de proporcionalidad del artículo 17 de la Carta de los Derechos Fundamentales: los modelos de investigación sin impacto comercial significativo deberían poder quedar exentos para no crear una barrera desproporcionada a la innovación abierta.

El segundo pilar es un modelo de licencia colectiva obligatoria con remuneración equitativa. Ante la imposibilidad técnica de negociar licencias individuales para corpus de entrenamiento que abarcan miles de millones de obras, el mercado se enfrenta a un "fallo de mercado" estructural que el opt-out del artículo 4 DAMUD no puede corregir. La solución más viable es la creación de un derecho de remuneración equitativa gestionado mediante licencias colectivas extendidas (ECL) o sistemas de gestión colectiva obligatoria, inspirados en los modelos de radiodifusión o copia privada.

Bajo este esquema, los desarrolladores no necesitarían autorización previa para cada obra, pero estarían obligados por ley a abonar un canon proporcional al valor comercial del modelo y a la escala de los datos ingeridos. La distribución de estos fondos por las Entidades de Gestión Colectiva podría realizarse mediante algoritmos de asignación probabilística que utilicen el muestreo estadístico y el matching de metadatos para identificar qué repertorios han contribuido de manera efectiva a la capacidad de síntesis del modelo. Este sistema garantiza que el "valor del entrenamiento" retorne al ecosistema creativo sin obstaculizar la innovación.

El tercer pilar es la transparencia por diseño mediante registros de entrenamiento auditables. La opacidad de los datasets actuales impide que los titulares de derechos ejerzan incluso las limitadas facultades de exclusión vigentes. El artículo 53 del AI Act impone obligaciones de transparencia, pero son procedimentales y se limitan a resúmenes voluntarios. Una reforma integral debe exigir registros de entrenamiento granulares y verificables, accesibles para autoridades de supervisión independientes.

Propongo el uso de sistemas de registro inmutable y auditable —que pueden incluir tecnologías de registro descentralizado— que permitan a los autores verificar la presencia de su trabajo en el corpus de entrenamiento. Cada acto de ingesta de una obra debería generar un registro que, sin revelar la obra completa (por razones de confidencialidad comercial), acredite la inclusión de metadatos de identificación: hash de la obra, nombre del autor y fecha de ingesta. La ley debe habilitar además auditorías aleatorias sobre los modelos para detectar casos de "lavado de datos": datos obtenidos bajo excepciones de investigación científica que terminan siendo explotados en modelos comerciales.

Conclusiones

La IA generativa no es simplemente un nuevo reto tecnológico para la propiedad intelectual. Es una subversión sistémica de sus fundamentos ontológicos. Conviene ser precisos sobre qué ha cambiado y qué debe cambiar.

  • El derecho de cita tradicional (art. 10 Convenio de Berna) es inoperante frente a la IA generativa por ausencia de intención dialéctica y de atribución sistemática. No puede aplicarse sin reforma normativa.
  • La excepción de pastiche, tal y como la ha definido Pelham II, ofrece una vía de amparo para los outputs de transferencia de estilo, pero con condiciones objetivas estrictas que deben evaluarse caso por caso.
  • Las excepciones de TDM (arts. 3 y 4 DAMUD) fueron concebidas para un análisis no consumptivo. Aplicarlas al entrenamiento generativo sin matización vulnera el test de los tres pasos. La orientación de la Comisión Europea de abril de 2025 reconoce implícitamente esta insuficiencia.
  • El AI Act impone obligaciones de transparencia que van en la dirección correcta, pero son procedimentales. Sin registros de entrenamiento auditables y sin un sistema de remuneración equitativa, las obligaciones del artículo 53 son, en la práctica, papel mojado.
  • La fragmentación regulatoria global —Japón, EE.UU., UE, China, Sur Global— amenaza la cohesión del Mercado Único Digital y crea incentivos para el arbitraje jurisdiccional.
  • La "citación tecnológicamente neutra" —metadatos C2PA obligatorios, licencias colectivas con canon proporcional y registros de entrenamiento inmutables— es la arquitectura de reforma más viable para garantizar que el valor de la cultura retorne a quienes la crean.

El futuro del derecho de autor en la era de la IA no depende de si las máquinas aprenden. Depende de si el ordenamiento jurídico es capaz de garantizar que, cuando las máquinas aprenden de la producción cultural humana, el valor de esa cultura siga retornando a su raíz autoral.


El informe completo La Cita Algorítmica: Fricciones entre el Derecho de Autor y la Inteligencia Artificial Generativa en la Interfaz de Entrenamiento y Output incluye el análisis normativo íntegro, las tablas comparativas de modelos regulatorios y la bibliografía completa con todas las referencias jurisprudenciales y doctrinales citadas en este artículo.