Reforma legal para fortalecer la investigación mundial con minería de textos y datos.

2022-12-06 Leer en voz alta

Las leyes anticuadas de derechos de autor en todo el mundo obstaculizan la investigación.

(Versión traducida al español por Viviana Rangel y Patricia Diaz, el artículo original en inglés puede ser consultado en https://www.science.org/doi/10.1126/science.add6124 )

Quienes se dedican a la investigación con minería de textos y datos (TDM por sus siglas en inglés Text and Data Mining) recopilan vastas cantidades de material digitalizado y utilizan programas informáticos para analizar y extraer información de allí. El  TDM es un primer paso crucial para lograr resultados de procesos de aprendizaje automático –machine learning-, humanidades digitales y ciencias sociales que, en muchos casos, abordan algunos de los mayores retos científicos y sociales del mundo, desde la predicción y el seguimiento de COVID-19 hasta la lucha contra el discurso del odio y la desinformación [1-3]. Aunque las aplicaciones del TDM suelen ser transfronterizas, con investigadores, sujetos y materiales en más de un país, el mosaico de leyes de derechos de autor en las distintas jurisdicciones limita dónde y cómo puede realizarse la investigación con TDM.Con el  Comité Permanente de Derechos de Autor y Derechos Conexos de la Organización Mundial de la Propiedad Intelectual (OMPI) y las legislaciones de todo el mundo deliberando sobre la armonización de las excepciones al derecho de autor para diversas formas de investigación, estamos debatiendo las medidas políticas que pueden garantizar que la investigación con TDM esté autorizada de forma inequívoca por la ley de derechos de autor.

La mayoría de los textos, imágenes y otros materiales que utilizan los y las investigadoras de TDM están sujetos a la ley de derechos de autor. La ley de derechos de autor otorga al titular de los derechos patrimoniales de una obra protegida el derecho legal a prohibir la reproducción, distribución, modificación y otras formas de explotación de esa obra sin su permiso. Estos derechos se aplican incluso si el material es fácilmente accesible, por ejemplo, si está publicado en Internet o disponible en una biblioteca.

Las justificaciones de los derechos de autor se basan tanto en los derechos de los autores individuales sobre sus creaciones como en los incentivos instrumentales para la creación y difusión de nuevas obras. Los derechos de autor otorgan al autor de una obra, o al cesionario del autor (por ejemplo, un editor), el derecho exclusivo de reproducir, transmitir y hacer derivados de la obra protegida y de impedir la apropiación no autorizada de

estos derechos [4]. Aunque en un principio el derecho de autor se refería únicamente a las obras textuales de de autor, hoy en día se ha ampliado para abarcar obras gráficas y visuales y, en algunos países, los datos y las bases de datos -aunque algunos países, incluidos los Estados miembros miembros de la Unión Europea (UE), tienen estatutos separados de la Unión Europea (UE), cuentan con estatutos independientes para la protección de las bases de datos)-.

Cada etapa de un proyecto de TDM está potencialmente limitada por los derechos de autor, dependiendo de cómo se interprete el alcance de la protección. Las prohibiciones de los derechos de autor sobre la reproducción sin licencia pueden verse afectadas cuando las fuentes son digitalizadas, formateadas y compiladas en un corpus que puede ser extraído para el análisis. Los derechos de autor también pueden limitar la aplicación de un algoritmo a un corpus de TDM, que puede hacer copias temporales adicionales en la memoria del ordenador. Las restricciones de derechos de autor sobre la transmisión y reproducción de obras pueden estar implicadas cuando los y las investigadoras colaboran, cuando los examinadores validan y cuando los editores informan de los resultados. Por lo tanto, sin el permiso de los derechos de autor, o la aplicación de las excepciones previstas en la ley de derechos de autor, gran parte del material mundial protegido por derechos de autor puede estar fuera de los límites del uso del TDM.

Algunos editores ofrecen licencias limitadas de derechos de autor para el uso de TDM, a menudo a cambio de tasas adicionales que se cobran a las bibliotecas o a los y las investigadoras. Pero las licencias de pago no son una opción asequible o viable para muchos proyectos de TDM. La investigación basada en TDM a menudo requiere el uso de conjuntos de datos masivos con obras de muchos editores, incluidos los propietarios de derechos de autor que no pueden ser identificados o no están dispuestos a conceder licencias. Obligar a los quienes se dedican a la investigación a utilizar únicamente contenidos bajo licencia o en dominio público (es decir, contenido que no tiene derechos de autor exigibles) puede restringir los temas de estudio, obstaculizar la reproducibilidad y la validación [5], sesgar los resultados [6] y disuadir a los y las investigadoras de emprender proyectos [7]. La falta de una licencia no tiene por qué, ni debe ser un obstáculo absoluto para la investigación con TDM.

Los derechos concedidos por los derechos de autor no son absolutos. Todos los tratados internacionales sobre derechos de autor permiten, y todos los países tienen, excepciones a la protección de los derechos de autor para diversos fines, algunos de los cuales pueden autorizar la investigación sobre el TDM.  En EE.UU., por ejemplo, existe una excepción flexible de “uso justo” para fines como la educación y la investigación, que los tribunales han interpretado de forma que permite al menos algunos usos del TDM.  Las leyes de derechos de autor de muchos otros países contienen excepciones para usos de investigación (o “científicos”) que pueden interpretarse como aplicables a los usos del TDM [4]. Pero sólo una quinta parte de estas excepciones de investigación son lo suficientemente amplias como para permitir toda la gama de investigaciones posibles con TDM, que requiere la capacidad de copiar, compartir, y analizar obras completas en colaboración con otros [8] (véase la figura y la tabla). Por ejemplo, algunos países tienen excepciones de investigación que sólo permiten el uso de extractos de una obra (como Argentina), no se aplican a los usos de libros u otros tipos de obras (como en la mayoría de los países postsoviéticos), o exigen la pertenencia a un instituto de investigación específico  (como en Suecia).

Los estudios empíricos demuestran que las excepciones a los derechos de autor para la investigación son importantes, con correlaciones entre las excepciones a la investigación más permisivas y una mayor producción de obras académicas citables [9] y un mayor uso académico de las metodologías de TDM [10]. Pero hasta que no se armonicen los entornos legales que permitan la investigación basada en TDM, no se podrán aprovechar plenamente los beneficios de esta nueva frontera de la investigación.

HABILITACIÓN LEGAL DE LA INVESTIGACIÓN BASADA EN TDM

Lo ideal para los y las investigadoras sería contar con una norma mínima para los usos globales del TDM en todas partes. Hay una serie de caminos que los responsables políticos pueden promover para tener una mayor armonización de las excepciones a los derechos de autor para los usos del TDM.

Tratados internacionales

Casi todos los países ofrecen un alto nivel de protección de los derechos de autor como resultado de varios tratados multilaterales ampliamente adoptados, empezando por el Convenio de Berna para la Protección de las Obras Literarias y Artísticas (Berna, 1886) y continuando por los “Tratados de Internet” de la OMPI (Ginebra, 1996). Una característica clave de estos tratados es el requisito de que los países firmantes impongan normas estrictas para proteger los derechos de autor, pero dejen las excepciones, como las que permiten la investigación, en gran medida a la discreción de las legislaturas y los tribunales nacionales. El resultado es el panorama fragmentado de excepciones que se muestra en la imagen. Pero la situación está cambiando. El Comité Permanente de Derecho de Autor y Derechos Conexos de la OMPI está deliberando sobre la armonización de las excepciones para los usos que incluyen la investigación. Las coaliciones de personas dedicadas a la investigación y la academia proponen que este foro redacte un tratado que permita los usos transfronterizos y otros usos de los materiales de investigación para permitir el TDM en todas partes [11].

Existen importantes precedentes de un tratado internacional que imponga excepciones uniformes a los derechos de autor en todo el mundo. Por ejemplo, el último gran tratado de la OMPI, el Tratado para facilitar el acceso a las obras publicadas a personas ciegas, con discapacidad visual o con otras dificultades para acceder al texto impreso (Marrakech, 2013), armonizó las excepciones al derecho de autor para las personas con discapacidad visual. Además, la UE ha promulgado recientemente una nueva y extensa directiva que incluye el requisito de que las leyes nacionales de leyes de derechos de autor permitan al menos algunas investigaciones que usen técnicas de TDM (UE, 2019/790). 

Reforma del derecho interno

Las legislaturas nacionales pueden modificar de forma independiente sus leyes para permitir el TDM y otros usos de investigación sin ninguna acción a nivel internacional. Este tipo de ajustes legales no son inéditos. Las excepciones al derecho de autor para permitir el TDM han aparecido recientemente en la jurisprudencia sobre el uso justo en los Estados Unidos [12] y en los cambios legislativos en la UE, Singapur, Japón, Suiza y el Reino Unido [8]. Es importante que una excepción de TDM se aplique a los usos de todo tipo de obras (incluidas las obras audiovisuales utilizadas en monitoreo de medios de comunicación, por ejemplo) y permita compartir materiales al menos con fines de colaboración y validación. Algunos estudiosos proponen aclarar que todos los usos “no expresivos” (no compartidos públicamente) de las obras en el proceso de TDM y otras investigaciones deberían considerarse fuera de la regulación de los derechos de autor [13]. Japón ha incorporado recientemente este enfoque a su legislación, adoptando una excepción al control de los derechos de autor “cuando dicha explotación no sea para disfrutar o hacer que otra persona

disfrute de las ideas o emociones expresadas en dicha obra”, como por ejemplo “en un análisis de datos” (2018, artículo 30-4).

La ampliación de las excepciones del TDM a usos comerciales puede ser controvertida. Por un lado, muchos usuarios comerciales podrían ser capaces de pagar las tasas de licencia y otros costes de transacción, y las excepciones a los derechos de autor que simplemente transfieren la riqueza de los titulares de derecho a usuarios comerciales del TDM, podrían parecer arbitrarias e injustificadas. Por otro lado, muchos usos socialmente beneficiosos del TDM  -incluido el programa BlueDot que originalmente rastreaba COVID-19 [1] o los motores de búsqueda de Internet que copian y minan toda la Internet [3] – probablemente no existirían si los usos comerciales estuvieran excluidos de las excepciones a los derechos de autor. Algunos países ven el TDM comercial como una forma de invertir en innovación nacional y en transferencia de tecnología. La UE ha adoptado recientemente una norma que, aunque no se ha probado del todo, permite a los titulares de derechos de autor renunciar a los usos comerciales (pero no “científicos” o “culturales”). 

Otra excepción reciente del TDM, promulgada por Singapur en 2021, ofrece un modelo que vincula la generalidad y la especificidad. Además de una amplia excepción de uso legítimo similar a la de la legislación estadounidense (2021, Parte 5, División 2), Singapur promulgó una excepción de TDM específica para el “análisis de datos computacionales”, que incluye la posibilidad de compartir las obras reproducidas con otros “con el fin de (i) verificar los resultados del análisis de datos computacionales” y para “(ii) la investigación o estudio en colaboración relacionados con el propósito del análisis de datos computacionales” (2021: Parte 5, División 8). Desgraciadamente, algunas excepciones del TDM en otros países se quedan cortas al no autorizar la puesta en común de trabajos en la investigación colaborativa o al restringir de otro modo todo el alcance de los métodos del TDM (véase la tabla).

Orientación política

La orientación en la interpretación y modificación de la ley de derechos de autor podría ayudar a los responsables políticos a evaluar sus opciones. Incluso en países con una legislación permisiva, es probable que resulte útil aclarar la aplicación de la legislación nacional a la investigación basada en TDM. Esta orientación puede proporcionarse, por ejemplo, mediante declaraciones de buenas prácticas elaboradas por la comunidad investigadora en colaboración con expertos jurídicos. Las declaraciones de buenas prácticas sobre el uso justo han tenido éxito al permitir a los cineastas, educadores, bibliotecarios de investigación y otros usuarios-creadores que utilicen con confianza materiales protegidos por derechos de autor en su trabajo [14].

LIBERAR Y REGULAR

La resistencia a las excepciones para TDM en los derechos de autor proviene principalmente de la industria editorial multinacional, que es una voz fuerte en los debates sobre derechos de autor y tiende a oponerse a la ampliación de las excepciones a los derechos de autor. Pero el éxito en la adopción de excepciones para la investigación TDM en EE.UU. y la UE -donde los grupos de presión de la industria editorial son más fuertes- demuestra que cambios políticos en este campo son posibles. Los editores no tienen porqué verse indebidamente perjudicados por las excepciones al TDM, ya que pueden seguir concediendo licencias de acceso a sus bases de datos, que los y las investigadoras deben obtener en primera instancia, y pueden ofrecer productos que hagan que el TDM y otras formas de investigación sean más eficientes y eficaces.

Los responsables políticos y el público pueden temer que la ampliación de los derechos de TDM aumenten el poder de las empresas tecnológicas y a los modelos de capitalismo de vigilancia que están siendo cada vez más examinados por los reguladores. Pero el permiso de los derechos de autor no está por encima de la privacidad, la protección del consumidor u otra regulación de la actividad de los conglomerados tecnológicos. Los países pueden liberar la investigación con TDM y seguir regulando estos otros ámbitos.

No autorizar la investigación basada en TDM en todas partes agrava las disparidades perjudiciales de nuestro sistema de investigación mundial. Como se muestra en la figura, los regímenes más abiertos para la investigación basada en TDM se concentran en algunos de los países y regiones más ricos, mientras que muchos países más pobres tienen leyes de derechos de autor más restrictivas. Para garantizar que las necesidades de los y las investigadoras que utilizan TDM sean escuchadas en los foros locales y nacionales donde las leyes de derechos de autor pueden ser modificadas para permitir esta investigación, los y las investigadoras deben hablar para expresar sus preocupaciones y necesidades. Es hora de que las leyes de derechos de autor de todo el mundo se adapten para permitir la investigación basada en TDM.


REFERENCIAS Y NOTAS

[1] Prosser, “How AI Helped Predict the Coronavirus Outbreak Before It Happened,” Singularity Hub (2020); https://singularityhub.com/2020/02/05/how-ai-helped-predict-the-coronavirus-outbreak-before-it-happened/.

[2] W. Knight, “Researchers Will Deploy AI to Better Understand Coronavirus,” WIRED, 17 March 2020.

[3] OpenMinted, TDM Stories, http://openminted.eu/blog/ (2018).

[4] P. Goldstein, B. Hugenholtz, International Copyright: Principles, Law, and Practice (Oxford Univ. Press, 2019).

[5] V. Stodden, “Enabling Reproducibility in Big Data Research: Balancing Confidentiality and Scientific Transparency” in Privacy, Big Data, and the Public Good: Frameworks for Engagement, J. Lane, V. Stodden, S. Bender, H. Nissenbaum, Eds. (Cambridge Univ. Press, 2014), chap. 5.

[6] A. Levendowski, Wash. Law Rev. 93, 579 (2018).

[7] R. G. Samberg, C. Hennesy, “Law and Literacy in Non-Consumptive Text Mining: Guiding Researchers Through the Landscape of Computational Text Analysis” in Copyright Conversations: Rights Literacy in a Digital World, S. R. Benson, Ed. (Association of College and Research Libraries, 2019), chap. 17.

[8] S. Flynn, L. Schirru, M. Palmedo, A. Izquierdo, “Research Exceptions in Comparative Copyright” (PIJIP/TLS Research Paper Series no.75, 2022); https://digitalcommons.wcl.american.edu/research/75).

[9] M. Palmedo, EFIL J. Econ. Res. J. 2, 114 (2019).

[10] C. Handke, L. Guibault, J. J. Vallbé, MDE. Manage. Decis. Econ. 42, 1999 (2021).

[11]  S. Flynn et al., Eur. Intellect. Prop. Rev. 42, 393 (2020).

[12] M. W. Carroll, UC. Davis Law Rev. 53, 893 (2019).

[13]  Sag, Northwest. Law Rev. 103, 1607 (2009).

[14] M. Jacob, P. Jaszi, P. S. Adler, W. Cross, Facilitators, “Code of Best Practices in Fair Use for OER: A Guide for Authors, Adapters & Adopters of Openly Licensed Teaching and Learning Materials” (American University Washington College of Law, 2021); https://auw.cl/oer.

RECONOCIMIENTOS

Reconocemos la contribución de los miembros de la Red Global de Expertos en Derechos de Autor de los Usuarios y la Coalición de Acceso al Conocimiento a la investigación y las ideas que informan la redacción de este artículo. La financiación provino de una subvención del Arcadia Fund, un fondo benéfico de Lisbet Rausing y Peter Baldwin, para un proyecto de la Red sobre el derecho a la investigación en derechos de autor internacionales. Los datos utilizados para la figura y la tabla se publican en [8] y en el repositorio de GitHub en https://github.com/pijip.rtr

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.