O precedente dos livros do Google provavelmente não pode proteger a meta contra essa segunda teoria jurídica, porque o Google nunca disponibilizou seu banco de dados de livros para o download dos usuários – o Google quase certamente teria perdido o caso se tivesse feito isso.
Em princípio, a Meta ainda poderia convencer um juiz de que cópia de 42 % de Harry Potter era permitida sob a doutrina flexível e feita por juiz de uso justo. Mas seria uma batalha difícil.
“A análise de uso justo que você precisa não é apenas” é o uso justo do conjunto de treinamento “, mas” é a incorporação no uso justo do modelo? “, Disse Lemley. “Isso complica a história dos réus”.
Grimmelmann também disse que há o perigo de que essa pesquisa possa colocar modelos de peso aberto em maior risco legal do que os de peso fechado. Os pesquisadores de Cornell e Stanford só podiam fazer seu trabalho porque os autores tinham acesso ao modelo subjacente – e, portanto, aos valores de probabilidade de token que permitiram cálculo eficiente de probabilidades para sequências de tokens.
A maioria dos laboratórios líderes, incluindo o OpenAI, Anthropic e o Google, tem acesso cada vez mais a esses chamados logits, dificultando o estudo desses modelos.
Além disso, se uma empresa mantiver pesos do modelo em seus próprios servidores, ela poderá usar filtros para tentar impedir que a saída infrator alcance o mundo exterior. Portanto, mesmo que os modelos Openai, antropia e do Google subjacentes tenham trabalhos com direitos autorais da mesma maneira que o LLAMA 3.1 70B, pode ser difícil para qualquer pessoa fora da empresa provar isso.
Além disso, esse tipo de filtragem facilita para empresas com modelos de peso fechado invocarem o precedente dos livros do Google. Em suma, a lei de direitos autorais pode criar um forte desincentivo para as empresas liberarem modelos de peso aberto.
“É meio perverso”, Mark Lemley me disse. “Eu não gosto desse resultado.”
Por outro lado, os juízes podem concluir que seria ruim punir efetivamente as empresas por publicar modelos de peso aberto.
“Há um diploma em que estar aberto e compartilhar pesos é um tipo de serviço público”, disse Grimmelmann. “Eu poderia honestamente ver juízes sendo menos cético em relação à meta e a outros que fornecem modelos de peso aberto”.
Timothy B. Lee estava na equipe da Ars Technica de 2017 a 2021. Hoje, ele escreve Entendendo ai, Um boletim informativo que explora como a IA funciona e como está mudando nosso mundo. Você pode se inscrever aqui.