O que acabou de acontecer? A controvérsia em curso sobre potenciais violações de direitos autorais relacionadas a dados de treinamento de grandes modelos linguísticos tomou um rumo significativo. O New York Times processou a OpenAI e a Microsoft por usarem milhões de seus artigos para treinar seus sistemas sem permissão ou compensação.

Não é nenhum segredo que os LLMs usam informações da Internet como dados de treinamento, mas o NYT afirma em seu processo de violação de direitos autorais que seu conteúdo recebeu “ênfase especial”. A ação, movida no tribunal federal de Manhattan, alega que as empresas “procuram aproveitar o enorme investimento do Times no seu jornalismo, utilizando-o para construir produtos substitutos sem permissão ou pagamento”.

O processo afirma que os milhões de artigos de notícias protegidos por direitos autorais, investigações aprofundadas, artigos de opinião, resenhas, guias de procedimentos e muito mais do Times foram usados ​​para treinar os chatbots, que agora competem com o meio de comunicação como fonte de informação. .

A ação também destaca informações fornecidas pelo Bing que identificaram erroneamente o conteúdo da publicação. Incluía “os 15 alimentos mais saudáveis ​​para o coração”, doze dos quais não haviam sido mencionados na matéria do Times. Outra alegação é que o conteúdo gerado são trechos literais de artigos do NYT, o que significa que a publicação está perdendo espectadores e clientes pagantes para empresas como ChatGPT.

O processo diz que os réus deveriam ser responsabilizados por “bilhões de dólares em danos legais e reais”. Também solicita que as empresas destruam quaisquer modelos de chatbot e dados de treinamento que utilizem material protegido por direitos autorais do The Times. A OpenAI acredita que o uso do conteúdo do NYT se enquadra no “uso justo” porque serve a um novo propósito “transformador”.



O processo também passa um bom tempo mostrando como seu conteúdo é encontrado em conjuntos de dados públicos, como o WebText2, e também tem grande peso lá devido à sua qualidade percebida. pic.twitter.com/fO8iE8yAtN

– MatthewBerman (@MatthewBerman) 28 de dezembro de 2023

Foi relatado em agosto que o Times estava em “negociações tensas” para chegar a um acordo de licenciamento com a OpenAI e a Microsoft que permitiria à primeira treinar legalmente seu modelo GPT a partir de material publicado pelo Times, algo que o jornal decidiu anteriormente. proibir. Mas as negociações foram interrompidas, levando ao processo atual. A OpenAI já possui um acordo com a Reuters para usar seu conteúdo para fins de treinamento.

A coleta de dados ganhou inúmeras manchetes este ano. Elon Musk ameaçou processar a Microsoft em abril por alegação de que ela estava usando ilegalmente dados do Twitter (como ainda fazia) para treinar modelos de IA. Em Abril, mais de 8.000 autores, incluindo luminares como James Patterson, Margaret Atwood e Jonathan Franzen, assinaram uma carta aberta pedindo aos líderes das seis principais empresas de IA que não utilizassem o seu trabalho para treinar modelos sem primeiro obter consentimento e oferecer compensação. Apesar deste apelo, a OpenAI foi processada por autores em diversas ocasiões por violação de direitos autorais.

Em um processo separado, mas semelhante, os artistas iniciaram um processo de direitos autorais contra os geradores de arte de IA Stable Diffusion e Midjourney em janeiro.

Veja a noticia completa em: https://www.techspot.com/news/101345-new-york-times-files-copyright-lawsuit-against-openai.html

Fonte: https://www.techspot.com/

 

Achou esse artigo interessante? Siga Samir News em Instagram, Facebook, Telegram, Twitter, App Boletim Tec e App Mr Robot Sticker para ler mais conteúdo exclusivo que postamos.

#samirnews #samir #news #boletimtec #the #new #york #times #abre #processo #de #direitos #autorais #contra #openai #e microsoft

Post a Comment