Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que os colegas ocidentais, foram desenvolvidos usando os dados do OpenAI. Essa revelação, juntamente com o rápido sucesso da Deepseek, desencadeou uma desaceleração do mercado para as principais empresas de IA, com a Nvidia sofrendo as perdas mais substanciais na história de Wall Street.
O modelo R1 da Deepseek, construído sobre o Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) e requisitos de energia de computação em comparação com modelos ocidentais como o ChatGPT. Embora essa reivindicação seja debatida, ela alimentou as preocupações dos investidores em relação aos enormes investimentos em IA pelos gigantes da tecnologia americana. A popularidade de Deepseek surgiu nos gráficos de aplicativos dos EUA em meio à controvérsia.
O OpenAI e a Microsoft estão investigando se a Deepseek violou os termos de serviço da OpenAI, empregando "destilação", uma técnica que extrai dados de modelos maiores, para treinar seus próprios modelos usando a API do OpenAI. A OpenAI confirmou sua conscientização sobre tais tentativas de chineses e outras empresas e destacou suas medidas proativas para proteger sua propriedade intelectual, incluindo a colaboração com o governo dos EUA.
David Sacks, consultor de IA do presidente Trump, corroborou a suspeita de extração de dados dos modelos OpenAI, prevendo ações adicionais, liderando as empresas de IA para impedir essas práticas.
A situação destaca uma ironia significativa: o OpenAI, acusado de utilizar conteúdo da Internet protegido por direitos autorais para treinar o ChatGPT, agora está acusando o Deepseek de práticas semelhantes. Essa hipocrisia tem sido amplamente observada, particularmente à luz da declaração anterior da Openai à Casa dos Lordes do Reino Unido de que o treinamento que lidera os modelos de IA sem material protegido por direitos autorais é impossível. Esta declaração segue os processos movidos pelo New York Times e 17 autores, alegando uso ilegal de seu trabalho. O OpenAI sustenta que suas práticas de treinamento constituem "uso justo". O debate ressalta os complexos desafios legais e éticos em torno do uso de material protegido por direitos autorais no treinamento do modelo de IA.