OpenAI sospecha de una utilización no autorizada de sus datos por parte de DeepSeek

Comparte

OpenAI está investigando si su competidor en China DeepSeek utilizó datos de la compañía estadounidense sin su autorización para entrenar su propio modelo de IA. La aparición repentina de DeepSeek, una aplicación china que puede emular el rendimiento de ChatGPT con muchos menos costes operativos, llega generando controversia e intentando socavar el estatus de OpenAI y otras empresas estadounidenses como líderes mundiales en IA. 

A finales de 2024, según concluye la investigación de Open AI, grandes cantidades de datos se extraían a través de cuentas de desarrolladores de OpenAI, que la empresa cree que estaban afiliadas a DeepSeek. La técnica utilizada habría sido la de model distillation, una técnica común que utilizan los desarrolladores para entrenar modelos de IA más pequeños extrayendo datos de otros más grandes. Es una forma eficiente de entrenar modelos, teniendo en cuenta los más de 100 millones de dólares que OpenAI gastó para entrenar GPT-4, aunque dicho procedimiento estaría vulnerando los términos y condiciones de uso de la solución de IA de Open AI. 

OpenAI ha declarado que las empresas con sede en China, entre otras, están constantemente familiarizadas en utilizar esta técnica de las principales empresas de los Estados Unidos para obtener una ventaja competitiva. Asimismo, han declarado que tomarán todas las decisiones para proteger su propiedad intelectual.

Leer más

Posts relacionados que podrían interesarte

5, junio 2025

Orange y el “SIM Swapping”: la Audiencia Nacional confirma la infracción, pero rebaja la sanción

24, noviembre 2021

Tarantino recibe una demanda de Miramax al vender NFT de ‘Pulp Fiction’

18, julio 2019

El Comité Europeo de Protección de Datos publica su informe anual 2018.

4, septiembre 2019

Iberia y Vueling estudian implementar técnicas de reconocimiento facial para facilitar el embarque.

12, noviembre 2020

Sanción de la AEPD por tener una política de privacidad desactualizada, instalar cookies sin informar suficientemente y no disponer de conexión HTTPS en la web.

22, diciembre 2021

El aeropuerto de Barcelona ensaya un programa de reconocimiento facial de pasajeros