OpenAI sospecha de una utilización no autorizada de sus datos por parte de DeepSeek
OpenAI está investigando si su competidor en China DeepSeek utilizó datos de la compañía estadounidense sin su autorización para entrenar su propio modelo de IA. La aparición repentina de DeepSeek, una aplicación china que puede emular el rendimiento de ChatGPT con muchos menos costes operativos, llega generando controversia e intentando socavar el estatus de OpenAI y otras empresas estadounidenses como líderes mundiales en IA.
A finales de 2024, según concluye la investigación de Open AI, grandes cantidades de datos se extraían a través de cuentas de desarrolladores de OpenAI, que la empresa cree que estaban afiliadas a DeepSeek. La técnica utilizada habría sido la de model distillation, una técnica común que utilizan los desarrolladores para entrenar modelos de IA más pequeños extrayendo datos de otros más grandes. Es una forma eficiente de entrenar modelos, teniendo en cuenta los más de 100 millones de dólares que OpenAI gastó para entrenar GPT-4, aunque dicho procedimiento estaría vulnerando los términos y condiciones de uso de la solución de IA de Open AI.
OpenAI ha declarado que las empresas con sede en China, entre otras, están constantemente familiarizadas en utilizar esta técnica de las principales empresas de los Estados Unidos para obtener una ventaja competitiva. Asimismo, han declarado que tomarán todas las decisiones para proteger su propiedad intelectual.