OpenAI sospecha de una utilización no autorizada de sus datos por parte de DeepSeek

Comparte

OpenAI está investigando si su competidor en China DeepSeek utilizó datos de la compañía estadounidense sin su autorización para entrenar su propio modelo de IA. La aparición repentina de DeepSeek, una aplicación china que puede emular el rendimiento de ChatGPT con muchos menos costes operativos, llega generando controversia e intentando socavar el estatus de OpenAI y otras empresas estadounidenses como líderes mundiales en IA. 

A finales de 2024, según concluye la investigación de Open AI, grandes cantidades de datos se extraían a través de cuentas de desarrolladores de OpenAI, que la empresa cree que estaban afiliadas a DeepSeek. La técnica utilizada habría sido la de model distillation, una técnica común que utilizan los desarrolladores para entrenar modelos de IA más pequeños extrayendo datos de otros más grandes. Es una forma eficiente de entrenar modelos, teniendo en cuenta los más de 100 millones de dólares que OpenAI gastó para entrenar GPT-4, aunque dicho procedimiento estaría vulnerando los términos y condiciones de uso de la solución de IA de Open AI. 

OpenAI ha declarado que las empresas con sede en China, entre otras, están constantemente familiarizadas en utilizar esta técnica de las principales empresas de los Estados Unidos para obtener una ventaja competitiva. Asimismo, han declarado que tomarán todas las decisiones para proteger su propiedad intelectual.

Leer más

Posts relacionados que podrían interesarte

4, julio 2024

Entran en vigor las primeras disposiciones del Reglamento MiCA

1, junio 2022

La European Union Agency for Cybersecurity (ENISA) publica su reporte anual sobre las necesidades en la investigación en ciberseguridad

27, octubre 2022

Nuevo estudio del Parlamento Europeo sobre la Propiedad Intelectual y la tecnología de libro mayor distribuido, en relación al arte tokenizado

20, julio 2022

El Gobierno destinará hasta 3,8 millones en ayudas al metaverso

15, octubre 2020

Microsoft ya no debe gestionar los datos sanitarios de los franceses.

8, febrero 2024

Google permitirá compartir credenciales entre miembros de la familia