El modelo de IA de Alibaba ya se sitúa por delante de sus rivales chinos

Publicaciones

julio 18, 2024

Comparte

Únicamente GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic, se encuentran ya por delante de uno de los modelos de inteligencia artificial (en adelante, “IA”) de Alibaba, Gwen-72B-Instruct, después de que este haya superado a todos sus rivales en el territorio chino, y se haya posicionado tercero a nivel global.

Este modelo es la versión más avanzada de la familia de grandes modelos lIngüísticos (en adelante, por sus siglas en inglés, “LLM”), del gigante de comercio electrónico chino, y recibió este tercer puesto en una clasificación de SuperClue, que es una plataforma dedicada a llevar a cabo evaluaciones comparativas de este tipo de LLMs. Además de este gran hito, otros cinco modelos de IA de distintas empresas chinas, fueron superiores al LLM GPT-4 Turbo, uno de los mejores modelos de Microsoft-OpenAI, de acuerdo con la plataforma SuperClue.

Los modelos de IA chinos parecen estar cerrando la brecha tecnológica existente con los LLMs desarrollados en Estados Unidos, y este es únicamente el último ejemplo de esto. Hace unas semanas, este mismo modelo Gwen, de Alibaba, resultó ganador de una clasificación de modelos de código abierto, llevada a cabo esta vez por la plataforma de desarrollo de “machine-learning” Huggin Face. El propio CEO de la plataforma indicó que los modelos chinos estaban empezando a dominar el mercado.

No obstante, esta última clasificación hay que tomarla con algo de perspectiva, ya que no tiene en cuenta herramientas de código cerrado que son las que suelen liderar este tipo de rankings. Prueba de ellos es que en otra clasificación realizada por la plataforma LMSYS, respaldada por la Universidad de California, el modelo Gwen-72B ocupó el puesto 20, mientras que otros modelos de código cerrado de OpenAI o Google se repartieron los primeros puestos. Sin embargo, sobre lo que no hay duda, es que la pelea por el mejor LLM va a continuar, y las empresas chinas van a empezar a entrar en la conversación, muchos de sus modelos de código cerrado, afirman los expertos, ya han superado las capacidades de GPT-3.5-Turbo, la penúltima versión del GPT-4o.

Leer más

Posts relacionados que podrían interesarte

19, noviembre 2020

Ticketmaster sancionada con 1,25 millones de libras por no proteger los detalles de pago de sus clientes.

Leer más

4, junio 2020

La empresa española para aprender idiomas 8Belts sufre una brecha de seguridad y deja al descubierto datos de clientes como Inditex o el Real Madrid.

Leer más

8, marzo 2019

Mujeres juristas nos dan su opinión sobre la igualdad de género en el sector legal

Leer más

25, junio 2020

El Supremo confirma una multa de 40.000 euros impuesta por la AEPD a Mutua Madrileña por el envío de publicidad a un cliente inscrito en la Lista Robinson.

Leer más

27, julio 2022

La Comisión Europea demandada por utilizar a AWS en una de sus webs

Leer más

14, septiembre 2022

Nueva demanda contra Google por supuestas prácticas anticompetitivas en el funcionamiento de su publicidad en línea