La nueva prostitución de AI de código abierto de Deepseek R1 ha causado la venta de acciones de Nvidia, y las aplicaciones de consumo han subido a la parte superior de la App Store.
El mes pasado, Deepseek declaró que había entrenado un modelo utilizando aproximadamente 2,000 centros de datos de la GPU NVIDIA H800 a aproximadamente $ 5.5 millones en aproximadamente dos meses. La semana pasada, publicamos una disertación que muestra que el último rendimiento del modelo coincide con el modelo de inferencia más avanzado del mundo. Estos modelos están capacitados en centros de datos que gastan miles de millones de dólares en los chips de IA más rápidos y muy caros de NVIDIA.
La reacción en la industria de alta tecnología en su conjunto a los modelos de alto rendimiento y de bajo costo de Deepseek fue salvaje. Por ejemplo, Pat Gelsinger fotografió X con Glee y publicó: “Gracias por el equipo de Deepseek”.
Por supuesto, Gelsinger es el actual presidente de Gloo, una startup de rebote de OPI, un reciente CEO de Intel, un ingeniero de hardware y un mensaje para iglesias y plataformas de compromiso. Se fue de Intel cuatro años después e intentó perseguir a Nvidia con Gaudi 3 AI, una GPU alternativa de IA para Intel.
Gelsinger escribió que Deepseek debería recordarle las tres lecciones más importantes en la industria de alta tecnología. Bajo las limitaciones, el ingenio florece. Él escribió: “Open Victoria. Deepseek te ayudará a restablecer más y más mundos cerrados en el trabajo modelo básico de IA”. Operai y la humanidad son fuentes cerradas.
Gelsinger le dijo a TechCrunch que R1 era muy impresionante, por lo que Gloo ya ha decidido no pagarle Openaii. Gloo ha construido un servicio de IA llamado Kallm. Proporciona chatbots y otros servicios.
“Mi ingeniero de pegamento ejecuta R1 hoy”, dijo. “Es posible que hayan podido ejecutar O1. Bueno, solo pueden acceder a O1 a través de API”.
En cambio, Gloo espera que Kallm reconstruya Kallm de cero en nuestro propio modelo básico. “Es emocionante”.
Dijo que Deepseek piensa que AI será un precio muy asequible. La buena IA está en todas partes. “Quiero una mejor IA con mi soldadura. Quiero una mejor IA en los audífonos. Quiero más IA en el teléfono. Al igual que el reconocimiento de voz de EV, la IA es mejor para los dispositivos incrustados. Lo necesito”.
La feliz reacción de Gelsinger probablemente se enfrentó a otras personas que no estaban emocionadas de tener un retador mucho más asequible en los conceptos básicos del razonamiento. La IA está creciendo más caro.
Otros respondieron implícitamente que Deep Sheque había destruido el número de alguna manera, y el entrenamiento debe haber sido más costoso. Algunas personas pensaron que no se usaba para usar chips de alto gas para restringir las chips de IA a China. Otros han conducido un agujero en el rendimiento y han encontrado un lugar donde otros modelos han mejorado. Además, O3, el próximo modelo de Openai, cree que superará a R1 cuando se libere y restaurará la situación actual.
Gelsinger los recoge a todos. “Dado que la mayor parte del trabajo se realizó en China, no hay transparencia completa”, dijo. “Aún así, toda evidencia es de 10 a 50 veces más barata que O1”.
Deepseek dice: “Demano que AI puede avanzar por la creatividad de la ingeniería. Esto no está lanzando más potencia de hardware y no puede calcular el recurso en el problema. Es emocionante”.
Esto es, como en las preocupaciones de privacidad y censura, Gelsinger sacude una cabeza de Phor como para todos los desarrolladores chinos que sugieren todo.
“Es vergonzoso para nuestra comunidad recordar el poder de un ecosistema abierto para los chinos”, dijo.
¡TechCrunch tiene un boletín centrado en la IA! Regístrese aquí y consíguelo en la bandeja de recepción todos los miércoles.