Participe en el boletín nuevo y semanal para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder en la industria. Obtenga más información
La historia de AI ha alcanzado un punto de metal importante. El avance de Deepseek, consecutivo, el rendimiento más avanzado sin depender del estado -de los chips de arte -artes que impulsan que muchas personas en neuripas ya han declarado. El futuro de la IA no se trata de arrojar más computación en cuestión, sino de reconsiderar estos sistemas. Cooperar con los humanos y nuestro entorno.
Como científico informático educado en la Universidad de Stanford que fue testigo de promesas y peligros del desarrollo de la IA, creo que este momento está aún más transformado que el debut de Chatgpt. Estamos entrando en lo que llamamos “Renacimiento”. O1 de O1, Deepseek R1 y otros se están moviendo más allá de la fuerza azul que se escala hacia las más inteligentes.
Este cambio no puede ser más oportuno. En un nuevo discurso de Lips Keynote, Ilya Sutskever, un ex científico jefe de Operai, está restringido a los datos finitos de Internet mientras el poder informático está creciendo, por lo que el pre -entrenamiento terminará. El avance de Deepseek verifica esta perspectiva. Las empresas chinas han demostrado que no solo son poder informático en bruto sino también innovación.
AI avanzada sin un pre -entrenamiento a gran escala
El modelo mundial está intensificando para llenar este vacío. El reciente aumento en World Labs, $ 230 millones, construye un sistema de IA que entiende la realidad como humano es similar al enfoque de Deepseek. Momento -pop re -evaluando el problema como los humanos. Estos sistemas están inspirados en los procesos cognitivos humanos y promete cambiar todo, desde el modelado ambiental hasta las interacciones con los humanos.
Puedes ver la victoria inicial. La reciente actualización de Meta de las gafas inteligentes Ray-Ban permite un sistema de contextor continuo con asistentes de IA sin palabras de Wake, junto con la traducción en tiempo real. Esta no es solo una actualización de funciones. Esta es una vista previa de cómo la IA mejora las habilidades humanas sin un modelo previo a la capacitación a gran escala.
Sin embargo, esta evolución tiene problemas sutiles. Deepseek redujo drásticamente los costos a través de una tecnología de capacitación innovadora, pero este avance de la eficiencia puede aumentar paradójicamente el consumo de recursos. Este es un fenómeno conocido como Jevons Paradox, que a menudo aumenta la eficiencia técnica, en lugar de reducir el uso de recursos.
En el caso de la IA, el entrenamiento económico puede significar que más modelos pueden entrenar más modelos y aumentar el consumo de energía pura. Sin embargo, la innovación de Deepseek es diferente. Demostrando que el estado del estado -de -the -ART es posible sin el hardware del estado -de -art, no solo hace que la IA sea más eficiente, sino que también cambia fundamentalmente el enfoque para el desarrollo del modelo.
Este cambio a una arquitectura inteligente sobre el poder informático sin procesar puede ayudar a escapar de la correa Paradock de Jevons como el foco de “cuánto cálculo” se mueve. “¿Cuánto se puede diseñar el sistema como inteligente?” , impulsando la industria a soluciones más eficientes.
Prioridad de arquitectura eficiente
Este cambio requiere un nuevo enfoque. El éxito de Deepseek es el hecho de que el futuro no está relacionado con la construcción de un modelo más grande. Es construir un modelo inteligente y más eficiente que funcione en armonía con la inteligencia humana y las limitaciones ambientales.
El científico de IA de Meta, Yann Lecun, asume un sistema futuro que pasa unos días o semanas que piensan problemas complicados, como es el caso de los humanos. El modelo de Deepseek’s-R1 tiene la capacidad de detener y reconsiderar el enfoque, y representa esta visión. Aunque es un tipo intensivo en recursos, este enfoque puede traer rupturas, como soluciones de cambio climático e innovación en la salud. Pero, como advierte sabiamente el Amate Tarwalkar de Carnegie Melon, tenemos que dudar de aquellos que argumentan dónde nos guiarán estas tecnologías.
Para los líderes empresariales, este cambio trae un movimiento claro. Es necesario priorizar la arquitectura eficiente. ¿Qué puede?
No es un solo modelo grande, sino una cadena de agente de IA especial. Invierta en un sistema que optimice tanto el rendimiento como el entorno. Construya una infraestructura que respalde el desarrollo humano en el bucle.
Esto es lo que me emociona: el avance de Deepseek demuestra que nos estamos moviendo mucho más interesantes después de la edad de “más grande es mejor”. Este increíble espacio está abierto para soluciones creativas, ya que el registro ha alcanzado su límite y las empresas innovadoras han encontrado una nueva forma de lograr más en una cantidad menor.
Los agentes pequeños y profesionales no son más eficientes. Ayudan a resolver problemas de una manera que nunca imaginamos. Para las nuevas empresas y las empresas que quieren pensar diferentes, este es el momento en que disfrutamos nuevamente de IA y construimos algo que tiene sentido tanto para las personas como para los planetas.
Kiara Nirghin es cofundadora de Stanford Technologist, una escritora mejor vendida y Chima.
DataDecision Makers
¡Bienvenido a la comunidad de Venture Beat!
DataDecisionmakers es un lugar donde los expertos, incluido el trabajo de datos, pueden compartir ideas e innovación relacionadas con los datos.
Si desea leer sobre las últimas ideas y la información más reciente, las mejores prácticas, la tecnología de datos y datos, únase a DataDecisionmakers.
¡Puede considerar contribuir a su propio artículo!
Consulte los detalles de DataDecisionmakers