edición general
11 meneos
54 clics

Nvidia afirma que el éxito de DeepSeek demuestra la importancia de sus chips

El gigante estadounidense ha señalado en un comunicado que el éxito de DeepSeek demuestra la utilidad de sus unidades de procesamiento gráfico (GPU) y que se necesitarán más para dar respuesta al crecimiento del grupo chino

| etiquetas: nvidia , deepseek
#1 La compañía asiática ha utilizado para lanzar R1, su modelo de razonamiento de código abierto, 2.000 chips H800 de Nvidia, los cuales son menos avanzados que los utilizados por las firmas norteamericanas pero cumplen con las restricciones a exportaciones impuestas por Estados Unidos en 2022.”
Sacado de la noticia, algo de razón tiene :troll:

De todas maneras, esto huele a churros , mas que las baterías milagrosas semanales

Va estar interesante el mercado esta semana
#6 Eso son solo 2 millones en chips. ALIA seguramente ha sido mucho más cara.
#10 Por 2 millones no pillas 2000 H800 ni de broma. Con mucha suerte las pillas por 20k cada una. Recuerdo ver noticias que llegaban a hablar de 70k por cada H800
#10 no veo que esos chips bajen de 35-40k en el mercado

Digamos que tienen un precio reducido de 20k como dice #13, ahora haz las cuentas :popcorn:
#13 #19 Ya veo, no se que habría buscado antes que me salía por 1.000€. :palm:
No sé .. por un momento me parece estar escuchando al CEO de Volkswagen. :roll:
#16 Pues entonces puedes invertir sin ningún problema.
invezz.com/es/indice/hang-seng/
#9 Solo no soy ezpañistani.
Y prefiero ser rojo a fascista.
#30 te das cuenta de que yo estoy hablando de ejecutarlo? No de entrenarlo.

Muy cobarde eso de "no le hagas caso" sin citarme.

#27
#34 Perdona, no debería haberlo hecho. No estaba en mi mayor momento de lucidez.

Lo leo ahora y es bastante ofensivo, desde luego no lo escribí bien. Tendría que haberlo hecho mejor.

Te pido disculpas, no estuvo nada bien.
#35 lo siento no volverá a ocurrir.

xD

Una cervecita? xD
#36 Y si son pequeñas, dos

¿Convences tú a mi mujer para que se quede con mis hijos? Llevamos encerrados enfermos un mes, está ansiosa por quedarse más con ellos :-D
#37 jajaja

Que os ha pasado? Covid?
#38 Todo menos covid.

Nada detectable por pruebas, por muchos palitos que nos metiéramos y le metiéramos a una niña de tres años por la nariz. Los cuatro hemos hecho cola y cuando soltaba la fiebre uno la cogía el otro. Menos mi mujer que decidió cogerlo dos veces.

El lunes fue el primer día del año sin que nadie tuviera fiebre, en ocasiones alta.

En fin, la vida. Medio año enfermos y medio año luchando contra hormigas y mosquitos. Qué se le va a hacer.
#39 Pues a mejorarse
#40 ¡Gracias majo!
No entiendo las risas con Nvidia. ¿Qué os pensáis que ha usado DeepSeek? Pues H100s de contrabando.
#24 no logro encontrar la fuente de donde lo leí, y leo a diario todos las comunidades de reddit sobre llm etc... Pero una cosa es lo que un modelo ya generado necesita para funcionar que el deepseek está muy optimizado y corre en poco Hardware y otra como se genero el modelo y ahí entran sus gráficas etc.. Y tb sus innovaciones y su dataset para generarlo que ese dataset es donde más dinero se ahorraron.asi que crearlo fue barato, y corre en maquinas menos potentes y por eso puede ser tan barato. Pero deepseek esta lejos de ser un agi, si hubieran tenido el Hard de openai dios mío... Lo qie hubieran sacado.
Como invierto en bolsa china?
Apps?
Tengo algo en Hapi
#2 ¿Tienes cuernos y rabo? Si no nada.
#4 No entendi.
#24 medium.com/@namnguyenthe/deepseek-r1-architecture-and-training-explain aquí lo explican lo he dicho mal no es el dataset sino el finetuning que en vez de ser supervisado por humanos usan otras técnicas
#26 Pero en #23 te equivocaste. No entrenaron a las IA con otras IA.

Tomaron una aproximación diferente que se suponía que no daba buenos resultados, no es entrenamiento guiado. Si no necesitas cientos de currelas haciendo verificaciones manuales sale todo mucho más barato.
#28 en todo caso se han saltado un paso muy caro que no está relacionado con el uso de chips de nvidia sino de humanos.
juas!!!!
Pregunta desde la ignorancia. ¿Para mover está IA no hacen falta gráficas? ¿Por qué bajan las acciones de Nvidia entonces?
#5 Porque han conseguido por 4 duros una ia más potentes que las que tiene google, x o meta. Y esas empresas tenian pensado invertir una fortuna en chips de Nvidia porque creían que el desarrollo de la ia estada directamente ligado a la potencia del hardware.
Deepseek les ha demostrado que no es así y muy probablemente esas empresas paralicen las inversiones millonarias.
#8 #11 #20 #12 Deepseek no ha demostrado qie no hace falta mejores gráficas ni mejores chips, ha demostrado que puede conseguir muy buenos resultados sin ellas pero los hubiera tenido mucho mejores con ellos. Su truco está en que han entrenado su ia con datos generados por otras ias, en ves de pagar a expertos para generar su dataset... Y por eso les ha salido tan barato.
El bajón de nvidia solo lo achaco a ignorancia, a recogida de beneficios. El poder de cálculo sigue siendo importante, y lo sera siempre. Solo ha ocurrido que se ha descubierto como conseguir lo mismo con menos, pero aún estamos lejos de la meta aún necesitamos mejor ia y no será sin los mejores chips
#23 Creo que te equivocas con respecto a la enseñanza sintética generada para las IA de qwen y llama y el aprendizaje de su propia inteligencia, que lleva siendo desarrollada desde 2008 según la Wikipedia. Creo que el aprendizaje desarrollado con base en un país de 1200 millones de personas da para mucho más que un “simple truco” de generar aprendizaje sintético de otras IAs. Por lo menos yo no lo he entendido así.
#5 entiendo que se creía que para ia necesitabas los últimos modelos y Nvidia tenía casi monopolio de las que necesitas para desarrollar ia, y puede ser que con la deepseek no es necesario estos últimos modelos y puedes desarrollarlo con modelos más antiguos y baratas, incluso podría desarrollar con modelos chinos más baratos (no tengo ni idea de informática), en resumen entiendo que con deepseek la necesidad de estos últimos modelos monopolio o quasi monopolio y más costosas ya no es 100% necesarias, para cubrir una necesidad surge un instrumento más económico y del que ya más empresas/países pueden fabricar
#11 Los chinos llevan invirtiendo en capital humano vía universidades de matemáticas, física, química, biología, ingenierías más de 30 años.

Occidente en cambio y EEUU a la cabeza llevan 30 esquilmando a sus ciudadanos incluso antes de empezar a trabajar con deudas astronómicas sólo para estudiar.

No es de extrañar que en 2024 hayan superado en publicaciones científicas y registro de patentes. Ahora EEUU pondrán un montón de dinero para demostrar a todo el mundo mediante titulares sensacionalistas que van a ser los mejores del mundo, pero en pocas semanas todo será olvidado o descartado por unos políticos o empresarios depravados que no tienen ningún interés más que el beneficio propio.
#20 Lo que dices no tiene sentido, no está sustentado con datos.

Si llevasen treinta años invirtiendo en universidades no tendrían tan solo 2900.

En la UE hay 5700

Si llevasen treinta años invirtiendo fuertemente en universidades, para su población, multiplicarían el número de universidades en la UE.

Para su extensión de terreno y población el número de universidades en china es muy bajo. Pero hay que entender que es normal, es un país en vías de desarrollo, con salarios muy bajos, pocos…   » ver todo el comentario
#5 Porque la bolsa siempre quiere ganar mas, en este caso produciendo mas, vendiendo mas y consumiendo mas. Esta IA hace mas con menos, con lo cual las espectativas de ventas han caido.
#5 Las IA que había hasta ahora, necesitaban los tensor core, unos núcleos especializados en IA.
Esas GPU eran costosas de fabricar, y aunque se podía, el rendimiento para otras cosas (jugar) no era óptimo, como cuando les dio por hacer GPUs para minar bitcoin (los asic)

Ahora resulta que deepseek funciona bien en gráficas normales, cpus (con mucha ram) o incluso en una raspberry pi.

Y eso hace saltar por los aires toda la investigación en los AI core, haciendo que evidentemente, la empresa pierda valor.
#15 Pues entonces el avance es aún mayor de lo que imaginaba. Gracias por la explicación.
#27 No le hagas mucho caso. Para entrenar esta IA han usado menos chips de los habituales pero en la misma noticia dicen que han usado 800 chips de Nvidia y cada uno cuesta al menos treinta mil dólares.

No han usado CPU normales. Han usado GPU profesionales pero no tan caras como para haber sido bloqueadas aún por EEUU


La razón es que la bolsa es una vergüenza.


www.theguardian.com/business/2025/jan/27/what-is-deepseek-and-why-did-

Nvidia lleva lanzada en bolsa…   » ver todo el comentario
#30 #27 Dejo este hilo de reddit, explican bastante bien por qué es más barato que otros modelos. Pero básicamente es lo que te he comentado, han encontrado una forma de hacer lo mismo con menos GPU.

www.reddit.com/r/ArtificialInteligence/s/2cOurKqzhf
¿Una raspberry pi de 1,5 Terabytes de RAM y 8 GPUs? Mola
Habrá que decir algo para parar la bajada de bolsa
comentarios cerrados

menéame