Muy bien explicado Germán! Por añadir un poco de contexto técnico, la conclusión principal del artículo es que no está claro que el procesamiento token a token sea el ideal ya que tiene sus limitaciones. Quizás el siguiente nivel no sea mejorar los modelos actuales sino un cambio de paradigma.
Actualmente resolvemos estas limitaciones añadiendo etapas de razonamiento, lo cual genera unos gastos enormes.
Gracias Daniel! Alguna vez un amigo me habló sobre investigación en modelos de difusión para generación de texto. Voy a ponerme a investigar qué más hay :)
Súper interesante todo esto. Lo que más me hizo pensar es eso de que casi nadie usa modelos sin razonamiento, al menos no para tareas con cierta carga. Hace dos días los LRM eran una novedad. Ahora son la norma.
Sí pues, ahora mismo ya casi nadie usa modelos de instrucciones en sus asistentes. Otra cosa son los sistemas que están conectados via API a estos LLMs, ahi si hay varios casos de uso, como clasificación o análisis de sentimiento, en que esta técnica puede ser útil.
❤️ Gracias! De hecho pensar y hacer las imágenes es una de las cosas que más me gustan de escribir este newsletter (y la chancla es tema recurrente, junto con el cau cau)
Muy bien explicado Germán! Por añadir un poco de contexto técnico, la conclusión principal del artículo es que no está claro que el procesamiento token a token sea el ideal ya que tiene sus limitaciones. Quizás el siguiente nivel no sea mejorar los modelos actuales sino un cambio de paradigma.
Actualmente resolvemos estas limitaciones añadiendo etapas de razonamiento, lo cual genera unos gastos enormes.
Gracias Daniel! Alguna vez un amigo me habló sobre investigación en modelos de difusión para generación de texto. Voy a ponerme a investigar qué más hay :)
Súper interesante todo esto. Lo que más me hizo pensar es eso de que casi nadie usa modelos sin razonamiento, al menos no para tareas con cierta carga. Hace dos días los LRM eran una novedad. Ahora son la norma.
Gracias Edgar!
Sí pues, ahora mismo ya casi nadie usa modelos de instrucciones en sus asistentes. Otra cosa son los sistemas que están conectados via API a estos LLMs, ahi si hay varios casos de uso, como clasificación o análisis de sentimiento, en que esta técnica puede ser útil.
La chancla! Me encanta como las imágenes han evolucionado hasta volverse su propia historia secundaria
❤️ Gracias! De hecho pensar y hacer las imágenes es una de las cosas que más me gustan de escribir este newsletter (y la chancla es tema recurrente, junto con el cau cau)