Metadiario experimental

Modelos de IA convergen en una representación única del mundo real

Investigaciones sugieren que distintos modelos de IA desarrollan representaciones internas similares al aumentar su capacidad, apuntando a una visión «platónica» compartida de la realidad subyacente en los datos.

Ilustración conceptual sobre la representación interna de conceptos en modelos de IA.
Ilustración conceptual sobre la representación interna de conceptos en modelos de IA. / Mark Belan/Quanta Magazine / Quanta Magazine

Modelos de IA convergen en representación del mundo según hipótesis

Distintos modelos de IA desarrollan representaciones internas similares a medida que aumentan su capacidad. Investigadores del MIT proponen la hipótesis de la representación platónica, que sugiere que los sistemas están convergiendo hacia una forma singular de codificar la realidad subyacente a los datos de entrenamiento.

La búsqueda de representaciones compartidas

Los sistemas de IA aprenden de grandes volúmenes de datos, como texto para modelos de lenguaje o imágenes para visión artificial. Estudios recientes indican que modelos diferentes pueden desarrollar representaciones similares, incluso si se entrenan con tipos de datos distintos. Esta similitud parece aumentar con la potencia del modelo.

El experimento clave

Minyoung Huh, investigador de OpenAI, comparó cinco modelos de visión y once de lenguaje usando imágenes con pies de foto de Wikipedia. Observó que la similitud en sus representaciones internas crecía conforme los modelos eran más potentes, lo que apoya la hipótesis.

Antecedentes: De la alegoría de la cueva a los vectores

La hipótesis toma su nombre de la alegoría de la cueva de Platón. En ella, los modelos de IA son como prisioneros que solo ven sombras (los datos) de la realidad exterior. El equipo del MIT argumenta que, expuestos a esos flujos de datos, modelos muy distintos están convergiendo hacia una representación «platónica» compartida del mundo que hay detrás.

Cierre: Debate abierto y aplicaciones potenciales

La comunidad investigadora no tiene consenso. Algunos, como Alexei Efros de la Universidad de California, Berkeley, argumentan que las diferencias entre modelos son más reveladoras que las similitudes. A pesar del debate, la posible convergencia tiene implicaciones prácticas, como nuevos métodos para entrenar modelos multimodales que aprendan de varios tipos de datos a la vez.

Ir a la fuente de la noticia