Contenido del post
Vi hace poco una entrevista a Andrej Karpathy y se me quedó pegada una idea:
«Traditional computers automate what you can specify in code. LLMs can automate what you can verify.»
Los ordenadores tradicionales automatizan lo que puedes especificar en código. Los modelos de lenguaje, lo que puedes verificar.
Karpathy explica que los modelos actuales se entrenan con aprendizaje por refuerzo en entornos verificables: el modelo prueba una respuesta, algo evalúa si es correcta, el modelo aprende. Por eso son tan buenos en matemáticas, código, ajedrez. Y por eso son irregulares (jagged en sus palabras) en todo lo demás. Cuando el verificador es ambiguo o subjetivo, el modelo se queda atrás. Va un paso más allá y dice algo que merece pensarse despacio: que casi todo es eventualmente verificable, que la verificabilidad no es un binario sino un espectro, y que incluso la escritura puede evaluarse con un consejo de modelos jueces.
La pregunta que me asalta es directa: ¿es verificable un diseño?
Las capas que sí lo son
La respuesta no es ni un sí ni un no. Hay capas, y cada una se verifica de manera distinta.
La más básica es la de las heurísticas técnicas: contraste de color, tamaño táctil, jerarquía visual, cumplimiento de WCAG… esto se puede verificar con tooling automático. Una capa más arriba están las métricas de uso: conversión, tiempo de tarea, tasa de abandono, A/B tests con usuarios reales… aquí hace tiempo que delegamos buena parte del juicio al sistema.
Y aún más arriba están los principios establecidos por Dieter Rams, Jakob Nielsen, John Maeda… y también la coherencia con la marca, con el sistema de diseño… Esto entra en terreno más blando, porque dos diseñadores pueden interpretarlo distinto, pero sigue siendo razonablemente verificable. Un modelo entrenado puede revisar si un diseño cumple una serie de preceptos y discutirlo con argumentos.
Hay mucho del trabajo de diseño que se puede automatizar porque se puede verificar. Y probablemente se va a automatizar mejor que como lo hacemos nosotros.
Donde aprende un diseñador
Si uno mira con atención estas capas, hay algo que salta. Son justo las capas con las que se enfrenta un diseñador junior. La rejilla, el plugin de turno, el auto-layout bien construido, el componente que respeta los tokens, las heurísticas aprendidas hace tres semanas, las métricas que demuestran que el botón funciona mejor en azul. Es la capa donde se mide, donde se aprende, donde uno demuestra que sabe hacer su trabajo.
Y es justo la capa que se está automatizando primero porque es la más fácil de verificar.
Lo que diferencia a un senior no es que haga mejor estas cosas. Es que se preocupa por otras. Por si el diseño dice algo. Por si encaja con la historia de la marca. Por si va a ser leído como se pretende o de manera incómoda. Por una intuición de fondo, difícil de articular, que le dice que algo está bien o no, antes de poder explicar por qué.
Es lo que Michael Polanyi llamó conocimiento tácito: sabemos más de lo que podemos expresar adecuadamente.
Eso no se enseña en un bootcamp. No se enseña en ningún sitio, en realidad. Se acumula. Se metaboliza. Es lo que en otros posts he llamado poso: lo que entra al cuerpo de quien diseña con los años, con las lecturas, con los proyectos fallidos, con haber visto cómo envejecen las decisiones. La frontera de Karpathy, la que separa lo verificable de lo que no, lleva décadas existiendo dentro del oficio. La IA no la ha inventado. La está haciendo más visible.
Aquí aparece un giro incómodo. Si la capa verificable se automatiza, ¿de dónde van a salir los seniors? La carrera del oficio se construyó tradicionalmente subiendo desde lo verificable hasta lo que no lo es. Pasabas años aplicando heurísticas y operando dentro de sistemas, y en ese camino se te formaba el criterio. Si la primera mitad del trayecto la hace una máquina, ¿qué pasa con la formación del criterio? Quizá no llegue a templarse, porque era justo en esa práctica donde se entrenaba el ojo. Quizá, al revés, los juniors liberados de aplicar heurísticas a mano puedan dedicar ese tiempo a leer, mirar arquitectura, viajar, madurar el oficio y forjar su criterio.
Donde el verificador se rompe
Hay otra capa que no encaja en este marco.
¿Cómo verificas que un diseño tiene capas de significado? ¿Que dialoga con la historia del oficio sin imitarla? ¿Que el uso del espacio negativo es un guiño a la escuela suiza de los sesenta? ¿Que la elección tipográfica honra a Vignelli sin convertirse en pastiche? ¿Cómo verificas que un diseño emociona, que provoca curiosidad en el primer vistazo y revelación en el décimo? ¿Cómo verificas que un usuario, sin saber por qué, va a sentir que esto está bien hecho?
Y aún más difícil: ¿cómo verificas la lectura que va a hacer un stakeholder concreto? Un CEO, que viene del mundo financiero y desconfía instintivamente de lo limpio porque le parece vacío. Un inversor, que ha visto demasiados productos parecerse entre sí. Un socio fundador, que tiene un gusto formado en mil decisiones pequeñas y reacciona visceralmente antes de poder explicar por qué.
Aquí no hay verificador. O hay tantos como interlocutores. Cada uno trae una historia, una sensibilidad. El diseño se verifica en el ojo de quien mira.
El consejo de jueces
Karpathy diría que esto también es verificable, solo que más caro. Que se podría montar un consejo de modelos jueces. Uno entrenado en Rams, otro en Norman, otro en Maeda. Uno simulando a un CEO financiero, otro a un inversor, otro a un usuario de cincuenta años. En cierto modo es lo que ya hacemos cuando enseñamos un diseño a varias personas y procesamos sus reacciones. Lo que añadiría la IA es la escala.
Y sin embargo, queda una duda. Un modelo entrenado en la obra de Dieter Rams no es Dieter Rams. Es una proyección estadística de lo que dejó escrito y diseñado. ¿Puede esa proyección pensar lo que Rams pensaría?
La pregunta que queda
Si Karpathy tiene razón, la parte verificable del diseño se va a automatizar. Heurísticas, métricas, consistencia con sistemas, aplicación de principios. Lo que queda en manos del diseñador son las capas de significado, las elecciones culturales, la intuición sobre lo que se va a sentir antes de que nadie pueda explicar por qué. Lo que en Gesamtkunstwerk llamé poso.
¿Es la parte no verificable del diseño el núcleo del oficio lo que nos vuelve insustituibles? ¿O es solo el resto que aún no se ha verificado hasta que un consejo de jueces virtuales lo haga también suficientemente bien?
Tengo la intuición de que es lo primero. Y quizá esa intuición, justamente, es de las cosas que no se pueden verificar.
–
Sígueme en LinkedIn para estar al tanto de nuevas publicaciones.
–
Referencias:
Andrej Karpathy: From Vibe Coding to Agentic Engineering (YouTube)
Gesamtkunstwerk (artículo anterior)