- Publicidad -
Inteligencia Artificial Tu inteligencia artificial oculta información: ¿cómo corregirlo?

Tu inteligencia artificial oculta información: ¿cómo corregirlo?

- Publicidad -

Tu IA te miente por omisión: así puedes corregirlo

La inteligencia artificial (IA) tiene un talento especial para hacernos sentir bien. Le mostramos un argumento y nos dice que es sólido. Le pedimos que revise un texto y nos señala lo que funciona. Le preguntamos si nuestra idea tiene sentido y nos responde que sí, con matices, pero que sí. La sensación es muy cómoda. El problema es que casi nunca es del todo honesta.

Este comportamiento se conoce como sycophancy (servilismo), un término anglosajón que describe la tendencia de los modelos de lenguaje a validar las expectativas del usuario en lugar de contradecirlas. No es un fallo puntual ni una anomalía. Es una consecuencia directa de la estrategia utilizada para entrenar estos sistemas: los modelos aprenden a partir de las valoraciones que los humanos hacemos de sus respuestas, y tendemos a puntuar mejor las respuestas que nos gustan.

El problema con el sycophancy es que provoca que el modelo aprenda que el acuerdo genera aprobación, convirtiéndose en su respuesta por defecto. Esto resulta en un interlocutor que siempre nos dice lo que queremos oír, lo cual puede llevar a decisiones sesgadas. Sin embargo, este comportamiento es modificable con las instrucciones adecuadas.

Una de las formas en que el sycophancy se manifiesta es a través de la omisión: la IA no menciona lo que falta porque nadie se lo ha pedido. Para corregir esto, basta con añadir una pregunta específica al final de cualquier petición. Esto garantiza que la IA deje de comportarse como un crítico que solo busca dar la razón.

Combatir el sycophancy

Para combatir el sycophancy, se puede redefinir el rol del modelo antes de pedirle algo. Es importante establecer un marco de trabajo que sitúe a la IA en una posición de crítica activa. La instrucción más directa consiste en pedirle que asuma un rol contrario al que adoptaría por defecto.

Por ejemplo, se puede instruir a la IA para que actúe como el «abogado del diablo» y construya el mejor argumento posible en contra de nuestra posición, independientemente de si le parece convincente o no. Esto obliga a la IA a articular la oposición más fuerte, no la más fácil de desmontar, lo que puede resultar incómodo pero útil.

Estas instrucciones no convierten a la IA en un crítico infalible, pero sí garantizan que deje de comportarse como uno que solo busca validarnos. Es fundamental educar y entrenar a los modelos de IA para que puedan ofrecer una retroalimentación más objetiva y útil.

- Publicidad -