La escritura académica a menudo tiene la reputación de ser difícil de seguir. Pero ¿Qué pasaría si pudieras usar el aprendizaje automático para resumir argumentos en artículos científicos para que incluso un niño de siete años puediese entenderlos? Esa es la idea detrás de Tl;dr Papers que aprovecha los avances recientes en el procesamiento del lenguaje de IA para simplificar la ciencia.
El trabajo en Tl;dr Papers comenzó hace dos años por los amigos universitarios Yash Dani y Cindy Wu. Se inició como una forma de «aprender más sobre el desarrollo de software«. El servicio se volvió viral en Twitter durante el fin de semana cuando los académicos comenzaron a compartir resúmenes de IA de su investigación. Los resultados generados por IA a veces son inexactos o simplificados hasta el punto de la idiotez. Pero con la misma frecuencia, son satisfactoria y sorprendentemente concisos, cortando la jerga académica para ofrecer lo que podría confundirse con sabiduría infantil.
Veamos un ejemplo de resumen de Tl;dr Papers.
Seleccionamos un resumen de un artículo sobre el concepto del «Glass Ciff» o «Acantilado de cristal«. Es una forma de discriminación de género en la que las mujeres ocupan puestos de liderazgo en momentos en que las instituciones corren el mayor riesgo de fracasar. ¿Cuál fue el resultado del resumen? “El acantilado de cristal es un lugar donde se mete a muchas mujeres. Es un mal lugar para estar”.
El resumen fue «preciso y conciso», aunque eliminó muchos matices en torno al concepto. En parte, esto se debe a una advertencia crucial. Tl;dr Papers solo analiza el resumen de un artículo científico, que es en sí mismo una versión condensada del argumento de un investigador. (Ser capaz de condensar un documento completo sería un desafío mucho mayor. Aunque es algo en lo que los investigadores de aprendizaje automático ya están trabajando).
Aunque sin duda es una herramienta muy divertida, también ofrece una buena ilustración de cómo debería ser una buena comunicación científica. Creemos que muchos de nosotros podríamos escribir de una manera que sea más fácil de leer. Y el público dentro de la franja de los 7 años es un buen lugar para empezar.
Hay opiniones que describen los resúmenes Tl;dr Papers como «refrescantes y transparentes». Un usuario opina: «Usé el sitio para condensar un artículo que había escrito sobre «periferias de datos «, que rastrea la historia física de los materiales esenciales para la infraestructura de Big Data». el resultado fue increible.
Los grandes datos de Tl;dr Papers se almacenan en unidades de disco duro.
Inicialmente los resúmenes de Tl;dr Papers parecen más una broma que una aplicación científica. Pero sistemas como este podrían tener serias aplicaciones en la enseñanza y el estudio. Los estudiantes podrían utilizar los resúmenes de IA como una forma de elaborar documentos complejos. O podrían incorporarse a revistas en línea, produciendo automáticamente resúmenes simplificados para el consumo público. Por supuesto esto solo debe hacerse si se enmarca correctamente y se discuten las limitaciones. Y lo que significa usar el aprendizaje automático como una herramienta de escritura.
Las herramientas de lenguaje de IA se han incorporado al software de Microsoft y Google
Las empresas que fabrican estos sistemas de IA aún están explorando estas limitaciones, incluso cuando el software se incorpora a herramientas cada vez más convencionales. Tl;dr Papers se ejecutó en GPT-3. Es una de las herramientas de escritura de IA más conocidas y está hecha por OpenAI, un laboratorio de investigación combinado y una empresa emergente comercial que trabaja en estrecha colaboración con Microsoft.
Microsoft ha utilizado GPT-3 y otros similares para crear herramientas como software de autocompletado para codificadores y recientemente comenzó a ofrecer a las empresas acceso al sistema como parte de su suite en la nube. Tl;dr Papers dice que GPT-3 se puede usar para analizar el sentimiento del texto, generar ideas para negocios y, sí, condensar documentos como las transcripciones de reuniones o intercambios de correo electrónico. Y ya se están utilizando herramientas similares a GPT-3 en servicios populares como Gmail y Docs de Google. Con ello ofrecen a los usuarios funciones de autocompletado impulsadas por IA.
Pero el despliegue de estos sistemas de lenguaje de IA es controvertido. Una y otra vez, se ha demostrado que estas herramientas codifican y amplifican el lenguaje dañino en función de sus datos de entrenamiento. Generalmente son solo grandes volúmenes de texto extraídos de Internet. Repiten estereotipos e insultos racistas y sexistas y también pueden estar sesgados de maneras más sutiles.
Todo es cuestión de tiempo que esta IA llegue a buen puerto y nos sirva para infinidad de utilidades en nuestro día a día.