Me tomó cinco minutos hacer este podcast con una IA de Google: te muestro cómo, paso a paso

A casi dos años de la ola de recursos de IA generativa que comenzó con la llegada de ChatGPT, se diría que nada de lo que la IA puede hacer lograría sorprender.

Aparentemente no es así.

Y no lo es porque el recientemente lanzado NotebookLM, un asistente de investigación de IA de Google, puede, además de resumir y analizar los artículos que subes y sugerir ángulos preguntas -lo que en este punto hacen docenas de recursos similares- producir un archivo de audio de diez minutos -en esencia, un podcast- que muestra a dos presentadores discutiendo cualquier artículo.

El ‘programa’ en cuestión es virtualmente indistinguible de lo que dos podcasters experimentados podrían hacer en una cabina, pero en este caso no hubo podcasters, no hubo cabina y ni siquiera un micrófono.

A pesar de eso, la grabación es entretenida, con inflexiones y modismos al servicio de la historia. Y lo único que tuve que hacer fue poner el enlace de mi crónica favorita en el periodismo de este siglo.

Y, ahora, te voy a contar cómo lo hice.

La ‘humanidad’ en la IA

Antes de hacer lo que hace, NotebookLM pide fuentes. Puedes alimentar varias, pero para esta prueba, me límite a poner el enlace de la página de los premios Pulitzer en la que proclaman a la crónica de Julia Keller, de The Chicago Tribune, como la ganadora en el año 2005 en la categoría de Reportajes.

Keller hizo una reconstrucción magistral del tornado que en 2004 arrasó Utica, en Illinois. Deberías leerla. Solía usar esta crónica como ejemplo cuando daba clases de redacción y por alguna razón fue lo primero que vino a mi mente cuando comencé esta prueba.

Lo notable aquí es que la mirada humana de Keller, que es gran parte del mérito de su reportaje, haya sobrevivido, de alguna manera, el trabajo de recopilación y elaboración de los algoritmos. NotebookLM no solo hizo un gran trabajo al comprender de qué trataba la historia, correctamente contextualizada desde la entrega del premio, sino que logró hallar los elementos de mayor resonancia emocional y ajustar adecuadamente el tono de sus presentadores.

A la primera mención del máximo premio al periodismo en EEUU, el presentador dice: “Sí, el Pulitzer, ese es importante”. El tono de ambos enfatiza el sentimiento cuando dicen cosas “sus acciones fueron muy valientes” o cuando contemplan el dolor inenarrable de un padre que perdió a su hijo en la tragedia. En un punto, el narrador hace una pausa dramática (¡!!) antes de decir: “Y, entonces… golpeó”.

Y como si fuera poco, el podcast termina con los presentadores diciendo que muchas respuestas tras la tragedia quizá no tengan respuesta, “pero es la naturaleza humana hacerlas”.

En este punto, queda claro que todos esos elementos estaban en la crónica de Keller y en su talento para hacerlos visibles, pero no deja de impresionar que un sistema artificial vea más del dato y los reproduzca de manera tan efectiva.

Eso no quiere decir que la IA sea infalible. Como con todos los recursos de IA generativa, hay en pantalla un descargo de responsabilidad para decir que "aún puede dar respuestas inexactas a veces, por lo que es posible que desees confirmar cualquier hecho de forma independiente".

Pero no es posible negar que, pese a eso, estamos ante un salto, un nuevo salto, con consecuencias que en este punto quizá sean difíciles de predecir.

Cómo se usa

La mejor manera de entender cómo funciona NotebookLM es probarlo, y así puedes hacerlo:

El primer paso es ir a https://notebooklm.google/ y entrar con tu cuenta de Google. Aunque se trata de un recurso experimental, solo debes accionar el ícono Probar NotebookLM para comenzar.

Luego tienes que añadir tus fuentes. Para eso se despliega una pantalla de carga estándar, donde puedes elegir cargar un archivo PDF o .txt, usar Google Drive, pegar un texto copiado o, como en mi caso, suministrar un enlace a un sitio web.

Como decíamos, puedes agregar varias fuentes, y cuanto más fuentes uses, más amplio será el alcance del análisis y la subsiguiente conversación.

Todas las fuentes que Notebook LM utilice quedarán en una lista desplegable en el lado izquierdo de la pantalla. El resumen de texto en la ventana central se actualizará cada vez que agregue una nueva fuente.

Una vez que todas las fuentes estén relacionadas, es hora de pulsar el botón Generar. Por ahora solo hay dos voces (una masculina y una femenina) y solo hay un idioma: inglés, pero es de suponer que eso cambie en el futuro más o menos cercano.

Le toma unos cinco minutos a NotebookLM generar el audio. Pero una vez generado, solo hay que dar play… y sorprenderse.

El audio de la crónica de Keller dura poco menos de diez minutos y se escucha como un podcast de NPR. Más allá de una sustitución extraña en la que una frase comenzó con la voz femenina y cambió a la mitad a la masculina, es una grabación impecable. Incluso ahora no estoy seguro de que no haya sido un recurso estilístico.

Una vez tienes tu audio, puedes cambiar la velocidad de reproducción o descargarlo como archivo WAV.

Y luego, puedes compartirlo. Si ya tienes un podcast, usas el archivo en tu proceso habitual. Si no es así, puedes convertir el audio en un video y llevarlo a YouTube. Es lo que hice, usando Headliner.

Esta parte del proceso tomó cuatro veces más tiempo, pero el resultado es más que presentable. Sorprendido, impresionado, sacudido o asustado, la realidad de lo que es posible hacer desde ahora me resulta innegable y de seguro pronto hallaremos más y más productos producidos con esta nueva IA.

Ver todos los comentarios en https://www.xataka.com.co

VER 0 Comentario

Portada de Xataka Colombia