ESCRIBIR,
EDITAR
y otras labores
entre máquinas
Eduardo Graells-Garrido�Departamento de Ciencias de la Computación�Universidad de Chile�IA centrada en las personas (RL5), CENIA
El Profe
Eduardo “Zorzal” Graells-Garrido
Profesor: Visualización de Información, Computación Gráfica
Investigador: Movilidad urbana
Editor: Trazos de Aves
Autor: Lloré sin consuelo sobre tu cuerpo eléctrico
Autista: en general, me llevo mejor con las máquinas que con las personas
Lectura: El taller imaginario
Tabla
¿Por qué debería {interesarme, preocuparme} por la Inteligencia Artificial generativa?
¿Cómo funciona la I.A. generativa?
¿Qué cosas {sí, no} {puedo, debo, necesito} en el mundo editorial?
¿Qué cosas {sí, no} {puedo, debo, necesito} hacer como escritor(a/e)?
Manos a la obra
Los por qué
¿Por qué preocuparme?
Yo ya me siento reemplazado en algunos aspectos.
Pero no son los que se imaginan en primera instancia.
Hay otros temas para preocuparse:
Pero esta charla no se focaliza en esos temas sino en cómo podemos acercarnos a la IA desde el mundo editorial y la literatura.
¿Por qué usarla?
Nos permitirá ahorrar tiempo y esfuerzo
Escribir (algunas cosas)
Leer (algunas cosas)
Analizar y profundizar (algunas cosas)
Hacer pruebas de concepto
¿Por qué adaptarse?
Lo cierto es que, queramos o no, seguirá avanzando
El mundo editorial ha conocido revoluciones:
Disrupción y revolución IA: ¿en costo o en calidad de creación?
¿Por qué aprovecharla?
¿Por qué no nos va a reemplazar?
Un modelo de lenguaje no entiende
Un modelo de lenguaje no entiende lo que lee
Un modelo de lenguaje no entiende lo que significa una emoción
Solo sabe que algunas palabras van juntas
Pero no conoce el dolor ni la pérdida ni tiene experiencias <- no hay factor humano por muy “humano” que parezca el resultado
¿Por qué somos sus usuaries ideales?
Porque sabemos dar instrucciones
Sabemos sugerir cambios
Sabemos leer entre líneas
Sabemos discriminar entre opciones
Sabemos cuestionar y verificar
Los cómo
¿Cómo le digo a la máquina lo que quiero?
Todo comienza con un prompt o instrucción
Escrito en lenguaje natural
Usualmente en inglés.
Escribe un poema de antipoesía donde cada verso termina con "imaginario" y el título es "El taller de inteligencia artificial imaginario", donde "El taller" se refiere a un grupo de personas que quiere aprender sobre usos y oportunidades de la IA en el mundo editorial.
Prompt�Ilustración de un zorzal patagónico (turdus falcklandii) hecho con piezas de computadora con fondo blanco
Illustration of an austral thrush (turdus falcklandii) made of spare computer parts, white background
¿Cómo genera las imágenes?
“Difusión de ruido”
El mecanismo para generar imágenes
“Difusión de ruido”
Probemos con blind men and elephant
Nuestro prompt explota lo local y lo global. Pero un modelo no es capaz de interpretar bien la intención detrás. Además, re-escribe lo que le pedimos. Ejemplo en leonardo.ai.
Cambiar las opciones genera otros prompts similares, pero sigue sin captar la idea.
Incluso en esta opción el resultado es irrisorio.
Son imágenes técnicamente impresionantes de pésima calidad.
¿Cómo genera texto?
🦜 Se basa principalmente en predecir la(s) siguiente(s) palabras de un texto:
El mecanismo para generar texto
¿Qué sigue?: Chipi Chipi -> ¿[...]?
El mecanismo para generar texto
¿Cuáles herramientas existen?
ChatGPT de OpenAI <- texto e imagen (DALL-E)
Claude.ai de Anthropic <- texto y artefactos. Recomendado: chipi chipi-enabled.
Midjourney <- imágenes. Es probablemente la más conocida. Ha reconocido que no respeta ni respetará derechos de autor.
Leonardo.ai <- imágenes. Presumiblemente respeta derechos de autor.
¿Cómo fue posible esto?
Con muchos datos.
Todo lo que se pueda encontrar y descargar en la red
-> Wikipedia, medios, blogs, redes sociales, foros...
Algunas empresas lo usan todo de manera indiscriminada.
Otras respetan los derechos de autor en la medida de lo posible.
Es un problema abierto.
Ojo con los datos I: Estos locos modelos
No se puede identificar un texto generado por IA de uno humano.
Los modelos se ajustan con el texto que hay en la red.
La red cada día tiene más texto generado por modelos.
La autofagia de modelos es real y, si no se controla, los resultados de lo que generan serán de peor calidad.
Ojo con los datos II: ¿Cómo proteger los míos?
-> Si son imágenes, se pueden “contaminar” sin alterar la percepción humana
-> Si es texto es más difícil... porque alterar el texto altera nuestra lectura
-> Se puede intentar bloquear el acceso de los “robots” que descargan contenido, pero nada asegura que funcione (esto se llama “configurar ROBOTS.TXT” y se usa para decirle a los buscadores qué se puede descargar de un sitio)
-> ¿sabes si usarán tus datos para entrenar la nueva versión del modelo?
-> ¿tu contrato de edición te da permiso para subir los datos a una IA para su análisis?
Glaze es una herramienta para proteger imágenes utilizando “contaminación”.
Ojo con los datos III: Sesgos
Las personas tenemos sesgos
Las IAs tienen más
¿Cómo sabes si el contenido que genera una máquina no tiene sesgos incluso más acentuados que los tuyos?
No solo hay sesgos raciales, de género o de edad.
También los hay de disponibilidad de contenido.
Prompt�Ilustración de un zorzal patagónico (turdus falcklandii) hecho con piezas de computadora con fondo blanco
Illustration of an austral thrush (turdus falcklandii) made of spare computer parts, white background
Robin Americano�turdus migraturius
Robin Europeo�erithacus rubecula
Como el modelo no entendía turdus falckandii me daba un pajarito con colores ná que ver
Los qué
¿Qué hacer con imágenes generadas?
¡No publicarlas!
-> Los modelos basados en imágenes no respetan los derechos de autor incluso si dicen hacerlo.
-> Las imágenes resultantes no tienen copyright.
-> Incluso pueden denunciarles en la red y dichas denuncias se pueden viralizar.
-> Los sesgos en la base de datos hacen que conceptos locales no representen a la realidad (¡y qué decir de grupos no heteronormados!)
Dicen que no hay mala publicidad.
Pero caer en el ridículo incluso puede afectar las ventas.
Además, la imagen es de mala calidad.
Como no tienen copyright, no se pueden registrar.
¿Qué podría hacer con imágenes?
-> Usar un modelo que no se haya entrenado con imágenes con derechos de autor (muy difícil de garantizar)
-> Realizar pruebas de concepto (como ver si la descripción de un personaje de mi novela evoca cierta imagen, ejemplo hecho con Leonardo.ai)
En lo personal: ya no uso estos modelos porque precarizan la industria.
¿Qué hacer con el texto?
¿Escribirlo? Dependerá de lo que quieras escribir. Contenido original, no es buena idea
¿Traducirlo? Puede traducir palabras y frases, pero no expresar sentimientos ni imágenes
¿Corregirlo? No
Mi parte favorita: iterarlo.
¿Escribir?
Según Ted Chiang, ChatGPT escribe un promedio de todo lo que sabe (lo que está en la Web).
Como el poema que les leí, puede ser un ejercicio simpático.
Pero no destaca ni tiene valor literario.
¿Escribir?
Podemos escribir algo acotado, o bien, usarlo como apoyo.
¿Escribir?
"Parece que se ha malinterpretado la historia de que la obra premiada de Rie Kudan se escribió utilizando IA generativa... Si lo lees, verás que la IA generativa se mencionaba en la obra"
Perspectiva personal: usé herramientas para apoyar mi proceso, pero definí, elegí y escribí cada palabra (tanto de manera manuscrita como digital).
Una anécdota personal
Eduardo, mi frase favorita de tu novela es [...]
-> Giro en la trama: fue una frase que hice con GPT3 (antes de ChatGPT)
-> Segundo giro: fue una frase en la que el modelo se equivocó porque no le hizo caso al prompt
¿Escribir?
Hay que tener cuidado.
En algunos casos podrías terminar incorporando texto con derechos de autor.
Generative AI Has a Visual Plagiarism Problem - IEEE Spectrum
¿Escribir?
Hay que tener cuidado:
Un modelo de IA es chamullero y en algunos casos no sabe que lo está siendo.
En este caso lo advierte, pero no puede saberlo.
¡Estos tres papers no existen!
¿Corregir?
No lo recomiendo.
Después de revisar cuidadosamente el texto, no encuentro errores gramaticales u ortográficos significativos. El estilo es consistente y adecuado para una historia de ficción especulativa. Sin embargo, hay algunos pequeños detalles que podrían mejorarse:
Estos son detalles menores y el texto en general está bien escrito y es coherente. Las correcciones sugeridas son más bien ajustes de estilo que errores propiamente dichos.
(Análisis del relato DEUS EX MACHINA, de Eduardo Graells-Garrido, por Claude 3.5 Sonnet)
¿Traducir?
Es riesgoso. Pareciera que un modelo puede traducir, pero el resultado no es de calidad literaria.
-> Idioms suelen ser traducidos�de manera literal.
¿Qué considerar?
Si conocemos las limitaciones del modelo podremos sacarle más provecho.
Ejemplo: ventana de contexto <- ¿cuánto texto puede considerar para generar más texto?
Si la ventana se te acaba, el modelo pierde tus instrucciones (¡pero no te dirá que se le acabó la ventana!)
-> ChatGPT: ventana de contexto pequeña (grande en modelo pagado: ~100 mil palabras)
-> Claude: ventana de contexto enorme (en modelo base: ~150 mil palabras). Le pasé mi antología GAME OVER completa y me ayudó a organizar los textos para la segunda edición.
-> Google Gemini: la versión pagada tiene la ventana más grande (~1 millón de palabras), pero no la he probado.
Entender e iterar
Este es un gráfico generado por Google Gemini que toma los primeros 5 libros de Harry Potter y crea una red de relaciones.
Más que escribir desde cero, un modelo nos provee herramientas para ver qué es lo que contiene (o no) un texto.
E iterarlo.
¿Con qué tener cuidado?
Con no verificar la calidad del resultado
-> el modelo es bueno en promedio, pero puede ser muy malo en usos específicos
Con “reemplazar personas” (por ej.: corrección, traducción, ilustración)
-> no solo precariza la industria sino que el resultado es de mala calidad (al menos hoy).
-> mi “hot take” es que no mejorará mucho más y la gente que dice que sí tiene intereses creados
Problema para editores/as
Aumento explosivo en volumen de obras que se envían.
Aumenta el volumen y disminuye la calidad (ej: Clarkesworld).
Si vendes en Amazon, ¡ya es más difícil encontrar tu obra!
La parte más entrete
Ejemplo: Reformular un correo electrónico
Así podemos asegurar el tono deseado. Podemos ser más convincentes o más amables.
Correo: “Este material es como las ..., pero a la larga es weno”
-> Resultado amigable: “Aunque al principio este material puede parecer complicado, con el tiempo se aprecia su verdadero valor y utilidad”
-> Resultado convincente: “Este material es una excelente inversión - difícil al principio, pero sus beneficios a largo plazo son innegables”
Ejemplo: Escribir una carta de recomendación
Escribe de manera directa, sin chamullo, en listas:
Y le pides que escriba la carta de recomendación de manera convincente pero sin exageraciones.
Cuando te dé una respuesta, pídele que revise algunos aspectos:
NO generes el texto de nuevo. Respóndele y pídele versiones nuevas.
Ejemplo: Escribir una propuesta de fondos
Le entregamos:
Y le pedimos:
You are an expert scientist that evaluates projects submitted to the [TITLE] grant in Chile. Key points for you:
Consider these limitations:
You will perform several tasks. Confirm that you have read and understand the proposal by providing a summary of it.
Provide an updated gantt table. Make sure it is coherent with the textual content of work packages. Use the same format as the current table, but make sure to include all tasks related to WPs. These tasks are the bold statements in each WP. Also, when a deliverable is due, instead of an X use a D.
Como el documento tiene work packages y una metodología de trabajo, el modelo produjo la carta Gantt. La tuve que revisar y corregir. Pero me ahorró tiempo y esfuerzo cognitivo que pude utilizar para mejorar otros aspectos de la propuesta.
Anatomía de un buen prompt
Establecer un rol que otorgue perspectiva
Establecer una tarea clara que otorgue un objetivo
Entregar ejemplos que permitan que el sistema sepa qué hacer y cómo
Especificar restricciones o estructuras que definan el texto
Ejemplo: Ayudante de Edición
Eres editora de una publicación tradicional y prestigiosa de ficción especulativa [ROL]. La publicación tiene convocatoria abierta y estás evaluando la potencia y calidad de distintas propuestas que llegan.
Vas a recibir una historia. Esta historia utiliza la estructura sin conflicto kishotenketsu [ESTRUCTURA]. Tu tarea es:
Resumen de la premisa
En un futuro distópico, un hombre mayor participa en un reality show mortal llamado "EX Máquina", donde humanos luchan contra robots para sobrevivir. Ramón Abaris, un profesor de colegio, es equipado por su hija Estela con un exoesqueleto especial para enfrentarse a un robot alienígena. Contra todo pronóstico, Ramón logra vencer al robot gracias a la tecnología y estrategia de su hija, ganando así el tratamiento médico que necesitaba.
Estructura kishotenketsu
Ki (Introducción): Se presenta el escenario del reality show, los participantes y las condiciones del combate.
Sho (Desarrollo): Se muestra la preparación de Ramón con su hija Estela, quien desarrolla el exoesqueleto y una estrategia basada en videojuegos.
Ten (Giro): Durante el combate, Ramón activa el programa secreto de Estela, lo que le permite enfrentarse al robot de manera inesperada.
Ketsu (Conclusión): Ramón logra vencer al robot alienígena, rompiendo el récord de audiencia y ganando el tratamiento médico que necesitaba.
La estructura kishotenketsu se adhiere bien al relato, ya que no hay un conflicto directo entre protagonista y antagonista, sino una situación que se desarrolla y se resuelve de manera inesperada.
Repetí este proceso múltiples veces con los textos de “Lloré sin consuelo sobre tu cuerpo eléctrico”.
Sugerencias para aumentar la potencia del relato
Para la nueva versión del relato no le hice caso a sus sugerencias pero me permitieron darme cuenta de otro aspecto del relato que podía mejorar.
Ejemplo: Sugerir meta-datos
Ejemplo con DEUS EX MACHINA:
(continuación del chat anterior)
[PROMPT] Dado el contenido del relato, describe palabras clave que puedan utilizarse como meta-datos para optimizar la distribución del texto.
(lista de 30 keywords...)
[PROMPT] Elige los cinco más específicos que atraigan más público y que estén en un sistema de catalogación.
Basándome en la especificidad y el potencial para atraer público, así como su probable inclusión en sistemas de catalogación, estas serían las cinco palabras clave más adecuadas:
Estas palabras clave son específicas al contenido del relato, pero también son lo suficientemente reconocibles y atractivas para un público amplio interesado en ciencia ficción y tecnología. Además, son términos que comúnmente se utilizan en sistemas de catalogación de libros y relatos de ciencia ficción.
"Cyberpunk" captura la esencia del mundo tecnológicamente avanzado pero socialmente distópico del relato.
"Reality show distópico" combina el elemento del espectáculo con el tono oscuro de la historia.
"Combate hombre vs máquina" describe el conflicto central de manera clara y atractiva.
"Exoesqueleto" es un término tecnológico específico que es clave en la trama y atrae a los aficionados a la ciencia ficción dura.
"Transhumanismo" abarca los temas más amplios de la mejora humana a través de la tecnología que el relato explora.
BONUS TRACK: NO SOLO SE VIVE DE TEXTO
metal about a child girl inviting friends to play at home by asking permission to their parents. chorus: "...". in spanish
En suno.com (prompt máximo de 200 carácteres).
¿Cómo creen que es posible hacer esto?
(escuchar 0:55)
BONUS TRACK 2: Búsqueda de literatura científica
En Consensus podemos buscar utilizando lenguaje natural, no keywords
Actividad: Tú eliges tu prompt
Para terminar
¡Hay valor en múltiples etapas del proceso editorial! Ahorraremos tiempo, esfuerzo, y podemos mejorar la calidad de algunos procesos.
Pero... las tecnologías de IA requieren ser bien usadas -> esto requiere capacitarse:
Herramientas de IA:
creadoras consejeras
¡Gracias!
Hablemos
Eduardo Graells-Garrido�egraells@dcc.uchile.cl�datagramas.cl
@zorzalmecanico