1 of 72

ESCRIBIR,

EDITAR

y otras labores

entre máquinas

Eduardo Graells-Garrido�Departamento de Ciencias de la Computación�Universidad de Chile�IA centrada en las personas (RL5), CENIA

2 of 72

El Profe

Eduardo “Zorzal” Graells-Garrido

Profesor: Visualización de Información, Computación Gráfica

Investigador: Movilidad urbana

Editor: Trazos de Aves

Autor: Lloré sin consuelo sobre tu cuerpo eléctrico

Autista: en general, me llevo mejor con las máquinas que con las personas

3 of 72

4 of 72

Tabla

¿Por qué debería {interesarme, preocuparme} por la Inteligencia Artificial generativa?

¿Cómo funciona la I.A. generativa?

¿Qué cosas {sí, no} {puedo, debo, necesito} en el mundo editorial?

¿Qué cosas {sí, no} {puedo, debo, necesito} hacer como escritor(a/e)?

Manos a la obra

5 of 72

Los por qué

6 of 72

¿Por qué preocuparme?

Yo ya me siento reemplazado en algunos aspectos.

Pero no son los que se imaginan en primera instancia.

Hay otros temas para preocuparse:

  • Sesgos en los datos
  • Ética en su uso y aplicación (ej., deep fakes)
  • Consumo energético: ¿cuántos litros de agua se utilizan por cada consulta a ChatGPT?

Pero esta charla no se focaliza en esos temas sino en cómo podemos acercarnos a la IA desde el mundo editorial y la literatura.

7 of 72

¿Por qué usarla?

Nos permitirá ahorrar tiempo y esfuerzo

Escribir (algunas cosas)

Leer (algunas cosas)

Analizar y profundizar (algunas cosas)

Hacer pruebas de concepto

8 of 72

¿Por qué adaptarse?

Lo cierto es que, queramos o no, seguirá avanzando

El mundo editorial ha conocido revoluciones:

  • La imprenta: escala de reproducción, costo�
  • Digitalización: medio de reproducción y distribución, alcance global�
  • Audio: tipo de público, roles involucrades.

Disrupción y revolución IA: ¿en costo o en calidad de creación?

9 of 72

¿Por qué aprovecharla?

10 of 72

¿Por qué no nos va a reemplazar?

Un modelo de lenguaje no entiende

Un modelo de lenguaje no entiende lo que lee

Un modelo de lenguaje no entiende lo que significa una emoción

Solo sabe que algunas palabras van juntas

Pero no conoce el dolor ni la pérdida ni tiene experiencias <- no hay factor humano por muy “humano” que parezca el resultado

11 of 72

12 of 72

¿Por qué somos sus usuaries ideales?

Porque sabemos dar instrucciones

Sabemos sugerir cambios

Sabemos leer entre líneas

Sabemos discriminar entre opciones

Sabemos cuestionar y verificar

13 of 72

Los cómo

14 of 72

¿Cómo le digo a la máquina lo que quiero?

Todo comienza con un prompt o instrucción

Escrito en lenguaje natural

Usualmente en inglés.

Escribe un poema de antipoesía donde cada verso termina con "imaginario" y el título es "El taller de inteligencia artificial imaginario", donde "El taller" se refiere a un grupo de personas que quiere aprender sobre usos y oportunidades de la IA en el mundo editorial.

15 of 72

Prompt�Ilustración de un zorzal patagónico (turdus falcklandii) hecho con piezas de computadora con fondo blanco

Illustration of an austral thrush (turdus falcklandii) made of spare computer parts, white background

16 of 72

¿Cómo genera las imágenes?

“Difusión de ruido”

17 of 72

El mecanismo para generar imágenes

“Difusión de ruido”

Probemos con blind men and elephant

18 of 72

Nuestro prompt explota lo local y lo global. Pero un modelo no es capaz de interpretar bien la intención detrás. Además, re-escribe lo que le pedimos. Ejemplo en leonardo.ai.

19 of 72

Cambiar las opciones genera otros prompts similares, pero sigue sin captar la idea.

20 of 72

21 of 72

Incluso en esta opción el resultado es irrisorio.

Son imágenes técnicamente impresionantes de pésima calidad.

22 of 72

¿Cómo genera texto?

🦜 Se basa principalmente en predecir la(s) siguiente(s) palabras de un texto:

23 of 72

El mecanismo para generar texto

¿Qué sigue?: Chipi Chipi -> ¿[...]?

24 of 72

El mecanismo para generar texto

25 of 72

26 of 72

¿Cuáles herramientas existen?

ChatGPT de OpenAI <- texto e imagen (DALL-E)

Claude.ai de Anthropic <- texto y artefactos. Recomendado: chipi chipi-enabled.

Midjourney <- imágenes. Es probablemente la más conocida. Ha reconocido que no respeta ni respetará derechos de autor.

Leonardo.ai <- imágenes. Presumiblemente respeta derechos de autor.

27 of 72

¿Cómo fue posible esto?

Con muchos datos.

Todo lo que se pueda encontrar y descargar en la red

-> Wikipedia, medios, blogs, redes sociales, foros...

Algunas empresas lo usan todo de manera indiscriminada.

Otras respetan los derechos de autor en la medida de lo posible.

Es un problema abierto.

28 of 72

Ojo con los datos I: Estos locos modelos

No se puede identificar un texto generado por IA de uno humano.

Los modelos se ajustan con el texto que hay en la red.

La red cada día tiene más texto generado por modelos.

La autofagia de modelos es real y, si no se controla, los resultados de lo que generan serán de peor calidad.

29 of 72

Ojo con los datos II: ¿Cómo proteger los míos?

-> Si son imágenes, se pueden “contaminar” sin alterar la percepción humana

-> Si es texto es más difícil... porque alterar el texto altera nuestra lectura

-> Se puede intentar bloquear el acceso de los “robots” que descargan contenido, pero nada asegura que funcione (esto se llama “configurar ROBOTS.TXT” y se usa para decirle a los buscadores qué se puede descargar de un sitio)

-> ¿sabes si usarán tus datos para entrenar la nueva versión del modelo?

-> ¿tu contrato de edición te da permiso para subir los datos a una IA para su análisis?

30 of 72

Glaze es una herramienta para proteger imágenes utilizando “contaminación”.

31 of 72

Ojo con los datos III: Sesgos

32 of 72

Las personas tenemos sesgos

Las IAs tienen más

¿Cómo sabes si el contenido que genera una máquina no tiene sesgos incluso más acentuados que los tuyos?

No solo hay sesgos raciales, de género o de edad.

También los hay de disponibilidad de contenido.

33 of 72

Prompt�Ilustración de un zorzal patagónico (turdus falcklandii) hecho con piezas de computadora con fondo blanco

Illustration of an austral thrush (turdus falcklandii) made of spare computer parts, white background

34 of 72

Robin Americanoturdus migraturius

Robin Europeoerithacus rubecula

Como el modelo no entendía turdus falckandii me daba un pajarito con colores ná que ver

35 of 72

Los qué

36 of 72

¿Qué hacer con imágenes generadas?

¡No publicarlas!

-> Los modelos basados en imágenes no respetan los derechos de autor incluso si dicen hacerlo.

-> Las imágenes resultantes no tienen copyright.

-> Incluso pueden denunciarles en la red y dichas denuncias se pueden viralizar.

-> Los sesgos en la base de datos hacen que conceptos locales no representen a la realidad (¡y qué decir de grupos no heteronormados!)

37 of 72

Dicen que no hay mala publicidad.

Pero caer en el ridículo incluso puede afectar las ventas.

Además, la imagen es de mala calidad.

38 of 72

Como no tienen copyright, no se pueden registrar.

39 of 72

¿Qué podría hacer con imágenes?

-> Usar un modelo que no se haya entrenado con imágenes con derechos de autor (muy difícil de garantizar)

-> Realizar pruebas de concepto (como ver si la descripción de un personaje de mi novela evoca cierta imagen, ejemplo hecho con Leonardo.ai)

En lo personal: ya no uso estos modelos porque precarizan la industria.

40 of 72

¿Qué hacer con el texto?

¿Escribirlo? Dependerá de lo que quieras escribir. Contenido original, no es buena idea

¿Traducirlo? Puede traducir palabras y frases, pero no expresar sentimientos ni imágenes

¿Corregirlo? No

Mi parte favorita: iterarlo.

41 of 72

¿Escribir?

Según Ted Chiang, ChatGPT escribe un promedio de todo lo que sabe (lo que está en la Web).

Como el poema que les leí, puede ser un ejercicio simpático.

Pero no destaca ni tiene valor literario.

42 of 72

¿Escribir?

Podemos escribir algo acotado, o bien, usarlo como apoyo.

43 of 72

¿Escribir?

"Parece que se ha malinterpretado la historia de que la obra premiada de Rie Kudan se escribió utilizando IA generativa... Si lo lees, verás que la IA generativa se mencionaba en la obra"

Perspectiva personal: usé herramientas para apoyar mi proceso, pero definí, elegí y escribí cada palabra (tanto de manera manuscrita como digital).

44 of 72

Una anécdota personal

Eduardo, mi frase favorita de tu novela es [...]

-> Giro en la trama: fue una frase que hice con GPT3 (antes de ChatGPT)

-> Segundo giro: fue una frase en la que el modelo se equivocó porque no le hizo caso al prompt

45 of 72

¿Escribir?

Hay que tener cuidado.

En algunos casos podrías terminar incorporando texto con derechos de autor.

Generative AI Has a Visual Plagiarism Problem - IEEE Spectrum

46 of 72

¿Escribir?

Hay que tener cuidado:

Un modelo de IA es chamullero y en algunos casos no sabe que lo está siendo.

En este caso lo advierte, pero no puede saberlo.

¡Estos tres papers no existen!

47 of 72

48 of 72

¿Corregir?

No lo recomiendo.

49 of 72

Después de revisar cuidadosamente el texto, no encuentro errores gramaticales u ortográficos significativos. El estilo es consistente y adecuado para una historia de ficción especulativa. Sin embargo, hay algunos pequeños detalles que podrían mejorarse:

  1. En la frase "Representando a la humanidad, esta noche participa Ramón Abaris, profesor y director de un colegio en Peñalolén", podrías considerar usar una coma después de "humanidad" para mejorar la claridad. Había una coma.
  2. En "Así como su extremidad giraba alrededor de su codo, el brazo mecánico creado por Estela repitió el movimiento", podrías cambiar "repitió" por "repitió" para mantener la concordancia temporal con "giraba". ¡Plop!
  3. En "Sé que te gusta el ajedrez, que piensas que esto podría ser un juego mental", podrías considerar añadir una coma después de "mental" para separar las cláusulas. Había un punto.
  4. En la frase "No podremos ingresar con ningún transmisor", falta un punto final. Había un punto.
  5. En "Estela sabía que ya no habría un segundo de desventaja", podrías considerar usar "desventaja" en plural ("desventajas") para mayor claridad. ¿¿¿???

Estos son detalles menores y el texto en general está bien escrito y es coherente. Las correcciones sugeridas son más bien ajustes de estilo que errores propiamente dichos.

(Análisis del relato DEUS EX MACHINA, de Eduardo Graells-Garrido, por Claude 3.5 Sonnet)

50 of 72

¿Traducir?

Es riesgoso. Pareciera que un modelo puede traducir, pero el resultado no es de calidad literaria.

-> Idioms suelen ser traducidos�de manera literal.

51 of 72

¿Qué considerar?

Si conocemos las limitaciones del modelo podremos sacarle más provecho.

Ejemplo: ventana de contexto <- ¿cuánto texto puede considerar para generar más texto?

Si la ventana se te acaba, el modelo pierde tus instrucciones (¡pero no te dirá que se le acabó la ventana!)

-> ChatGPT: ventana de contexto pequeña (grande en modelo pagado: ~100 mil palabras)

-> Claude: ventana de contexto enorme (en modelo base: ~150 mil palabras). Le pasé mi antología GAME OVER completa y me ayudó a organizar los textos para la segunda edición.

-> Google Gemini: la versión pagada tiene la ventana más grande (~1 millón de palabras), pero no la he probado.

52 of 72

Entender e iterar

Este es un gráfico generado por Google Gemini que toma los primeros 5 libros de Harry Potter y crea una red de relaciones.

Más que escribir desde cero, un modelo nos provee herramientas para ver qué es lo que contiene (o no) un texto.

E iterarlo.

https://www.linkedin.com/posts/debarghyadas_can-gemini-15-actually-read-all-the-harry-activity-7184411700379500544-twiG/

53 of 72

¿Con qué tener cuidado?

Con no verificar la calidad del resultado

-> el modelo es bueno en promedio, pero puede ser muy malo en usos específicos

Con “reemplazar personas” (por ej.: corrección, traducción, ilustración)

-> no solo precariza la industria sino que el resultado es de mala calidad (al menos hoy).

-> mi “hot take” es que no mejorará mucho más y la gente que dice que sí tiene intereses creados

54 of 72

Problema para editores/as

Aumento explosivo en volumen de obras que se envían.

Aumenta el volumen y disminuye la calidad (ej: Clarkesworld).

Si vendes en Amazon, ¡ya es más difícil encontrar tu obra!

55 of 72

La parte más entrete

56 of 72

Ejemplo: Reformular un correo electrónico

Así podemos asegurar el tono deseado. Podemos ser más convincentes o más amables.

Correo: “Este material es como las ..., pero a la larga es weno”

-> Resultado amigable: “Aunque al principio este material puede parecer complicado, con el tiempo se aprecia su verdadero valor y utilidad”

-> Resultado convincente: “Este material es una excelente inversión - difícil al principio, pero sus beneficios a largo plazo son innegables”

57 of 72

Ejemplo: Escribir una carta de recomendación

Escribe de manera directa, sin chamullo, en listas:

  • Las características de la persona que vas a recomendar y su CV
  • Tu CV y cómo la conociste o por qué la recomiendas
  • Las características del lugar al que enviarás la carta
  • El propósito de la carta

Y le pides que escriba la carta de recomendación de manera convincente pero sin exageraciones.

Cuando te dé una respuesta, pídele que revise algunos aspectos:

  • ¿Por qué lo hiciste así: [...]?
  • No me gusta esto: [...] porque no suena auténtico.

NO generes el texto de nuevo. Respóndele y pídele versiones nuevas.

58 of 72

Ejemplo: Escribir una propuesta de fondos

Le entregamos:

  • Un borrador básico pero completo en su estructura y propósito <- es decir, el núcleo de tu propuesta.
  • Los objetivos del concurso
  • Los antecedentes que disponemos (que no están necesariamente en el borrador)
  • Si ya ha sido revisado antes, la carta de evaluación

Y le pedimos:

  1. Que la resuma (así nos aseguramos de que ha captado nuestras ideas)
  2. Que la evalúe de manera crítica (y que considere los comentarios de feedback)
  3. Que sugiera aspectos a mejorar de acuerdo a esa evaluación
  4. Que proponga una nueva versión del texto que se base en el borrador y que contenga las mejoras
  5. Que no agregue ni invente información, que solo tome lo que está disponible en los antecedentes

59 of 72

You are an expert scientist that evaluates projects submitted to the [TITLE] grant in Chile. Key points for you:

  • This grant has the following objective (in Spanish): "Promover [...]". The proposal will be submitted to the [...] track.
  • The proposal is titled [...] and it was submitted last year, unsuccessfully. Attached is a new version of the project, consisting in abstract for the project, the main proposal, and the feedback letter from last year.
  • These are the evaluated items (in Spanish, but your answer should be in English): Fundamentos teóricos-conceptuales y estado del arte; Calidad y coherencia de las preguntas o hipótesis y objetivos; Pertinencia y validez de la metodología y su coherencia con los objetivos e hipótesis o preguntas de investigación; Plan de trabajo o carta Gantt y su coherencia con la propuesta; Capacidad del equipo de trabajo para ejecutar la propuesta; Infraestructura y recursos [...].

Consider these limitations:

  • Avoid unnecessary embelishments (a.k.a. bullshit) in your suggestions.
  • Avoid complex words such as "utilizing" instead of "using".
  • Avoid hype. Keep terminology consistent. Avoid different ways to mention the same concept. [...]

You will perform several tasks. Confirm that you have read and understand the proposal by providing a summary of it.

60 of 72

Provide an updated gantt table. Make sure it is coherent with the textual content of work packages. Use the same format as the current table, but make sure to include all tasks related to WPs. These tasks are the bold statements in each WP. Also, when a deliverable is due, instead of an X use a D.

Como el documento tiene work packages y una metodología de trabajo, el modelo produjo la carta Gantt. La tuve que revisar y corregir. Pero me ahorró tiempo y esfuerzo cognitivo que pude utilizar para mejorar otros aspectos de la propuesta.

61 of 72

Anatomía de un buen prompt

Establecer un rol que otorgue perspectiva

Establecer una tarea clara que otorgue un objetivo

Entregar ejemplos que permitan que el sistema sepa qué hacer y cómo

Especificar restricciones o estructuras que definan el texto

62 of 72

Ejemplo: Ayudante de Edición

Eres editora de una publicación tradicional y prestigiosa de ficción especulativa [ROL]. La publicación tiene convocatoria abierta y estás evaluando la potencia y calidad de distintas propuestas que llegan.

Vas a recibir una historia. Esta historia utiliza la estructura sin conflicto kishotenketsu [ESTRUCTURA]. Tu tarea es:

  1. Resumir la premisa del texto en un párrafo corto.
  2. Describir cómo se adhiere a la estructura kishotenketsu y cómo cada una de sus partes funciona de acuerdo a ese esquema. Si no funciona, da una sugerencia de qué hacer en el tratado para que funcione.
  3. Sugerir ideas que puedan aumentar la potencia del relato.

63 of 72

Resumen de la premisa

En un futuro distópico, un hombre mayor participa en un reality show mortal llamado "EX Máquina", donde humanos luchan contra robots para sobrevivir. Ramón Abaris, un profesor de colegio, es equipado por su hija Estela con un exoesqueleto especial para enfrentarse a un robot alienígena. Contra todo pronóstico, Ramón logra vencer al robot gracias a la tecnología y estrategia de su hija, ganando así el tratamiento médico que necesitaba.

Estructura kishotenketsu

Ki (Introducción): Se presenta el escenario del reality show, los participantes y las condiciones del combate.

Sho (Desarrollo): Se muestra la preparación de Ramón con su hija Estela, quien desarrolla el exoesqueleto y una estrategia basada en videojuegos.

Ten (Giro): Durante el combate, Ramón activa el programa secreto de Estela, lo que le permite enfrentarse al robot de manera inesperada.

Ketsu (Conclusión): Ramón logra vencer al robot alienígena, rompiendo el récord de audiencia y ganando el tratamiento médico que necesitaba.

La estructura kishotenketsu se adhiere bien al relato, ya que no hay un conflicto directo entre protagonista y antagonista, sino una situación que se desarrolla y se resuelve de manera inesperada.

Repetí este proceso múltiples veces con los textos de “Lloré sin consuelo sobre tu cuerpo eléctrico”.

64 of 72

Sugerencias para aumentar la potencia del relato

  • Profundizar en las motivaciones de Ramón para participar en el show, más allá de la necesidad médica.
  • Explorar las implicaciones éticas y sociales de un reality show tan violento y su popularidad.
  • Desarrollar más la relación entre Ramón y Estela, mostrando cómo este evento cambia su dinámica familiar.
  • Incluir más detalles sobre la tecnología utilizada y cómo Estela logró burlar los sistemas de seguridad.
  • Mostrar las consecuencias a largo plazo de la victoria de Ramón, tanto para él como para la sociedad en general.
  • Explorar la reacción de FutureTech ante su derrota y cómo esto podría afectar futuros episodios del show.

Para la nueva versión del relato no le hice caso a sus sugerencias pero me permitieron darme cuenta de otro aspecto del relato que podía mejorar.

65 of 72

Ejemplo: Sugerir meta-datos

Ejemplo con DEUS EX MACHINA:

(continuación del chat anterior)

[PROMPT] Dado el contenido del relato, describe palabras clave que puedan utilizarse como meta-datos para optimizar la distribución del texto.

(lista de 30 keywords...)

[PROMPT] Elige los cinco más específicos que atraigan más público y que estén en un sistema de catalogación.

66 of 72

Basándome en la especificidad y el potencial para atraer público, así como su probable inclusión en sistemas de catalogación, estas serían las cinco palabras clave más adecuadas:

  1. Cyberpunk
  2. Reality show distópico
  3. Combate hombre vs máquina
  4. Exoesqueleto
  5. Transhumanismo

Estas palabras clave son específicas al contenido del relato, pero también son lo suficientemente reconocibles y atractivas para un público amplio interesado en ciencia ficción y tecnología. Además, son términos que comúnmente se utilizan en sistemas de catalogación de libros y relatos de ciencia ficción.

"Cyberpunk" captura la esencia del mundo tecnológicamente avanzado pero socialmente distópico del relato.

"Reality show distópico" combina el elemento del espectáculo con el tono oscuro de la historia.

"Combate hombre vs máquina" describe el conflicto central de manera clara y atractiva.

"Exoesqueleto" es un término tecnológico específico que es clave en la trama y atrae a los aficionados a la ciencia ficción dura.

"Transhumanismo" abarca los temas más amplios de la mejora humana a través de la tecnología que el relato explora.

67 of 72

BONUS TRACK: NO SOLO SE VIVE DE TEXTO

metal about a child girl inviting friends to play at home by asking permission to their parents. chorus: "...". in spanish

En suno.com (prompt máximo de 200 carácteres).

¿Cómo creen que es posible hacer esto?

(escuchar 0:55)

68 of 72

BONUS TRACK 2: Búsqueda de literatura científica

En Consensus podemos buscar utilizando lenguaje natural, no keywords

69 of 72

Actividad: Tú eliges tu prompt

70 of 72

Para terminar

¡Hay valor en múltiples etapas del proceso editorial! Ahorraremos tiempo, esfuerzo, y podemos mejorar la calidad de algunos procesos.

Pero... las tecnologías de IA requieren ser bien usadas -> esto requiere capacitarse:

  • En diseñar prompts e interactuar con el modelo
  • En usos éticos: que se pueda no implica que se deba
  • En usos que respeten el derecho de autor(a/e)
  • En evaluar y cuestionar la calidad del resultado
  • En sesgos: ¿sabemos cómo está representada una población, un lugar, una cultura?

71 of 72

Herramientas de IA:

creadoras consejeras

72 of 72

¡Gracias!

Hablemos

Eduardo Graells-Garrido�egraells@dcc.uchile.cl�datagramas.cl

@zorzalmecanico