1 of 12

Transformando Dados em Inteligência:

como gerar embeddings pode te ajudar a extrair informação de chunks de textos

Nikolly Amancio

Gustavo Jesus

Confidential – Oracle Internal

2 of 12

Cloud Solution Engineer

gustavo.de.jesus@oracle.com

in/gustavo-almeida-679773213/

AI Engenieer

nikolly.amancio@oracle.com

in/nikolly-lourenco-amancio

💼

✉️

💼

✉️

Gustavo Almeida

Nikolly Amancio

👤

👤

Confidential – Oracle Internal

3 of 12

como gerar embeddings pode te ajudar a extrair informação de chunks de textos?

Confidential – Oracle Internal

4 of 12

como gerar vetores pode te ajudar a extrair informação de partes de textos?

Confidential – Oracle Internal

5 of 12

vector = [0,-2,...4]

Vetores

Um vetor é uma estrutura matemática com um tamanho e uma direção.

Como funciona?

🧠

Cada vetor é um ponto em um

espaço n-dimensional

A distância entre vetores determina o

grau de similaridade semântica

Clusters de vetores indicam que aqueles dados/textos compartilham

significado semelhante

Confidential – Oracle Internal

6 of 12

Modelos populares produzem vetores de tamanhos distintos.

(ex.: Cohere, OpenAI, MiniLM)

Confidential – Oracle Internal

7 of 12

0.6

-0.2

0.8

0.9

-0.1

-0.9

-0.7

0.7

0.1

0.8

0.7

0.1

-0.5

-0.4

0.5

-0.4

0.7

-0.8

0.9

-0.7

-0.6

0.5

-0.1

0.7

-0.9

0.8

-0.5

-0.9

Embeddings

Embeddings vetoriais são representações matemáticas de pontos de dados

Homem

Mulher

Rei

Rainha

Ser vivo

Felino

Humano

Genero

Realeza

Verbo

Plural

Mulher

Rainha

Rei

Homem

Confidential – Oracle Internal

8 of 12

Confidential – Oracle Internal

9 of 12

Metricas de distâncias vetoriais

Algoritmo

Tipo de medida

Característica principal

Utilidade

Cosseno

Ângulo entre vetores

Direção importa, não o tamanho

Captar contexto de textos

Manhattan

Diferença absoluta

Caminho em "grade"

Reconhecimento de padrões em imagens

Hamming

Posições diferentes

Binário, usado em strings codificadas

Reconhecimento facial

Confidential – Oracle Internal

10 of 12

AI Vector in autonomous 23ai

Confidential – Oracle Internal

11 of 12

Vector data type

Confidential – Oracle Internal

12 of 12

IN CODE...

Confidential – Oracle Internal