Published using Google Docs
SciCrop-InfiniteStack-FAQ-PT-BR-v3
Updated automatically every 5 minutes


FAQ sobre recursos de IA, Infraestrutura e Modelo de Negócios do InfiniteStack.

Abr/2025 v3

Sumário

1. Como o InfiniteStack lida com fluxos de trabalho multi-agente e multi-LLM?        2

2. Quais medidas de segurança são adotadas no InfiniteStack? Especificamente, como garantem a implementação de guardrails adequados?        3

3. Como o InfiniteStack escala para lidar com altas demandas de processamento?        4

4. É um modelo SaaS? Existe opção para rodar on-premises?        6

5. Quais são as recomendações de infraestrutura?        6

6. Como funciona a precificação do InfiniteStack?        7

7. Como o InfiniteStack mitiga o risco de vendor lock-in?        8

8. Como vocês gerenciam a governança dos agentes de IA?        9

9. Considerando a quantidade de dados e processamento de IA envolvidos, como o InfiniteStack analisa os dados de entrada para reduzir alucinações?        11

10. O InfiniteStack oferece suporte a RAG? Se sim, descreva brevemente a abordagem.        12

11. Como funciona o processo de fine-tuning no InfiniteStack?        13

12. Quais modelos estatísticos o InfiniteStack suporta?        15

13. Como é feita a curadoria e o monitoramento de dados e modelos no InfiniteStack?        18

14. Como funciona o suporte técnico do InfiniteStack?        21

15. Em quais linguagens de programação sua solução foi desenvolvida?        23

1. Como o InfiniteStack lida com fluxos de trabalho multi-agente e multi-LLM?

O InfiniteStack gerencia fluxos de trabalho multi-agente e multi-LLM através de uma arquitetura robusta baseada em Java com SpringBoot, que orquestra a execução de múltiplos agentes e modelos de linguagem de forma paralela e eficiente. A plataforma utiliza um sistema interno de gerenciamento de tarefas que coordena agentes independentes escritos em Python (seja pelo próprio usuário ou via interface no-code), o que permite a operação simultânea e a combinação de resultados. Esses agentes interagem com diversos modelos de linguagem – sejam locais ou externos (como os suportados por APIs de mercado) – por meio de um framework de integração que abstrai a comunicação com os modelos de forma padronizada e capaz de oferecer recursos de agentes Text-to-SQL, ReAct, RAG e de chamada de funções. O backend em Java gerencia o multithreading, de forma que os processos sejam escaláveis, enquanto modelos em Java/Python são tenham seus processos de treinamento e inferência executados sob demanda ou por agendamento para tarefas específicas de machine learning, os quais integrarão os resultados ao fluxo geral dos agentes com LLMs. Isso permite flexibilidade e otimização em cenários complexos de IA.


2. Quais medidas de segurança são adotadas no InfiniteStack? Especificamente, como garantem a implementação de guardrails adequados?

O InfiniteStack implementa várias medidas de segurança para proteger dados e modelos de IA:

3. Como o InfiniteStack escala para lidar com altas demandas de processamento?

O InfiniteStack escala através de uma arquitetura baseada em contêineres Docker, que permite alocação dinâmica de recursos conforme a demanda, através de escalabilidade horizontal e pode rodar através de orquestradores como:

Já para o balanceamento de carga o InfiniteStack lida com altas demandas através da configuração de balanceadores em três diferentes classes:

Existe ainda os recursos de auto-scaling baseados em Kubernetes Horizontal Pod Autoscaler (HPA), para a escala de pods automaticamente com base na carga, e o Cluster Autoscaler que adiciona e remove nós automaticamente conforme necessário.

Além das características intrínsecas ao Docker que permitem a escala horizontal, o InfiniteStack por ter o backend em Java e SpringBoot, gerencia o multithreading, e possibilita a execução paralela de múltiplos processos e agentes. A modularidade da plataforma permite inclusive que workflows de data products específicos de modelos de IA/ML assíncronos, ETLs e demais processos de engenharia de dados, criados no InfiniteStack possam rodar como funções serverless dos tipos:

Da mesma forma, workflows específicos de data products relacionados a aplicações de dados complexas, criados no InfiniteStack possam rodar como processos no:

Por fim, para cenários de alta demanda, o InfiniteStack permite o uso de GPUs NVIDIA com suporte a CUDA para acelerar a inferência de modelos, e garantir desempenho otimizado de modelos de IA e LLMs locais, mesmo sob cargas intensas


4. É um modelo SaaS? Existe opção para rodar on-premises?

O InfiniteStack não é um produto SaaS. Ele é oferecido como um contêiner Docker, projetado para ser instalado diretamente no ambiente do cliente, seja on-premises em um servidor físico ou na nuvem privada da empresa. Essa abordagem prioriza segurança e privacidade, e habilita que os clientes mantenham controle sobre seus dados e modelos de IA.

5. Quais são as recomendações de infraestrutura?

As recomendações de infraestrutura para o InfiniteStack são:

Maiores detalhes sobre recomendações de infraestrutura podem ser analisados no documento oficial “Pré-requisitos para Instalação do InfiniteStack”.

6. Como funciona a precificação do InfiniteStack?

O InfiniteStack oferece dois planos de assinatura mensais, adaptados às necessidades de diferentes perfis de clientes:

Plano Starter: Destinado a produtores rurais e empresas de menor porte que desejam iniciar a integração de dados. Por R$2.500/mês, este plano inclui:

Plano Business: Direcionado para empresas que já geram dados e necessitam de algumas integrações para o uso de IA em suas operações. Por R$10.000/mês, este plano disponibiliza:

Plano Corporate: Voltado para corporações que necessitam de múltiplas integrações de sistemas e buscam incorporar IA em suas operações. Por R$50.000/mês, este plano oferece:

Ambos os planos são projetados para atender desde a fase inicial de integração de dados até a implementação de modelos robustos de IA, e proporcionar soluções sob medida conforme o nível de maturidade e tamanho da empresa.

Para mais detalhes, visite: https://infinitestack.ai 

7. Como o InfiniteStack mitiga o risco de vendor lock-in?

O InfiniteStack minimiza o vendor lock-in ao oferecer uma solução instalada localmente via Docker, e permite ao cliente controle total sobre dados e modelos. A plataforma suporta a exportação de dados e modelos em formatos padrão, e facilita migrações ou integrações com outras ferramentas. Além disso, seus recursos agnósticos de cloud e a compatibilidade com scripts Python customizados e APIs abertas permite que os clientes adaptem ou substituam componentes conforme necessário, o que reduz significativamente a dependência de fornecedores específicos.


8. Como vocês gerenciam a governança dos agentes de IA?

No InfiniteStack, a governança dos agentes de IA é gerenciada com controle, transparência e conformidade em todas as etapas do ciclo de vida dos agentes. Isso é realizado através de uma combinação de monitoramento em tempo real, políticas de acesso, rastreabilidade e validação contínua. Além disso, recursos avançados como Catalogação, Observabilidade e Track (Data Lineage) do InfiniteStack elevam a governança pois proporcionam uma gestão detalhada e eficiente dos agentes de IA.

Recursos Essenciais de Governança


9. Considerando a quantidade de dados e processamento de IA envolvidos, como o InfiniteStack analisa os dados de entrada para reduzir alucinações?

O InfiniteStack reduz alucinações através de um pipeline de pré-processamento robusto:

Esses passos, gerenciados pelo backend em Java e suportados por scripts Python, asseguram que os modelos recebam dados confiáveis, e minimiza erros ou saídas incoerentes. Além disso, a redução de alucinações também se apóia nos recursos de guardrails tratadas na questão 2.


10. O InfiniteStack oferece suporte a RAG? Se sim, descreva brevemente a abordagem.

Sim, o InfiniteStack suporta RAG (Retrieval-Augmented Generation). A abordagem combina recuperação de informações com geração de texto, com recursos que acessam dados locais ou específicos do cliente em tempo real. Durante a execução, o modelo consulta um repositório indexado de dados empresariais, e enriquece as respostas com contexto relevante, o que melhora a precisão e reduz respostas genéricas.

No InfiniteStack, assim como no caso dos agentes, todos os dados que possam ser utilizados em um RAG, mandatoriamente precisam antes ser catalogados, no recurso Catalog, o que garante a conformidade dos dados com a LGPD, bem como proteção e privacidade. Além disso, o RAG pode usar os LLMs locais, bem como APIs de LLMs em cloud, inclusive escolher qual RAG deve usar qual LLM ou que um RAG pode fazer parte de um determinado agente.

Com relação aos embeddings o InfiniteStack oferece suporte nativo ao pgvector, mas suporta diversos outros bancos de vetores.


11. Como funciona o processo de fine-tuning no InfiniteStack?

O processo de fine-tuning no InfiniteStack permite ajustar modelos de linguagem pré-treinados, como DeepSeek, TinyLlama, Gemma, Qwen e Phi, para personalizar o comportamento do modelo em questão, aprimorar o conhecimento de domínio e otimizar o desempenho para tarefas específicas. Ele é projetado para transformar um modelo genérico em um modelo especializado, capaz de realizar tarefas de forma mais eficaz e eficiente, de forma a superar até mesmo as capacidades de RAG em flexibilidade.

Benefícios do Fine-Tuning

Ao realizar o fine-tuning em um dataset especializado, os usuários podem alcançar os seguintes resultados:

Exemplos de Casos de Uso

O InfiniteStack suporta uma ampla gama de aplicações práticas, através da criação de agentes com base em LLMs com fine-tuning. No entanto para ilustrar como o fine-tuning pode agregar valor a diferentes negócios, seguem os exemplos abaixo:

Importância dos Datasets

Para o fine-tuning, é essencial contar com um dataset de alta qualidade, geralmente estruturado em duas colunas — perguntas e respostas. A qualidade e a quantidade dos dados refletem diretamente no resultado final do modelo ajustado. O InfiniteStack oferece ferramentas integradas para a criação desses datasets.

Técnicas de Fine-Tuning no InfiniteStack

O InfiniteStack permite o uso dos seguintes métodos para o fine-tuning eficiente:

Além disso, o InfiniteStack suporta diversas abordagens de fine-tuning, como:

O processo de fine-tuning no InfiniteStack permite personalizar LLMs de forma eficiente e acessível. Com suporte a técnicas modernas como LoRA e QLoRA, ferramentas para criação de datasets e uma interface amigável, a plataforma capacita os usuários a transformar modelos pré-treinados em agentes especializados, otimizados para suas necessidades específicas — desde análise de dados até geração de respostas personalizadas.

12. Quais modelos estatísticos o InfiniteStack suporta?

O InfiniteStack oferece suporte built-in a uma ampla gama de modelos estatísticos e de machine learning por meio de duas bibliotecas renomadas: Smile (para Java, disponível em https://haifengl.github.io/) e scikit-learn (para Python, disponível em https://scikit-learn.org/). Isso significa que todos os modelos estatísticos disponíveis nessas bibliotecas estão diretamente integrados à plataforma, prontos para uso sem configurações adicionais. Abaixo, detalhamos os principais tipos de modelos suportados por cada uma:

Modelos Suportados via Smile (Java)

A biblioteca Smile é uma das mais robustas para machine learning em Java, e o InfiniteStack inclui todos os seus algoritmos, como:

Modelos Suportados via scikit-learn (Python)

A scikit-learn é uma das bibliotecas mais populares para machine learning em Python, e o InfiniteStack suporta integralmente todos os seus modelos e ferramentas:

Além de oferecer todos os modelos das bibliotecas Smile e scikit-learn, o InfiniteStack permite que os usuários executem scripts personalizados em Python. Isso significa que, caso um modelo ou algoritmo específico não esteja diretamente disponível nas bibliotecas integradas, ele pode ser implementado sob medida, de maneira a garantir total flexibilidade para atender às necessidades dos usuários e clientes.


13. Como é feita a curadoria e o monitoramento de dados e modelos no InfiniteStack?

No InfiniteStack, a curadoria e o monitoramento de dados e modelos são realizados de forma integrada, através dos recursos nativos de Catalogação, Observabilidade e Track (Data Lineage). Esses recursos garantem que os dados e modelos sejam gerenciados de maneira transparente, segura e em total conformidade com as melhores práticas de governança, e proporciona às organizações controle completo sobre seus ativos de IA.

Curadoria de Dados e Modelos

A curadoria no InfiniteStack é centralizada no recurso de Catalogação, que organiza e documenta todos os ativos de dados e modelos de IA em um inventário unificado. Esse recurso oferece:

Com a Catalogação, as empresas podem manter um repositório organizado e acessível, para promover a colaboração entre equipes e que apenas ativos confiáveis e autorizados sejam utilizados.

Monitoramento de Dados e Modelos

O monitoramento é realizado através do recurso de Observabilidade em tempo real, que oferece uma visão contínua do desempenho e do comportamento dos modelos de IA:

Esse monitoramento contínuo assegura que os modelos operem dentro dos parâmetros esperados e que qualquer desvio seja identificado e corrigido imediatamente.

Rastreabilidade e Conformidade

O recurso Track (Data Lineage) garante uma visão detalhada da origem e do fluxo dos dados utilizados pelos modelos:

O Track (Data Lineage) é essencial para ambientes regulados, pois garante que todas as ações dos modelos possam ser rastreadas e justificadas.

No InfiniteStack, a curadoria e o monitoramento de dados e modelos são realizados de forma robusta e integrada. A Catalogação centraliza e organiza os ativos de dados e modelos, enquanto a Observabilidade garante o monitoramento contínuo do desempenho e comportamento dos modelos. Para complementar esses recursos, o Track (Data Lineage) oferece rastreabilidade completa, e assegura transparência e conformidade. Juntos, esses recursos permitem que as organizações gerenciem seus ativos de IA de maneira eficaz, segura e em total alinhamento com as políticas internas e regulamentos externos.


14. Como funciona o suporte técnico do InfiniteStack?

O InfiniteStack foi desenvolvido para ofertar 99,8% de disponibilidade de funcionamento, sem levar em consideração os recursos de infraestrutura do cliente, na qual o InfiniteStack será instalado.

O SLA de suporte possui disponibilidade de 24 horas por dia durante 365 dias por ano.

O atendimento para suporte e manutenção em caso de indisponibilidade deverá ser solicitado por um dos seguintes canais de comunicação:

Caso haja necessidade de atendimento presencial, a solicitação deverá ser feita por um destes canais acima, para agendamento da visita técnica, mediante custo adicional a ser informado no momento da solicitação.

O SLA para atendimento de solicitações é:

Atendimento

SLA

Classificação

Horário comercial

6 horas

Crítica

Horário comercial

12 horas

Alta prioridade

Horário comercial

24 horas

Prioridade média

Horário comercial

48 horas

Baixa prioridade

Horário comercial

72 horas

Serviço geral

A SciCrop poderá ter janelas de manutenções nos sistemas de licenciamento do InfiniteStack, que poderão ocasionar instabilidades temporárias. No caso de manutenções ocorrerem, as mesmas serão realizadas somente a partir das 0h01 da manhã dos sábados até às 23h59 das noites de domingo.

Constantemente durante 24/7 serão mantidas verificações automáticas preventivas de disponibilidade do InfiniteStack.


15. Em quais linguagens de programação sua solução foi desenvolvida?

O InfiniteStack é desenvolvido principalmente em Java, e utiliza o framework SpringBoot para robustez e escalabilidade. Scripts em Python são suportados para tarefas de machine learning, gerenciados pelo backend em Java, o que garante flexibilidade para customizações e integrações com sistemas legados.


Sobre a SciCrop

A SciCrop é uma empresa especializada em IA e Analytics para a cadeia do agronegócio. Entre suas soluções, destaca-se o InfiniteStack, uma plataforma de modelagem e gestão de recursos de IA e analytics para empresas. O InfiniteStack acelera a integração de dados e a adoção de IA através de recursos low-code, e permite que empresas conectem dados, criem pipelines automatizados e gerenciem o uso de IA internamente.


FAQ sobre recursos de IA, Infraestrutura e Modelo de Negócios do InfiniteStack.

/