1 of 10

Сервіс для генерації синтетичних e-Commerce даних на основі LLM-симуляції користувацьких сесій

Рубаненко Марія Сергіївна ПЗПІ-22-7, �Голоха Нікіта Едуардович ПЗПІ-22-7,

Решетняк Антон Олексійович ПЗПІ-22-4

Наукові керівники:

Широкопетлєва Марія Сергіївна старший викладач кафедри ПІ, Кобзєв Володимир Григорович, професор кафедри ПІ

березень 2026

2 of 10

Актуальність

Для сучасних систем електронної комерції важливо мати реалістичний потік подій, що відображає природну поведінку користувачів і дозволяє коректно тестувати аналітичні конвеєри, інформаційні панелі та моделі машинного навчання. У середовищах розробки і тестування такий потік даних зазвичай відсутній, а великі масиви реальних подієвих даних майже недоступні у відкритому доступі. Крім того, існує брак навчальних платформ, на яких можна працювати з наближеним до реальності безперервним потоком даних.

Програмний сервіс генерації синтетичних e-Commerce даних на основі LLM-симуляції користувацьких сесій призначений для формування реалістичного синтетичного трафіку, який може використовуватися для тестування, аналітики та навчання.

2

Час розробки проєкту: 01.09.2025 – 01.06.2026

Задачі проєкту включають:

  • розроблення сервісу генерації синтетичних сесій, формування реалістичного потоку подій,
  • відтворення дій користувача у вебсередовищі,
  • збір і валідацію подій
  • передавання результатів через програмний інтерфейс.

3 of 10

USE-CASE Diagram

3

4 of 10

Узагальнена архітектура системи

4

Адмін

WebServer

FastAPI :8000

Worker

Celery + Playwright

LLM (Ollama)

qwen2.5:7b :11343

task

run_session

observe/decide

Mock-Website

Flask :3000

PostgreSQL

SQL Database

Scheduler

Celery Beat

Redis

черга задач

action

JS events

analytics

audit

Суцільна лінія

— основний потік даних

Пунктирна лінія

— аудит (дії агента)

Контейнери та потік даних

5 of 10

Діаграма Розгортання

5

6 of 10

Механізм роботи агента

6

Observe

Accessibility tree

сторінки

Think

LLM приймає

рішення

Act

Playwright

виконує дію

повторити

Приклад одного кроку агента

// LLM рішення (agent_decisions)

{ thought: "Бачу кнопку купити,

натисну її",

action: "click",

element: "Add to Cart" }

// JS Tracker → Collector (tracker_events)

{ event_type: "add_to_cart",

product_id: "wireless-headphones",

price: 149.99,

funnel_stage: "cart" }

Audit stream (Worker → PostgreSQL)

events

Кожна дія агента: click, scroll, type, wait

agent_decisions

Рішення LLM: thought, action, response_time_ms

Analytics stream (JS → Collector → PostgreSQL)

tracker_events

Бізнес-події: page_view, add_to_cart, purchase

Збагачення: UA, device, funnel_stage, IP

Валідація за схемою (Data Contract)

Зв'язок: visitor_id = sessions.id (cookie)

7 of 10

Використані технології

--------------------------------------------------------

Клієнтська частина

Серверна частина

----------------------------------------------------------------------------------------------------------------

7

8 of 10

Серверна частина системи

Серверна частина забезпечує:

  • створення, збереження та запуск сценаріїв генерації синтетичних сесій;
  • координацію взаємодії між вебсервером, базою даних, чергою повідомлень і фоновими процесами;
  • збереження сценаріїв, сесій, подій, журналів роботи та службових даних;
  • передавання завдань фоновим виконавцям для запуску генерації;
  • надання доступу до результатів генерації через програмний інтерфейс і механізми сповіщення;
  • аутентифікацію користувачів і контроль доступу до функцій системи.

Серверна частина є центральним компонентом системи, що забезпечує керування процесом генерації синтетичних користувацьких сесій, взаємодію між основними модулями та доступ до результатів роботи платформи.

8

9 of 10

Клієнтська частина

9

10 of 10

Висновки

10

Розроблено програмну систему для генерації синтетичних e-Commerce даних на основі LLM-симуляції користувацьких сесій. Система забезпечує керування сценаріями генерації, відтворення дій користувача у вебсередовищі, збереження подій та надання доступу до результатів через прикладний програмний інтерфейс і механізми сповіщення. Запропоноване рішення може бути використане для тестування інформаційних систем, аналітичних процесів і навчальних задач.

  • підвищення масштабованості та продуктивності системи;
  • розширення функціональності механізму data contract для більш повної валідації подій;
  • підвищення реалістичності синтетичних даних і розширення параметрів керування генерацією;
  • розроблення механізмів імітації дефектів у даних для задач тестування та контролю якості.

Перспективи розвитку