Сервіс для генерації синтетичних e-Commerce даних на основі LLM-симуляції користувацьких сесій�
Рубаненко Марія Сергіївна ПЗПІ-22-7, �Голоха Нікіта Едуардович ПЗПІ-22-7,
Решетняк Антон Олексійович ПЗПІ-22-4
Наукові керівники:
Широкопетлєва Марія Сергіївна старший викладач кафедри ПІ, Кобзєв Володимир Григорович, професор кафедри ПІ
березень 2026
Актуальність
Для сучасних систем електронної комерції важливо мати реалістичний потік подій, що відображає природну поведінку користувачів і дозволяє коректно тестувати аналітичні конвеєри, інформаційні панелі та моделі машинного навчання. У середовищах розробки і тестування такий потік даних зазвичай відсутній, а великі масиви реальних подієвих даних майже недоступні у відкритому доступі. Крім того, існує брак навчальних платформ, на яких можна працювати з наближеним до реальності безперервним потоком даних.
Програмний сервіс генерації синтетичних e-Commerce даних на основі LLM-симуляції користувацьких сесій призначений для формування реалістичного синтетичного трафіку, який може використовуватися для тестування, аналітики та навчання.
2
Час розробки проєкту: 01.09.2025 – 01.06.2026
Задачі проєкту включають:
USE-CASE Diagram
3
Узагальнена архітектура системи
4
Адмін
WebServer
FastAPI :8000
Worker
Celery + Playwright
LLM (Ollama)
qwen2.5:7b :11343
task
run_session
observe/decide
Mock-Website
Flask :3000
PostgreSQL
SQL Database
Scheduler
Celery Beat
Redis
черга задач
action
JS events
analytics
audit
Суцільна лінія
— основний потік даних
Пунктирна лінія
— аудит (дії агента)
Контейнери та потік даних
Діаграма Розгортання
5
Механізм роботи агента
6
Observe
Accessibility tree
сторінки
Think
LLM приймає
рішення
Act
Playwright
виконує дію
повторити
Приклад одного кроку агента
// LLM рішення (agent_decisions)
{ thought: "Бачу кнопку купити,
натисну її",
action: "click",
element: "Add to Cart" }
// JS Tracker → Collector (tracker_events)
{ event_type: "add_to_cart",
product_id: "wireless-headphones",
price: 149.99,
funnel_stage: "cart" }
Audit stream (Worker → PostgreSQL)
events
Кожна дія агента: click, scroll, type, wait
agent_decisions
Рішення LLM: thought, action, response_time_ms
Analytics stream (JS → Collector → PostgreSQL)
tracker_events
Бізнес-події: page_view, add_to_cart, purchase
Збагачення: UA, device, funnel_stage, IP
Валідація за схемою (Data Contract)
Зв'язок: visitor_id = sessions.id (cookie)
Використані технології
--------------------------------------------------------
Клієнтська частина
Серверна частина
----------------------------------------------------------------------------------------------------------------
7
Серверна частина системи
Серверна частина забезпечує:
Серверна частина є центральним компонентом системи, що забезпечує керування процесом генерації синтетичних користувацьких сесій, взаємодію між основними модулями та доступ до результатів роботи платформи.
8
Клієнтська частина
9
Висновки
10
Розроблено програмну систему для генерації синтетичних e-Commerce даних на основі LLM-симуляції користувацьких сесій. Система забезпечує керування сценаріями генерації, відтворення дій користувача у вебсередовищі, збереження подій та надання доступу до результатів через прикладний програмний інтерфейс і механізми сповіщення. Запропоноване рішення може бути використане для тестування інформаційних систем, аналітичних процесів і навчальних задач.
Перспективи розвитку