1 of 10

Основные характеристики Big Data

Лекция 2

2 of 10

Свойства 3V Big Data

  • Объем (Volume)
  • Разнообразие (Variety)
  • Скорость (Velocity)

3 of 10

Свойства 5V Big Data

  • Объем (Volume)
  • Разнообразие (Variety)
  • Скорость (Velocity)
  • Достоверность (Veracity)
  • Ценность (Value)

4 of 10

Свойства и особенности

  • Большие объемы из-за постоянного роста данных
  • Процесс обработки должен быть масштабируемым и способным обрабатывать данные на высоких скоростях
  • Разнообразие данных происходит из разных источников (соцсети, сенсоры IoT, веб-сайты)
  • Необходима проверка подлинности
  • Требуются сложные алгоритмы и инструменты

5 of 10

Работа с большими данными

  • Сбор
  • Хранение
  • Обработка
  • Анализ
  • Использование

6 of 10

Сбор больших данных: Источники

  • Интернет
  • Мобильные устройства
  • Датчики и сенсоры
  • Медицинская техника
  • Спутники

7 of 10

Сбор больших данных: Обработка

  • Сбор информации:
    • Crawlers, Parsers, Scrapers, Collectors

  • Передача:
    • Потоковые данные (Apache Kafka, Amazon Kinesis)
    • Пакетные данные (Apache Avro, Parquet)

8 of 10

Сбор больших данных: Хранение

  • NoSQL базы данных (MongoDB, Redis)
  • Распределенные файловые системы (HDFS, Google FS)
  • Облачные решения (Amazon S3, Google Cloud Storage, Azure Blob Storage)

9 of 10

Сбор больших данных: Обработка

  • Очистка
  • Интеграция
  • Трансформация
  • Редукция
  • Агрегация

10 of 10

Основные характеристики Big Data

Лекция 2