Датасет

Датасет описывает набор данных и его структуру. Набор данных датасета представлен в виде полей. Подробнее в разделе Модель данных.

Yandex DataLens позволяет создать датасет на основе источника данных, для которого существует подключение. Источником данных для датасета может быть только одна таблица.

В DataLens есть несколько режимов работы датасета с источниками данных. Подробнее в разделе Режим работы с источником данных.

Модель данных

Набор данных датасета представлен в виде набора полей.

Поле данных

Поля определяют структуру и формат набора данных. Поле может быть одним из следующих типов:

  • Измерение. Содержит значения, которые определяют характеристику данных. Например, город, дата покупки, категория продукта. К полю с измерением не применяется функция агрегации, в противном случае поле становится показателем. В интерфейсе измерения отображаются зеленым цветом.
  • Показатель. Содержит числовые значения, к которым применяются функции агрегации (сведения). Например, сумма кликов, количество переходов. Если снять с такого поля функцию агрегации, оно станет измерением. В интерфейсе показатели отображаются синим цветом.

При создании датасета вы можете дублировать существующие поля и создавать новые.

Вычисляемое поле

DataLens позволяет создавать вычисляемые поля с помощью функций агрегации и функций, которые доступны для источника данных. Полный список функций в разделе Справочник функций.

Типы данных

В сервисе DataLens есть следующие типы данных:

  • Логический
  • Дата (в формате ГГГГ-ММ-ДД)
  • Дата и время (в формате ГГГГ-ММ-ДД чч:мм:сс)
  • Дробное число
  • Целое число
  • Строка

Агрегация данных

Для показателей доступны следующие функции агрегации:

Имя Описание Поддерживаемые типы
Нет Без агрегации Все типы
Среднее Среднее арифметическое значений Дробное число
Целое число
Количество Количество записей Строка
Дата
Дата и время
Дробное число
Целое число
Количество уникальных Количество уникальных записей Строка
Дата
Дата и время
Дробное число
Целое число
Максимум Максимальное значение Дата
Дата и время
Дробное число
Целое число
Минимум Минимальная значение Дата
Дата и время
Дробное число
Целое число
Сумма Сумма значений Дробное число
Целое число

Режим работы с источником данных

Датасет работает с источником в следующих режимах:

  • Прямой доступ.
  • Единовременная материализация.
  • Периодическая материализация.

Прямой доступ

Все запросы к данным исполняются на стороне источника.

Примечание

Если в качестве источника данных вы используете Metrica API, то DataLens будет использовать прямой доступ к данным.

Единовременная материализация

Данные загружаются в БД материализации DataLens единовременно. Все последующие запросы обрабатываются на загруженных данных. Чтобы синхронизировать хранилище DataLens с источником, данные можно загрузить повторно.

Примечание

Если в качестве источника данных вы используете CSV-файл, то DataLens автоматически материализует датасет.

Периодическая материализация

Данные загружаются в БД материализации DataLens по расписанию. Расписание задается в настройках датасета.

Управление доступом

Вы можете настроить права доступа к датасету. Подробнее в разделе Управление доступом.

См. также