Визуализация данных из CSV-файла

В качестве исходных данных будет использоваться файл SuperHeroes.csv с информацией о супергероях — имя, пол, раса, издатель комиксов и т.д.

DataLens можно использовать для исследования зависимостей, например:

  • Веса супергероя от его пола.
  • Веса супергероя от его принадлежности к лагерю хороших или плохих.

Чтобы визуализировать зависимости для исследования, нужно создать подключение к CSV-файлу, на его основе создать датасет и настроить дашборд, добавив на него соответствующие виджеты с графиками.

Шаг 1. Создайте подключение и датасет

Создайте датасет на основе подключения к CSV-файлу с информацией о супергероях или выберите существуюещее подключение из списка подключений.

  1. Перейдите в DataLens.

  2. Нажмите кнопку Создать датасет.

    image

  3. Нажмите кнопку Создать подключение.

    image

  4. Выберите CSV.

    image

  5. Нажмите кнопку Выбрать CSV-файл.

    image

  6. Выберите необходимый файл. В данном примере SuperHeroes.csv.

  7. Подождите, пока на экране появится содержимое таблицы.

  8. Нажмите кнопку Сохранить.

    image

  9. Введите имя датасета SuperHeroes.

  10. Нажмите кнопку Создать.

    image

  11. Создайте поле, в котором будут хранится показатели среднего веса супергероя.

    1. Продублируйте поле Weight.

    2. Нажмите значок image в строке Weight.

    3. Выберите Продублировать.

      image

    4. Переименуйте дубликат поля Weight (1) в Weight avg: нажмите на имя строки, удалите текущее имя и введите новое.

    5. В столбце Агрегация для поля Weight avg выберите Среднее.

      image

  12. Нажмите кнопку Сохранить в верхнем правом углу и сохраните датасет.

    image

Шаг 2. Создайте первый чарт

Для визуализации разделения по половому признаку создайте чарт — столбчатую диаграмму.

  1. Нажмите кнопку Создать чарт в верхнем правом углу.

    image

  2. В открывшемся окне во втором столбце нажмите на Линейная диаграмма и выберите другой тип чарта: Столбчатая диаграмма.

    image

  3. Добавьте на график имена супергероев. Для этого из первой колонки из раздела Измерения перетащите поле Name на ось X во второй колонке.

  4. Дополните график весами супергероев. для этого из первой колонки из раздела Показатели перетащите поле Weight avg на ось Y во второй колонке.

  5. Отсортируйте график по весам, например, по убыванию.

    1. Из первой колонки из раздела Показатели перетащите поле Weight avg в секцию Сортировка.
  6. Оставьте на графике только тех супергероев, чей вес больше нуля.

    1. Из первой колонки из раздела Показатели перетащите поле Weight avg в секцию Фильтры.

    2. В открывшемся окне укажите Больше и 0.

    3. Нажмите кнопку Применить.

      image

  7. Добавьте на график цветовое разделение супергероев по половому призаку. Для этого из первой колонки из раздела Измерения перетащите поле Gender в секцию Цвет.

    image

  8. Сохраните чарт.

    1. Нажмите кнопку Сохранить в верхнем правом углу и сохраните чарт.

      image

    2. В открывшемся окне введите название чарта SuperHeroes — gender.

    3. Нажмите кнопку Сохранить.

      image

Шаг 3. Создайте второй чарт

Для визуализации по принадлежности к лагерю хороших или плохих создайте чарт — столбчатую диаграмму.

  1. Скопируйте чарт, получившийся на предыдущем шаге.

    1. Нажмите значок image в верхнем левом углу рядом с названием чарта.

    2. Выберите Копировать.

      image

    3. В открывшемся окне введите название нового чарта SuperHeroes — alignment.

    4. Нажмите кнопку Готово.

      image

  2. Добавьте на график цветовое разделение супергероев по принадлжености к лагерю хороших или плохих. Для этого из первой колонки из раздела Измерения перетащите поле Alignment в секцию Цвет.

    Предыдущее значение секции (поле Gender) будет заменено на Alignment.

    image

  3. Нажмите кнопку Сохранить в верхнем правом углу и сохраните чарт.

    image

Шаг 4. Создайте дашборд

Создайте дашборд, на который будут добавлены диаграммы.

  1. Перейдите на главную страницу DataLens. Для этого нажмите на надпись Yandex DataLens в левом верхнем углу.

  2. Нажмите кнопку Создать дашборд.

    image

  3. Введите название дашборда SuperHeroes dashboard.

  4. Нажмите кнопку Создать.

    image

Шаг 5. Добавьте чарты на дашборд

Подготовьте дашборд для исследования, добавив на него оба чарта.

  1. В открывшемся дашборде нажмите кнопку Редактировать в правом верхнем углу.

    image

  2. Нажмите кнопку Добавить.

  3. Выберите Чарт.

    image

  4. В открывшемся окне нажмите кнопку Выбрать.

  5. Выберите чарт SuperHeroes — gender. После этого автоматически заполнится поле Заголовок по названию выбранного чарта.

  6. Нажмите кнопку Добавить.

    image

  7. Добавьте еще один чарт. Пройдите все шаги сначала и укажите на 4 пункте чарт SuperHeroes — alignment.

    image

Шаг 6. Добавьте селекторы на дашборд

Добавьте селекторы, чтобы иметь возможность фильтровать супергероев по расам (поле Race) и издательствам (поле Publisher).

  1. Нажмите кнопку Добавить.

  2. Выберите Селектор.

    image

  3. Под надписью Датасет нажмите кнопку Выбрать.

  4. Выберите датасет SuperHeroes.

  5. Под надписью Поле нажмите кнопку Выбрать.

  6. Выберите поле Race. После этого автоматически заполнится поле Заголовок по названию выбранного поля.

  7. Включите опцию Множественный выбор.

  8. Нажмите кнопку Добавить.

    image

  9. Добавьте еще один селектор. Пройдите все шаги сначала и укажите в пункте 6 поле Publisher.

    image

Шаг 7. Настройте отображение виджетов и приступите к исследованию зависимостей

  1. Перетащите селекторы наверх страницы рядом друг с другом.

  2. Растяните чарты по ширине дашборда.

  3. Нажмите кнопку Сохранить в верхнем правом углу и сохраните дашборд.

    image

  4. Примените различные фильтры и исследуйте зависимости веса от пола и лагеря супергероя.

    В датасете, который был исследован, прослеживаются следующие зависимости:

    • Мужчины в основном тяжелее женщин.
    • Плохие супергерои в основном тяжелее хороших.

Шаг 8. Продолжите исследование данных о супергероях

Вы можете создать новые показатели в датасете, например, средний рост (среднее от поля Height) и количество супергероев (количество уникальных от поля Name) и ответить на вопросы:

  • Представителей какой расы больше всего?
  • Есть ли зависимость роста от принадлежности к лагерю хороших или плохих?
  • Какая студия создала больше всего супергероев?