Yandex Cloud
  • Сервисы
  • Решения
  • Почему Yandex Cloud
  • Сообщество
  • Тарифы
  • Документация
  • Связаться с нами
Подключиться
Language / Region
Проект Яндекса
© 2023 ООО «Яндекс.Облако»
Практические руководства
  • Веб-сервис
    • Все руководства
    • Статический сайт в Object Storage
    • Сайт на LAMP- или LEMP-стеке
    • Отказоустойчивый сайт с балансировкой нагрузки с помощью Network Load Balancer
    • Отказоустойчивый сайт с балансировкой нагрузки с помощью Application Load Balancer
    • Сайт на базе Joomla с БД PostgreSQL
    • Создание сайта на WordPress
    • Сайт на WordPress с БД MySQL
    • Перенос WordPress сайта с хостинга в Yandex Cloud
    • Сайт на базе 1С-Битрикс
    • Организация виртуального хостинга
    • Создание балансировщика с защитой от DDoS
    • Публикация обновлений для игр с помощью Cloud CDN
    • Интеграция L7-балансировщика с Cloud CDN и Object Storage
    • Сине-зеленое и канареечное развертывание версий сервиса
    • Терминирование TLS-соединений
  • Интернет-магазины
    • Все руководства
    • Интернет-магазин на 1С-Битрикс
    • Интернет-магазин на OpenCart
  • Архив данных
    • Все руководства
    • Однонодовый файловый сервер
    • Настройка SFTP-сервера на Centos 7
    • Резервное копирование в Object Storage через Acronis
    • Резервное копирование в Object Storage с помощью CloudBerry Desktop Backup
    • Резервное копирование в Object Storage через Duplicati
    • Резервное копирование в Object Storage с помощью Bacula
    • Резервное копирование в Object Storage с помощью Veritas Backup Exec
    • Распознавание архива изображений в Vision
  • Тестовая среда
    • Все руководства
    • Тестирование приложений с помощью GitLab
    • Создание тестовых ВМ через GitLab CI
    • Высокопроизводительные вычисления на прерываемых ВМ
    • Эмуляция множества IoT-устройств
    • Нагрузочное тестирование gRPC-сервиса
    • Развертывание и нагрузочное тестирование gRPC-сервиса с масштабированием
    • HTTPS-тест с постоянной нагрузкой с помощью Phantom
    • HTTPS-тест со ступенчатой нагрузкой с помощью Pandora
    • Нагрузочное тестирование с нескольких агентов
  • Управление инфраструктурой
    • Все руководства
    • Начало работы с Terraform
    • Загрузка состояний Terraform в Object Storage
    • Начало работы с Packer
    • Сборка образа ВМ с набором инфраструктурных инструментов с помощью Packer
    • Автоматизация сборки образов с помощью Jenkins и Packer
    • Непрерывное развертывание контейнеризованных приложений с помощью GitLab
    • Создание кластера Linux-серверов «1С:Предприятия» с кластером Managed Service for PostgreSQL
    • Миграция в Yandex Cloud с помощью Hystax Acura
    • Защита от сбоев с помощью Hystax Acura
    • Настройка синхронизации часов с помощью NTP
    • Работа с группой ВМ с автомасштабированием
    • Масштабирование группы ВМ по расписанию
    • Автомасштабирование группы ВМ для обработки сообщений из очереди Message Queue
    • Обновление группы ВМ под нагрузкой
    • Передача логов с ВМ в Cloud Logging
    • Резервное копирование ВМ с помощью Hystax Acura Backup
    • Настройка отказоустойчивой архитектуры в Yandex Cloud
    • Создание SAP-программы в Yandex Cloud
    • Настройка локального кеширующего DNS-резолвера
    • Миграция DNS-зон из Яндекс 360 в Cloud DNS
    • Интеграция Cloud DNS и корпоративного сервиса DNS
    • Создание веб-хука резолвера ACME для ответов на DNS01-проверки
    • Запись логов балансировщика в PostgreSQL
    • Создание триггера для бюджетов, который вызывает функцию для остановки ВМ
  • Построение Data Platform
    • Все руководства
    • Миграция БД из стороннего кластера Apache Kafka® в Managed Service for Apache Kafka®
    • Поставка данных из Managed Service for MySQL в Managed Service for Apache Kafka® с помощью Data Transfer
    • Поставка данных из Managed Service for PostgreSQL в Managed Service for Apache Kafka® с помощью Data Transfer
    • Поставка данных из Managed Service for Apache Kafka® в Managed Service for ClickHouse с помощью Data Transfer
    • Перенос данных между кластерами Managed Service for Apache Kafka® с помощью Data Transfer
    • Поставка данных из Managed Service for Apache Kafka® в Managed Service for YDB с помощью Data Transfer
    • Поставка данных из Managed Service for MySQL в Managed Service for Apache Kafka® с помощью Debezium
    • Поставка данных из Managed Service for PostgreSQL в Managed Service for Apache Kafka® с помощью Debezium
    • Настройка Kafka Connect для работы с кластером Managed Service for Apache Kafka®
    • Управление схемами данных в Managed Service for Apache Kafka®
    • Использование Managed Schema Registry с Managed Service for Apache Kafka®
    • Использование Confluent Schema Registry с Managed Service for Apache Kafka®
    • Миграция базы данных из MySQL в ClickHouse с помощью Data Transfer
    • Асинхронная репликация данных из PostgreSQL в ClickHouse
    • Обмен данными между Managed Service for ClickHouse и Data Proc
    • Настройка Managed Service for ClickHouse для Graphite
    • Получение данных из Managed Service for Apache Kafka® в Managed Service for ClickHouse
    • Поставка данных из Managed Service for Apache Kafka® в Managed Service for ClickHouse с помощью Data Transfer
    • Получение данных из RabbitMQ в Managed Service for ClickHouse
    • Сохранение потока данных Data Streams в Managed Service for ClickHouse
    • Использование гибридного хранилища в Managed Service for ClickHouse
    • Шардирование таблиц Managed Service for ClickHouse
    • Настройка Cloud DNS для доступа к кластерам управляемых баз данных из других облачных сетей
    • Настройка Cloud DNS для доступа к кластеру Managed Service for ClickHouse из других облачных сетей
    • Обмен данными между Managed Service for ClickHouse и Data Proc
    • Импорт данных из Managed Service for MySQL в Data Proc с помощью Sqoop
    • Импорт данных из Managed Service for PostgreSQL в Data Proc с помощью Sqoop
    • Использование скриптов инициализации для настройки GeeseFS в Data Proc
    • Миграция данных из стороннего кластера Elasticsearch в Managed Service for Elasticsearch с помощью Reindex API
    • Миграция коллекций из стороннего кластера MongoDB в Managed Service for MongoDB
    • Миграция данных в Managed Service for MongoDB
    • Шардирование коллекций MongoDB
    • Анализ производительности и оптимизация MongoDB
    • Миграция БД из стороннего кластера MySQL в кластер Managed Service for MySQL
    • Анализ производительности и оптимизация Managed Service for MySQL
    • Синхронизация данных из стороннего кластера MySQL в Managed Service for MySQL с помощью Data Transfer
    • Миграция БД из Managed Service for MySQL в сторонний кластер MySQL
    • Миграция БД из Managed Service for MySQL в Object Storage с помощью Data Transfer
    • Импорт данных из Managed Service for MySQL в Data Proc с помощью Sqoop
    • Поставка данных из Managed Service for MySQL в Managed Service for Apache Kafka® с помощью Data Transfer
    • Поставка данных из Managed Service for MySQL в Managed Service for Apache Kafka® с помощью Debezium
    • Миграция БД из Managed Service for MySQL в Managed Service for YDB с помощью Data Transfer
    • Создание кластера PostgreSQL для «1С:Предприятия»
    • Анализ производительности и оптимизация Managed Service for PostgreSQL
    • Миграция БД из Managed Service for PostgreSQL
    • Миграция БД из стороннего кластера PostgreSQL в Managed Service for PostgreSQL
    • Асинхронная репликация данных из PostgreSQL в ClickHouse
    • Поставка данных из Managed Service for PostgreSQL в Managed Service for Apache Kafka® с помощью Data Transfer
    • Поставка данных из Managed Service for PostgreSQL в Managed Service for Apache Kafka® с помощью Debezium
    • Импорт данных из Managed Service for PostgreSQL в Data Proc с помощью Sqoop
    • Поставка данных из Managed Service for PostgreSQL в Managed Service for YDB с помощью Data Transfer
    • Миграция БД из Managed Service for PostgreSQL в Object Storage
    • Миграция БД из Greenplum® в ClickHouse
    • Миграция БД из Greenplum® в PostgreSQL
    • Миграция БД из стороннего кластера Redis в Managed Service for Redis
    • Использование кластера Managed Service for Redis в качестве хранилища сессий PHP
  • Продукты Microsoft в Yandex Cloud
    • Все руководства
    • Развертывание Active Directory
    • Развертывание Microsoft Exchange
    • Развертывание Remote Desktop Services
    • Развертывание группы доступности Always On с внутренним сетевым балансировщиком
    • Развертывание Remote Desktop Gateway
  • Сетевая инфраструктура
    • Все руководства
    • Архитектура и защита базового интернет-сервиса
    • Настройки DHCP для работы с корпоративным DNS-сервером
    • Маршрутизация с помощью NAT-инстанса
    • Создание туннеля IPSec VPN
    • Установка виртуального роутера Cisco CSR 1000v
    • Установка виртуального роутера Mikrotik CHR
    • Соединение с облачной сетью при помощи OpenVPN
    • Создание и настройка шлюза UserGate в режиме прокси-сервера
    • Создание и настройка шлюза UserGate в режиме межсетевого экрана
    • Настройка сети для Data Proc
  • Визуализация и анализ данных
    • Все руководства
    • Визуализация данных из файла
    • Создание и публикация диаграммы с картой Москвы из CSV-файла
    • Анализ продаж сети магазинов из БД ClickHouse
    • Анализ открытых данных ДТП на дорогах России
    • Анализ продаж и локаций пиццерий на данных из БД ClickHouse и Cloud Marketplace
    • Веб-аналитика с подключением к Яндекс Метрике
    • Веб-аналитика с расчетом воронок и когорт на данных Яндекс Метрики
    • Аналитика мобильного приложения на данных AppMetrica
    • Анализ статистики подкастов Яндекс Музыки (для авторов подкастов)
    • Визуализация данных с помощью QL-чарта
    • Анализ customer journey мобильного приложения на данных AppMetrica
    • Анализ логов Object Storage при помощи DataLens
  • Интернет вещей
    • Руководства по работе с интернетом вещей
    • Мониторинг состояния географически распределенных устройств
    • Мониторинг показаний датчиков и уведомления о событиях
  • Бессерверные технологии
    • Сокращатель ссылок
    • Ввод данных в системы хранения
    • Хранение журналов работы приложения
    • Развертывание веб-приложения с использованием Java Servlet API
    • Разработка Slack-бота
    • Разработка Telegram-бота
    • Разработка пользовательской интеграции в API Gateway
    • Разработка CRUD API для сервиса фильмов
    • Разработка навыка Алисы и сайта с авторизацией
  1. Визуализация и анализ данных
  2. Анализ customer journey мобильного приложения на данных AppMetrica

Анализ customer journey мобильного приложения на данных AppMetrica

Статья создана
Yandex Cloud
,
улучшена
Dmitry A.
  • Подготовьте облако к работе
  • 1. Подключите ClickHouse и DataSphere
    • 1.1. Подключите ClickHouse
    • 1.2. Подключите DataSphere
    • 1.3. Клонируйте репозиторий в DataSphere
  • 2. Получите и загрузите данные в ClickHouse
    • 2.1. DataSphere. Выгрузите данные тестового приложения через Яндекс Диск
    • 2.2. Выгрузите данные из AppMetrica
    • 2.3. ClickHouse. Получите адрес кластера
    • 2.4. DataSphere. Загрузите данные в ClickHouse
  • 3. DataSphere. Сравните товары по охвату и частоте
  • 4. Подключите DataLens и создайте чарты
    • 4.1. Подключитесь к DataLens
    • 4.2. Создайте подключение к ClickHouse в DataLens
    • 4.3. Создайте датасет на базе подключения
    • 4.4. Создайте чарт — точечная диаграмма
    • 4.5. Создайте чарт — таблица
  • 5. Создайте и настройте дашборд в DataLens
  • 6. Customer journey. Создайте SQL-чарт и диаграмму Sankey
    • 6.1. Создайте SQL-чарт в DataLens
    • 6.2. Создайте диаграмму Sankey в DataSphere

В этом сценарии вы проведете анализ поведения пользователей в мобильном приложении на данных AppMetrica:

  • Обработаете данные с помощью скриптов на языке Python, описанных в Jupyter ноутбуках в Yandex DataSphere.
  • Построите чарты и дашборды в Yandex DataLens.
  • Сравните товары по охвату и частоте.

Customer journey — это последовательность действий пользователя. Анализ поведения пользователей поможет узнать, как люди используют продукт: какие страницы посещают и функции используют, где сталкиваются с трудностями. С помощью этой информации легче найти правильные решения для развития продукта.

В качестве источника будут использоваться сэмплированные и анонимизированные данные мобильного приложения Авто.ру, выгруженные из AppMetrica.

Схема архитектуры данных

image

Совет

В сценарии используется файл с предварительно выгруженными данными из AppMetrica, поэтому вы можете пройти сценарий без доступа к мобильному приложению и AppMetrica.

Для решения ваших рабочих задач рекомендуем напрямую экспортировать данные из AppMetrica в ClickHouse.

Подготовьте облако к работе, затем исследуйте и визуализируйте данные по шагам:

  1. Подключите ClickHouse и DataSphere
    1. Подключите ClickHouse
    2. Подключите DataSphere
    3. Клонируйте репозиторий в DataSphere
  2. Получите и загрузите данные в ClickHouse
    1. DataSphere. Выгрузите данные тестового приложения через Яндекс Диск
    2. Выгрузите данные из AppMetrica
    3. ClickHouse. Получите адрес кластера
    4. DataSphere. Загрузите данные в ClickHouse
  3. DataSphere. Сравните товары по охвату и частоте
  4. Подключите DataLens и создайте чарты
    1. Подключитесь к DataLens
    2. Создайте подключение к ClickHouse в DataLens
    3. Создайте датасет на базе подключения
    4. Создайте чарт — точечная диаграмма
    5. Создайте чарт — таблица
  5. Создайте и настройте дашборд в DataLens
  6. Customer journey. Создайте SQL-чарт и диаграмму Sankey
    1. Создайте SQL-чарт в DataLens
    2. Создайте диаграмму Sankey в DataSphere

Подготовьте облако к работе

Перед работой нужно зарегистрироваться в Yandex Cloud и создать платежный аккаунт:

  1. Перейдите в консоль управления, затем войдите в Yandex Cloud или зарегистрируйтесь, если вы еще не зарегистрированы.
  2. На странице биллинга убедитесь, что у вас подключен платежный аккаунт, и он находится в статусе ACTIVE или TRIAL_ACTIVE. Если платежного аккаунта нет, создайте его.

Если у вас есть активный платежный аккаунт, вы можете создать или выбрать каталог, в котором будет работать ваша инфраструктура, на странице облака.

Подробнее об облаках и каталогах.

1. Подключите ClickHouse и DataSphere

1.1. Подключите ClickHouse

  1. В консоли управления выберите в списке слева Managed Service for ClickHouse.

  2. Нажмите Создать кластер.

  3. Укажите настройки кластера ClickHouse.

    1. Базовые параметры — укажите имя кластера appmetrica_analysis.

    2. Класс хоста — выберите тип виртуальной машины burstable и тип хоста b2.medium.

      Важно

      Не рекомендуется использовать конфигурации ВМ типа burstable в продакшн-среде. В этом руководстве они используются в качестве примера. Для продакшн-решений используйте конфигурации standard или memory-optimized.

      image

    3. Размер хранилища — оставьте значение 10 ГБ.

    4. База данных — укажите имя базы данных autoru_appmetrica, имя пользователя и пароль. Запомните эти данные.

      image

    5. Хосты — нажмите значок . Включите опцию Публичный доступ и нажмите кнопку Сохранить.

    6. Дополнительные настройки — включите 4 опции:

      • Доступ из DataLens
      • Доступ из консоли управления
      • Доступ из Метрики и AppMetrica
      • Доступ из Serverless
    7. После всех настроек нажмите кнопку Создать кластер.

1.2. Подключите DataSphere

  1. Перейдите в консоль управления.
  2. Выберите в списке слева DataSphere.
  3. Нажмите Создать проект.
  4. Укажите название проекта appmetrica-analysis и нажмите Создать.
  5. Откройте проект. Для этого в строке с именем проекта нажмите значок → Открыть.

1.3. Клонируйте репозиторий в DataSphere

  1. В левом верхнем углу нажмите значок Git Clone — .

    image

  2. В открывшемся окне укажите URI репозитория https://github.com/firstsvet/yandex_appmetrika_cloud_case и нажмите кнопку CLONE.

2. Получите и загрузите данные в ClickHouse

Если у вас нет приложения AppMetrica или в нем недостаточно данных, или вы гарантированно хотите пройти все шаги инструкции и получить результат, перейдите к разделу 2.1 (пропустите 2.2).

Если у вас есть приложение AppMetrica и доступ к нему, перейдите к разделу 2.2 — этот шаг рекомендуется опытному пользователю, так как может потребоваться самостоятельная доработка скриптов (пропустите 2.1).

2.1. DataSphere. Выгрузите данные тестового приложения через Яндекс Диск

Примечание

Пропустите этот раздел, если вы работаете с данными своего приложения.

  1. В меню слева откройте папку yandex_appmetrika_cloud_case → ноутбук 1.upload_data_from_yadisk.ipynb.

  2. Выполните все шаги (ячейки с кодом) в ноутбуке 1.upload_data_from_yadisk.ipynb.

    Чтобы выполнить шаг, нажмите на номер слева от ячейки, затем — кнопку выполнения вверху. Вместо номера появится символ [*]. После того, как номер появится снова, запустите следующий шаг.

    image

2.2. Выгрузите данные из AppMetrica

Для настройки подключения и выгрузки данных из своего приложения воспользуйтесь инструкцией Экспорт данных в Yandex Cloud.

2.3. ClickHouse. Получите адрес кластера

  1. Перейдите в кластер ClickHouse appmetrica_analysis, который вы создали в разделе 1.1. Дождитесь, когда у кластера появится статус Alive. После этого откройте кластер — нажмите на него.

    image

  2. Выберите в списке слева Хосты.

  3. На вкладке Обзор перейдите к столбцу Имя хоста. Чтобы скопировать имя хоста, наведите указатель мыши справа от названия хоста и нажмите значок копирования.

2.4. DataSphere. Загрузите данные в ClickHouse

  1. Откройте папку yandex_appmetrika_cloud_case → ноутбук 2.upload_data_to_ClickHouse.ipynb.

  2. Вставьте данные в переменные:

    • Имя хоста из раздела 2.3 — в переменную CH_HOST_NAME.

    • Имя пользователя из раздела 1.1 — в переменную CH_USER.

    • Имя базы данных из раздела 1.1 — в переменную CH_DB_NAME.

      image

  3. В папке yandex_appmetrika_cloud_case создайте новый текстовый файл с названием chpass.txt.

    image

  4. Запишите в файл chpass.txt пароль заведенного пользователя. Сохраните и закройте файл.

  5. Выполните все шаги (ячейки с кодом) в ноутбуке.

3. DataSphere. Сравните товары по охвату и частоте

  1. Откройте папку yandex_appmetrika_cloud_case → ноутбук Case_1.ipynb.

  2. Вставьте данные в переменные:

    • Имя хоста из раздела 2.3 — в переменную CH_HOST_NAME.
    • Имя пользователя из раздела 1.1 — в переменную CH_USER.
    • Имя базы данных из раздела 1.1 — в переменную CH_DB_NAME.
  3. Выполните все шаги (ячейки с кодом) в ноутбуке.

  4. Посмотрите промежуточные результаты.

    image

4. Подключите DataLens и создайте чарты

4.1. Подключитесь к DataLens

  1. Перейдите к DataLens: на странице созданного кластера ClickHouse слева в меню выберите DataLens.
  2. В открывшемся окне нажмите кнопку Активировать.
  3. Выберите каталог default и нажмите Активировать DataLens.

4.2. Создайте подключение к ClickHouse в DataLens

  1. Нажмите кнопку Создать подключение.

  2. Выберите подключение ClickHouse.

  3. Заполните настройки подключения.

    1. Введите название AppMetrica_workshop.

    2. Выберите хост ClickHouse из выпадающего списка Имя хоста.

    3. Выберите имя пользователя и введите пароль из раздела 1.1.

    4. Нажмите Проверить подключение.

    5. Включите опцию Разрешить подзапросы в датасетах и запросы из чартов.

      image

    6. После успешной проверки подключения в правом верхнем углу нажмите кнопку Создать.

4.3. Создайте датасет на базе подключения

  1. В правом верхнем углу нажмите Создать датасет.

  2. Выберите таблицу autoru_appmetrica.auto_data в качестве источника. Для этого перетащите таблицу из списка слева в область редактирования.

  3. Откройте вкладку Поля.

  4. Создайте вычисляемое поле users:

    1. В правом верхнем углу нажмите кнопку Добавить поле.
    2. Слева вверху введите название поля users.
    3. В область справа вставьте формулу countd([appmetrica_device_id]).
    4. Нажмите кнопку Создать.

    image

  5. Повторите предыдущий шаг для других полей:

    • reach с формулой COUNTD([appmetrica_device_id])/COUNTD([appmetrica_device_id] FIXED).
    • events с формулой COUNT([session_id]).
    • events per user с формулой [events]/[users].
  6. В правом верхнем углу нажмите кнопку Сохранить.

  7. Назовите датасет autoru_backend_data и нажмите кнопку Создать.

4.4. Создайте чарт — точечная диаграмма

  1. В правом верхнем углу нажмите кнопку Создать чарт.

  2. Выберите тип Точечная диаграмма.

  3. Перетащите поля в область чарта:

    • Показатель reach в секцию X.
    • Показатель events per user в секцию Y.
    • Измерение mark в секцию Точки.
    • Измерение event_name в секцию Цвета.

    image

  4. В правом верхнем углу нажмите кнопку Сохранить.

  5. В открывшемся окне введите имя чарта Охват и события и нажмите кнопку Сохранить.

4.5. Создайте чарт — таблица

  1. Выберите тип Таблица.

  2. Перетащите поля в область чарта:

    • Измерение mark в секцию Столбцы.
    • Показатель users в секцию Столбцы.
    • Показатель users в секцию Сортировка.

    image

  3. В правом верхнем углу нажмите кнопку справа от Сохранить и затем Сохранить как.

  4. В открывшемся окне введите имя чарта Таблица по маркам и нажмите кнопку Сохранить.

5. Создайте и настройте дашборд в DataLens

  1. Откройте главную страницу DataLens и нажмите Создать дашборд.

  2. Укажите название дашборда auto.ru app и нажмите кнопку Создать.

  3. Добавьте чарт на дашборд.

    1. В правом верхнем углу нажмите Добавить → Чарт.
    2. Из выпадающего списка Чарт выберите Таблица по маркам. Поле Название заполнится автоматически.
    3. Нажмите кнопку Добавить.

    image

  4. Повторите предыдущий шаг для чарта Охват и события.

  5. Добавьте и настройте селектор.

    1. В правом верхнем углу нажмите Добавить → Селектор.
    2. В списке Датасет выберите autoru_backend_data.
    3. В списке Поле выберите event name.
    4. В списке Значение по умолчанию выберите любой вариант.
    5. Нажмите кнопку Добавить.
  6. Расположите чарты и селектор на дашборде. Чтобы изменить размер элемента, потяните за правый нижний угол.

  7. В правом верхнем углу нажмите кнопку Сохранить.

    image

Попробуйте в селекторе изменить event name на другое значение — посмотрите, как изменится дашборд.

6. Customer journey. Создайте SQL-чарт и диаграмму Sankey

6.1. Создайте SQL-чарт в DataLens

С помощью SQL-чартов вы можете изучать последовательности событий и экспериментировать в DataLens.

  1. Откройте главную страницу DataLens и в меню слева выберите Подключения.

  2. Выберите подключение AppMetrica_workshop, которое вы создали на шаге 4.2.

  3. Справа вверху нажмите Создать SQL-чарт.

  4. Введите запрос:

    SELECT uniqExact(t.appmetrica_device_id) as counts, events_seq, 
    
    if(events_seq like '%Звонок%', 'Звонок', 
    if(events_seq like '%Сообщение%', 'Сообщение', 'Не было контакта')) as contact
    
    FROM (
    
    SELECT
        appmetrica_device_id,
        num_steps,
        arrayStringConcat(filt_events, ' -> ') as events_seq
    FROM
        (SELECT
            appmetrica_device_id,
            groupArray(event_name) as events,
            count(event_name) as cnt_events,
            groupArray(datetime) as times,
            arrayEnumerate(events) as indexes,
            arrayDifference(arrayMap(x -> toUInt64(x), times)) as times_diffs,
            arrayFilter(e, i -> (i = 1) or (events[i - 1] != events[i]) or (times_diffs[i] >= 1800),
                        events, indexes) as filt_events,
            length(filt_events) as num_steps
        FROM 
            (SELECT
                appmetrica_device_id,
                datetime,
                event_name
            FROM autoru_appmetrica.raw_appmetrica_auto_data
            ORDER BY appmetrica_device_id,
                datetime)
        GROUP BY appmetrica_device_id
        HAVING cnt_events <= 30)) as t
    
    where  t.num_steps<10
    
    GROUP BY t.events_seq
    HAVING counts>10
    ORDER BY counts desc
    
  5. Нажмите Запустить.

  6. Выберите тип Линейчатая диаграмма.

    image

  7. В правом верхнем углу нажмите Сохранить, введите название чарта Цепочки событий.

  8. Добавьте SQL-чарт на дашборд.

    1. В меню слева нажмите Дашборды.
    2. В списке выберите дашборд auto.ru app.
    3. Справа вверху нажмите Редактировать.
    4. Нажмите Добавить → Чарт.
    5. В списке Чарт выберите Цепочки событий и нажмите Добавить.
    6. Настройте внешний вид дашборда и нажмите Сохранить.

    image

6.2. Создайте диаграмму Sankey в DataSphere

  1. Перейдите в консоль управления.

  2. Выберите в списке слева DataSphere.

  3. Откройте папку yandex_appmetrika_cloud_case → ноутбук Case_2.ipynb.

  4. Выполните все шаги (ячейки с кодом) в ноутбуке Case_2.ipynb.

  5. Вы получите интерактивную диаграмму Sankey, которая показывает сценарии поведения пользователей. Вы можете двигать блоки диаграммы и сохранить результат в виде изображения.

    image

Была ли статья полезна?

Language / Region
Проект Яндекса
© 2023 ООО «Яндекс.Облако»
В этой статье:
  • Подготовьте облако к работе
  • 1. Подключите ClickHouse и DataSphere
  • 1.1. Подключите ClickHouse
  • 1.2. Подключите DataSphere
  • 1.3. Клонируйте репозиторий в DataSphere
  • 2. Получите и загрузите данные в ClickHouse
  • 2.1. DataSphere. Выгрузите данные тестового приложения через Яндекс Диск
  • 2.2. Выгрузите данные из AppMetrica
  • 2.3. ClickHouse. Получите адрес кластера
  • 2.4. DataSphere. Загрузите данные в ClickHouse
  • 3. DataSphere. Сравните товары по охвату и частоте
  • 4. Подключите DataLens и создайте чарты
  • 4.1. Подключитесь к DataLens
  • 4.2. Создайте подключение к ClickHouse в DataLens
  • 4.3. Создайте датасет на базе подключения
  • 4.4. Создайте чарт — точечная диаграмма
  • 4.5. Создайте чарт — таблица
  • 5. Создайте и настройте дашборд в DataLens
  • 6. Customer journey. Создайте SQL-чарт и диаграмму Sankey
  • 6.1. Создайте SQL-чарт в DataLens
  • 6.2. Создайте диаграмму Sankey в DataSphere