Учебный курс: аналитик данных

Общая информация

Дата проведения: 25.09.2024 - 11.12.2024 Завершение регистрации: 11.12.2024 Продолжитель­ность: 50 академических часов Расположение: Онлайн обучение Цена: 1908 € + НСО Цена одного учебного дня: 159 € + НСО
Льготная цена для клиентов Эстонского центра обучений до 23 июня Льготная цена программы: 1308 € + НСО Льготная цена одного дня: 109 € + НСО
Подпишись и получи скидку -30%

Самая востребованная профессия ближайших лет — аналитик данных.

Эстонский центр обучения — партнёр Кассы по безработице. Спросите у своего консультанта, как компенсировать затраты на обучение.

Спрос на специалистов в сфере сбора, обработки и анализа данных растёт с каждым годом. Тем не менее пока лишь 1% данных, хранящихся на предприятиях, используется по назначению. Понимаете, какой потенциал у этой профессии? Исследования показали, что 77% компаний, имеющих в штате аналитика данных, значительно улучшили свои финансовые показатели и обошли конкурентов. Почему? Потому, что когда знаешь, кому, что, когда и по какой цене продавать, стабильные денежные потоки фирме обеспечены.

Аналитик данных — человек, который при помощи структурного подхода к отбору и управлению данными, может многократно повысить  эффективность любых бизнес-процессов.

Для кого:

  • Для менеджеров и руководителей отделов продаж.
  • Для владельцев бизнеса, которые непосредственно отвечают за продажи.
  • Для директоров по развитию продукции и предприятия.
  • Для специалистов различных сфер, которым важно понимать кто их целевой клиент, находить этих клиентов, максимально использовать информацию об этих клиентах на пользу бизнеса.

Цель обучения: научить участников при помощи структурного подхода собирать, обрабатывать и анализировать данные именно для своей сферы бизнеса. Пояснить, по каким критериям анализировать данные, чтобы этот анализ приносил реальную пользу предприятию.

Прошедший обучение научится:

  • Разбираться в индустрии данных и понимать, кто и чем занимается в этой сфере.
  • Работать с данными с нуля.
  • Работать с разными источниками данных и собирать данные, которые находятся в открытом доступе.
  • Анализировать данные и извлекать из них полезную именно для своей компании информацию.
  • Находить закономерности и тенденции, которые помогут принимать взвешенные решения в компании.
  • Автоматизировать процесс сбора данных и экономить массу времени на более важные процессы.
  • Овладеет Python на уровне, достаточном для анализа данных.
  • Сможет работать с различными форматами представления, хранения и передачи данных CSV, XML и XLS.
  • Создавать, изменять и управлять базами данных при помощи SQL.

Организационная информация:

 

Прошедший обучение сможет:
1. Определять задачи и понимать, для каких целей его предприятию нужны данные.
2. Определять, какие именно данные нужны и составлять пошаговый план по их сбору.
3. Собирать данные.
4. Обрабатывать их под нужды своего бизнеса, используя различные методы, о которых узнает на курсе.
5. Анализировать данные.
Оценка учебных результатов в соответствии со стандартом дополнительного обучения: учебные дни имеют интерактивную структуру, включающую диалог между лектором и участниками, а также практические упражнения на каждом занятии. Участники получают персональные ответы на свои вопросы.
Учебный курс завершается электронным письменным тестом. Сертификат о прохождении учебной программы получат все, кто сдаст тест на позитивную оценку.
 

Программа

25.09.2024

1 модуль. Введение в специальность аналитик данных. Основы анализа данных.


14:00 – 17:00

  • Чем занимается аналитик данных?
  •  Основные навыки, которыми должен обладать аналитик данных.
  •  Различные направления в data-индустрии: (Data Analyst, Data Scientist, Business Intelligence, администратор и инженер Big Data, DevOps-инженер, DataOps, Chief Data Officer, специалист по безопасности и др).
  •  Что такое датасеты?
  •  Анализ состояния предприятия на предмет необходимости иметь в штате аналитика данных.
  • Какие источники данных больше всего подходят для вашего   бизнеса?
  •  Инструменты и техники пассивного сбора информации.

02.10.2024

2 модуль. Основные инструменты и программы, необходимые для анализа данных. Устанавливаем необходимое ПО.


14:00 – 17:00

  • Максим Пушкин

    Максим Пушкин

    DWH Engineer&Analyst в Bi&Dwh Consult OÜ (BerryBI.ee). Аналитик данных с 10-летним опытом.

  • Microsoft Excel:Обзор интерфейса.
    Основные функции и формулы.
    Практическое задание: создание простой таблицы, использование формул для суммирования и среднего значения.
  • Google Sheets:Создание аккаунта и обзор интерфейса.
    Основы совместного редактирования.
    Практическое задание: импорт данных в Google Sheets, использование функций и совместная работа.
  • SQL:Обзор SQL-сервера или использование онлайн-решений (например, SQLite).
    Основы синтаксиса SQL.
    Практическое задание: выполнение простых SQL-запросов для выборки данных.
  • Python и Jupyter Notebook:Установка Anaconda Distribution.
    Обзор интерфейса Jupyter Notebook.
    Основы работы с библиотеками Pandas и NumPy.
    Практическое задание: загрузка данных, простейший анализ и визуализация.
  • Визуализация и базы данных Power BI:Установка Power BI Desktop.
    Импорт данных и создание базовых визуализаций.
    Практическое задание: создание простого дашборда с визуализациями.
  • Tableau:Установка Tableau Public.
    Обзор интерфейса и основные возможности.
    Практическое задание: создание базовой визуализации.

09.10.2024

3 модуль. Фундаментальные основы для анализа данных. Data Analysis Project Lifecycle или жизненный цикл проекта анализа данных.


14:00 – 17:00

  • Диана Габриельян

    Диана Габриельян

    Доктор экономических наук. Руководитель отдела по анализу данных в Stockmann. Лектор в Tartu Ülikool.

  • Понимание цели проекта по сбору/анализу данных.
  • Откуда брать данные? Источники данных.
  • Базовые термины и инструменты, которыми пользуются аналитики данных.
  • Обзор инструментов, программ и технологий для анализа данных (например, Python, R, SQL и т.д.).
  • Практические примеры того, как реальные компании пользуются этими инструментами.
  • Практическое задание: Формулировка аналитической задачи на основе предоставленного сценария. Обсуждение методов сбора данных и источников данных.
  • Демонстрация процесса сбора и очистки данных на конкретном примере.
  • Практическое задание: Участники очищают набор данных с использованием Excel или Google Sheets.

16.10.2024

4 модуль. SQL - незаменимый инструмент при сборе и анализе данных.


14:00 – 17:00

  • Диана Габриельян

    Диана Габриельян

    Доктор экономических наук. Руководитель отдела по анализу данных в Stockmann. Лектор в Tartu Ülikool.

  • SQL как основной инструмент для создания, модификации и управления данными.
  • Какие бывают базы данных?
  • Как подключиться к базе данных: SQL + python + jupyter?
  • Как при помощи SQL:
    — создать в базе данных новую таблицу;
    — добавить в таблицу новые записи;
    — изменить записи;
    — удалить записи;
    — сделать выборку записей из одной или нескольких таблиц (в соответствии с заданным условием);
  • Можно ли научиться писать простые SQL-запросы без образования программиста?
  • Как при помощи SQL-запроса получать данные из баз данных?
  • Аналитические функции SQL.
  • Оконные функции SQL.
  • Где тренировать SQL?

23.10.2024

5 модуль. Python для анализа данных.


14:00 – 17:00

  • Анна Альянаки

    Анна Альянаки

    Tartu Ülikool, Институт компьютерных наук, преподаватель информатики.

  • В какой степени необходимо владеть Python data-специалисту?
  • Устанавливаем Python.
  • Рабочая среда аналитика: jupyter и colab.
  • Язык разметки Markdown.
  • Основной синтаксис языка Python. Синтаксис при сборе данных.
  • Методы работы со списками и словарями.
  • Методы работы с разными типами данных.
  • Работа с файлами.
  • Работа со строковыми величинам.
  • Работа со временем и датами.
  • Распознаем даты в Python.
  • Учимся складывать и вычитать даты.
  • Объединение данных из разных источников.

30.10.2024

6 модуль. Pandas - библиотека на языке Python для обработки и анализа данных.


14:00 – 17:00

  • Анна Альянаки

    Анна Альянаки

    Tartu Ülikool, Институт компьютерных наук, преподаватель информатики.

  • Библиотека Pandas: как с ней работать?
  • Учимся группировать данные по колонкам средствами Pandas.
  • Распределяем датасет поисковых запросов по количеству слов.
  • Знакомимся с Pivot и сложной агрегацией средствами Pandas.
  • Учимся работать со сводными таблицами.
  • Объект DataFrame для манипулирования индексированными массивами двумерных данных.
  • Инструменты для обмена данными между структурами в памяти и файлами различных форматов.
  • Встроенные средства совмещения данных и способы обработки отсутствующей информации.
  • Переформатирование наборов данных, в том числе создание сводных таблиц.
  • Срез данных по значениям индекса, расширенные возможности индексирования, выборка из больших наборов данных
  • Вставка и удаление столбцов данных.
  • Возможности группировки позволяют выполнять трёхэтапные операции типа «разделение, изменение, объединение» (англ. split-apply-combine).
  • Слияние и объединение наборов данных.
  • Иерархическое индексирование позволяет работать с данными высокой размерности в структурах меньшей размерности.
  • Работа с временными рядами: формирование временных периодов и изменение интервалов и т.д.

06.11.2024

7 модуль. Лайфкодинг: анализ реальных данных (EDA - exploratory data analysis).


14:00 – 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Загрузка данных на Google Drive.
  • Чтение данных в Google Colab.
  • Подготовка данных к анализу: переименование столбцов, замена форматов данных, проверка на дубликаты, анализ пропущенных значений.
  • Первичный анализ: распределение, поиск выбросов.
  • Анализ с помощью сводных таблиц.
  • Анализ непрерывных переменных с помощью разбиения на диапазоны.
  • Анализ с помощью графиков и диаграмм: line plot, bar plot, histogram, scatter plot.
  • Принципы проверки своих вычислений и преобразований.
  • Принципы написания аналитических выводов.
  • Принципы профессионального оформления Jupyter Notebook.
  • Практическая часть.

13.11.2024

8 модуль. R — мощный инструмент для работы с данными.


14:00 – 17:00

  • Диана Габриельян

    Диана Габриельян

    Доктор экономических наук. Руководитель отдела по анализу данных в Stockmann. Лектор в Tartu Ülikool.

  • Импорт данных и первоначальный анализ.
  • Импорт данных на рабочий стол из файла Excel или CSV.
  • Обзор данных и первоначальный анализ.
  • Обработка данных с помощью пакетов Tidyverse: dplyr и lubridate.
  • Глаголы dplyr.
  • Обработка данных с датами с помощью пакета lubridate.
  • Визуализация данных с помощью пакета ggplot2.
  • Создание графиков (точечная диаграмма, столбчатая диаграмма и линейная диаграмма).
  • Простое оформление графиков.
  • Создание отчета в RMarkdown.
  • Генерация документов в различных форматах (HTML, Word, PowerPoint, PDF).

20.11.2024

09 модуль. BI-аналитика, построение интерактивных отчетов.


14:00 – 17:00

  • Введение в BI аналитику.
  • Что такое BI системы?
  • Обзор продуктов Qlik, Tableau, Power BI.
  • Что такое дашборд, их виды и предназначение.
  • Story telling (презентация данных).
  • Основные элементы интерфейса и типы визуализаций.

Работа в Power BI:

  • Получение и моделирование данных в Power BI. Import и Direct Query.
  • Создание модели данных. Таблица фактов и таблицы мер (dimensions).
  • Создание отчета
  • Основы языка DAX. Создание calculated measures.
  • Управление закладками и фильтрами.
  • Публикация отчета.
  • Основные методы защиты данных и разграничения доступа.

27.11.2024

10 модуль. Создание клиентской базы с нуля, исходя из запросов конкретного бизнеса


14:00 – 17:00

  • Как собирать и структурировать элементарные базы данных с нуля?
  • Список сайтов, на которых можно собирать данные по запросу.
  • Поиск и хранение данных.
  • Перевод базы из СSV в Excel.
  • Парсинг (web scraping) — это автоматизированный сбор открытой информации в интернете по заданным условиям.
  • Примеры парсеров-программ.
  • От Excel к CRM. Что такое CRM-система и какие задачи бизнеса решает?

04.12.2024

11 модуль. Применение ИИ для сбора, обработки и анализа данных.


14:00 – 17:00

  • Дмитрий Фишман

    Дмитрий Фишман

    Tartu Ülikool, лектор по тематике искусственного интеллекта. Инструктор в Data Carpentry и Software Carpentry.

  • Источники данных для ИИ.
  • Алгоритмы машинного обучения.
  • Классификация и регрессия.
  • Кластеризация данных.
  • Примеры работы разных методов машинного обучения.
  • Примеры использования ИИ в анализе данных.
  • Этические аспекты использования ИИ.

11.12.2024

12 модуль. Что нужно знать аналитикам и data-специалистам о защите личных данных?


14:00 – 17:00

  • Обеспечение конфиденциальности и защиты при сборе и хранении личных данных.
  • Какие данные можно собирать и для чего?
  • Когда обработка персональных данных является незаконной?
  • Сбор, обработка и хранение персональных данных в маркетинговых целях.
  • Какие данные нельзя обрабатывать?
  • Права лиц, персональные данные которых подвергаются обработке.
  • Что такое нарушение  личных данных?
  • Как должна происходить защита данных?
  • Что делать, если права всё же нарушены?
  • Кто следит за исполнением регламента? Куда обращаться в случае выявленного нарушения?
  • Наказание за нарушение использования личных данных.
  • Дигитальное архивирование данных клиентов и партнёров.

Основы организации обучения

Тип мероприятия:

Учебный курс

Количество лекторов:

8

Целевая группа:

Руководители предприятий, менеджеры, специалисты по продажам, все лица, заинтересованные в эффективном использовании хранящихся в фирме данных для повышения производительности предприятия. А также лица, заинтересованные в получении новой профессии.

Методы обучения:

Практическое онлайн-обучение. Один учебный день — 4 академических часов. Весь курс — 50 академических часов.

Прошедший обучение получит свидетельство о прохождении курса.

Пожалуйста, ознакомьтесь с основами обеспечения качества обучения.

Условия отказа:

100% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии минимум за 30 дней до его начала, 50% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии за 20 дней до его начала. Если вы откажетесь от участия в мероприятии менее, чем за 15 дней до его начала, то уплаченную сумму мы не возвращаем и счёт подлежит оплате.

Порядок решения споров: все проблемные ситуации стороны спора решают между собой в письменной форме. На претензии клиентов Eesti Koolitus-ja Konverentsikeskus отвечает в течение 7 дней. Если договорённости не удаётся достичь, то спор решается в судебном порядке в соответствии с законами Эстонской республики.

Руководитель проекта:

Oksana Kabrits

Кейтеринг:

Нет

*Авторское право на учебную программу принадлежит Eesti Koolitus- ja Konverentsikeskus. Любое копирование и использование программы для коммерческих целей ЗАПРЕЩЕНО! Организатор имеет право вносить изменения в программу.

Консультации

Если у вас возникли вопросы и вам необходима индивидуальная консультация, выберите лектора и запишитесь на консультацию.