Учебный курс: аналитик данных

Общая информация

Дата проведения: 10.02.2022 - 28.04.2022 Завершение регистрации: 23.04.2022 Продолжитель­ность: 50 академических часов Расположение: онлайн обучение Цена: 1788 € + km
Льготная цена для клиентов Эстонского центра обучения до 9 февраля Льготная цена: 1308 € + km
Подпишись и получи скидку -30%

Самая востребованная профессия ближайших лет — аналитик данных.

За два последних года мировой спрос на специалистов в сфере сбора, обработки и анализа данных вырос в два раза. Тем не менее пока лишь 1% данных, хранящихся на предприятиях, используется по назначению. Понимаете, какой потенциал у этой профессии? Исследования показали, что 77% компаний, имеющих в штате аналитика данных, значительно улучшили свои финансовые показатели и обошли конкурентов. Почему? Потому, что когда знаешь, кому, что, когда и по какой цене продавать, стабильные денежные потоки фирме обеспечены.

Аналитики данных — человек, который при помощи структурного подхода к отбору и управлению данными, может многократно повысить  эффективность любых бизнес-процессов.

Для кого:

  • Для менеджеров и руководителей отделов продаж.
  • Для владельцев бизнеса, которые непосредственно отвечают за продажи.
  • Для директоров по развитию продукции и предприятия.
  • Для специалистов различных сфер, которым важно понимать кто их целевой клиент, находить этих клиентов, максимально использовать информацию об этих клиентах на пользу бизнеса.

Цель обучения : научить участников при помощи структурного подхода собирать, обрабатывать и анализировать данные именно для своей сферы бизнеса. Пояснить, по каким критериям анализировать данные, чтобы этот анализ приносил реальную пользу предприятию.

Прошедший обучение научится:

  • Разбираться в индустрии данных и понимать, кто и чем занимается в этой сфере.
  • Работать с данными с нуля.
  • Работать с разными источниками данных и собирать данные, которые находятся в открытом доступе.
  • Анализировать данные и извлекать из них полезную именно для своей компании информацию.
  • Находить закономерности и тенденции, которые помогут принимать взвешенные решения в компании.
  • Автоматизировать процесс сбора данных и экономить массу времени на более важные процессы.
  • Овладеет Python на уровне, достаточном для анализа данных.
  • Сможет работать с различными форматами представления, хранения и передачи данных CSV, XML и XLS.
  • Создавать, изменять и управлять базами данных при помощи SQL.

Организационная информация:

 

NB! Каждый ученик в течение курса создаёт свой конкретный проект:
1. Определяет задачу: для каких целей его предприятию нужны данные.
2. Определяет, какие именно данные нужны и составляет пошаговый план по их сбору.
3. Собирает данные.
4. Обрабатывает их под нужды своего бизнеса, используя различные методы, о которых узнает на курсе.
5. Анализирует.

Программа

10.02.2022

1 модуль. Введение в специальность аналитик данных. Основы анализа данных.


14:00 - 17:00

  • Чем занимается аналитик данных?
  •  Основные навыки, которыми должен обладать аналитик данных.
  •  Различные направления в data-индустрии: (Data Analyst, Data Scientist, Business Intelligence, администратор и инженер Big Data, DevOps-инженер, DataOps, Chief Data Officer, специалист по безопасности и др).
  •  Что такое датасеты?
  •  Анализ состояния предприятия на предмет необходимости иметь в штате аналитика данных.
  • Какие источники данных больше всего подходят для вашего   бизнеса?
  •  Инструменты и техники пассивного сбора информации.

17.02.2022

2 модуль. Фундаментальные основы для анализа данных. Источники данных и работа с ними.


14:00 - 17:00

  • Что такое наука о данных(data science)?
  • Что входит в процесс анализа данных?
  • Данные и их применение в бизнесе;
  • Категории бизнес-аналитики;
  • Различные применения анализа данных;
  • С чего начать внедрение анализа данных в компании?
  • Практические примеры сбора, анализа данных и эффективных результатов;

23.02.2022

3 модуль. Excel - основной инструмент для анализа данных.


14:00 - 17:00

  • Екатерина Трунин

    Екатерина Трунин

    Присяжный аудитор, член Палаты аудиторов, специалист по корпоративным финансам и хозяйственному учёту

  • Сводные таблицы - базовый инструмент для работы с большим количеством неструктурированных данных.
  • Использование полей и элементов в сводной таблице, в том числе создание новых полей и элементов.
  • Группировка полей.
  • Систематизация и настройка данных в таблице Excel.
  • 4 техники анализа данных в Excel.
  • Анализ данных через сводные таблицы Excel.
  • Автоматизация анализа данных в Excel.
  • Дисперсионный анализ.
  • Корреляционный анализ.
  • Ковариация.
  • Вычисление скользящего среднего. Очень популярный метод в статистике и в трейдинге.
  • Случайные числа.
  • Операции с выборкой.
  • Быстрый анализ баз данных в Excel.
  • Лист прогнозов.

03.03.2022

4 модуль. Создание клиентской базы с нуля, исходя из запросов конкретного бизнеса


14:00 - 17:00

  • Как собирать и структурировать элементарные базы данных с нуля?
  • Список сайтов, на которых можно собирать данные по запросу.
  • Поиск и хранение данных.
  • Перевод базы из СSV в Excel.
  • Парсинг (web scraping) — это автоматизированный сбор открытой информации в интернете по заданным условиям.
  • Примеры парсеров-программ.
  • От Excel к CRM. Что такое CRM-система и какие задачи бизнеса решает?

10.03.2022

5 модуль. Python для анализа данных.


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • В какой степени необходимо владеть Python data-специалисту?
  • Устанавливаем Python.
  • Рабочая среда аналитика: jupyter и colab.
  • Язык разметки Markdown.
  • Основной синтаксис языка Python. Синтаксис при сборе данных.
  • Методы работы со списками и словарями.
  • Методы работы с разными типами данных.
  • Работа с файлами.
  • Работа со строковыми величинам.
  • Работа со временем и датами.
  • Распознаем даты в Python.
  • Учимся складывать и вычитать даты.
  • Объединение данных из разных источников.

17.03.2022

6 модуль. Pandas - библиотека на языке Python для обработки и анализа данных.


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Библиотека Pandas: как с ней работать?
  • Учимся группировать данные по колонкам средствами Pandas.
  • Распределяем датасет поисковых запросов по количеству слов.
  • Знакомимся с Pivot и сложной агрегацией средствами Pandas.
  • Учимся работать со сводными таблицами.
  • Объект DataFrame для манипулирования индексированными массивами двумерных данных.
  • Инструменты для обмена данными между структурами в памяти и файлами различных форматов.
  • Встроенные средства совмещения данных и способы обработки отсутствующей информации.
  • Переформатирование наборов данных, в том числе создание сводных таблиц.
  • Срез данных по значениям индекса, расширенные возможности индексирования, выборка из больших наборов данных
  • Вставка и удаление столбцов данных.
  • Возможности группировки позволяют выполнять трёхэтапные операции типа «разделение, изменение, объединение» (англ. split-apply-combine).
  • Слияние и объединение наборов данных.
  • Иерархическое индексирование позволяет работать с данными высокой размерности в структурах меньшей размерности.
  • Работа с временными рядами: формирование временных периодов и изменение интервалов и т.д.

24.03.2022

7 модуль. Лайфкодинг: анализ реальных данных (EDA - exploratory data analysis).


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Загрузка данных на Google Drive.
  • Чтение данных в Google Colab.
  • Подготовка данных к анализу: переименование столбцов, замена форматов данных, проверка на дубликаты, анализ пропущенных значений.
  • Первичный анализ: распределение, поиск выбросов.
  • Анализ с помощью сводных таблиц.
  • Анализ непрерывных переменных с помощью разбиения на диапазоны.
  • Анализ с помощью графиков и диаграмм: line plot, bar plot, histogram, scatter plot.
  • Принципы проверки своих вычислений и преобразований.
  • Принципы написания аналитических выводов.
  • Принципы профессионального оформления Jupyter Notebook.
  • Практическая часть.

31.03.2022

8 модуль. SQL - незаменимый инструмент при сборе и анализе данных.


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • SQL как основной инструмент для создания, модификации и управления данными.
  • Какие бывают базы данных?
  • Как подключиться к базе данных: SQL + python + jupyter?
  • Как при помощи SQL:
    - создать в базе данных новую таблицу;
    - добавить в таблицу новые записи;
    - изменить записи;
    - удалить записи;
    - сделать выборку записей из одной или нескольких таблиц (в соответствии с заданным условием);
  • Можно ли научиться писать простые SQL-запросы без образования программиста?
  • Как при помощи SQL-запроса получать данные из баз данных?
  • Аналитические функции SQL.
  • Оконные функции SQL.
  • Где тренировать SQL?

07.04.2022

9 модуль. Автоматизация информации и программы по управлению данными.


14:00 - 17:00

  • От процесса к технологии. Из чего состоит автоматизация информации? Понимание автоматизации данных.
  • Формирование Data Driven в компании и жизненный цикл данных.
  • Программы по управлению данными. Разработка решений платформы данных.
  • Выбор внешней или разработка собственной платформы для работы с данными.
  • Когда нужны облака?
  • Коммерческие и открытые платформы управления данными.
  • Интеграция. Извлечение данных из различных источников для создания единой среды аналитики.
  • Процессы предобработки и автоматизации данных (ETL/ELT, data pre-processing).
  • Как реализовать озеро данных (Data Lake) и не утонуть в болоте?
  • Использование интерфейса API.

14.04.2022

10 модуль. Статистика и вероятность. Как отличить реальный эффект анализа от простой случайности?


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Закон больших чисел и Центральная предельная теорема: когда работают, а когда нет?
  • Метод Монте-Карло: как взломать вероятность?
  • АБ тестировние: как отличить случайное от не случайного?
  • Использование статистических калькуляторов.
  • Z-test, T-test, Chi-Square test.
  • Множественная проверка гипотез: как не стать жертвой случайности?

21.04.2022

11 модуль. Что нужно знать аналитикам и data-специалистам о защите личных данных?


14:00 - 17:00

  • Кристина Визнович

    Кристина Визнович

    Адвокат адвокатского бюро Pallo&Partnerid, специалист по защите данных. Тартуский университет право информационных технологий.

  • Обеспечение конфиденциальности и защиты при сборе и хранении личных данных.
  • Какие данные можно собирать и для чего?
  • Когда обработка персональных данных является незаконной?
  • Сбор, обработка и хранение персональных данных в маркетинговых целях.
  • Какие данные нельзя обрабатывать?
  • Права лиц, персональные данные которых подвергаются обработке.
  • Что такое нарушение  личных данных?
  • Как должна происходить защита данных?
  • Что делать, если права всё же нарушены?
  • Кто следит за исполнением регламента? Куда обращаться в случае выявленного нарушения?
  • Наказание за нарушение использования личных данных.
  • Дигитальное архивирование данных клиентов и партнёров.

28.04.2022

12 модуль. Машинное обучение на python: предсказание цен на квартиру.


14:00 - 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Анализ данных на Pandas.
  • Создание алгоритма предсказания цены вручную.
  • Предсказание цены с помощью машинного обучения.
  • Узнаем кто победит: человек или машина?
  • Поймем, за счет чего алгоритм машинного обучения назначает цену.
  • Никакой математики и теории: только интуиция и понятные практические примеры.

Основы организации обучения

Тип мероприятия:

Webinar

Количество лекторов:

7

Целевая группа:

Руководители предприятий, менеджеры, специалисты по продажам, все лица, заинтересованные в эффективном использовании хранящихся в фирме данных для повышения производительности предприятия. А также лица, заинтересованные в получении новой профессии.

Методы обучения:

Практическое онлайн-обучение. Один учебный день - 4 академических часов. Весь курс - 50 академических часов.

Прошедший обучение получит свидетельство о прохождении курса.

Пожалуйста, ознакомьтесь с основами обеспечения качества обучения.

 

Условия отказа:

100% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии минимум за 30 дней до его начала, 50% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии за 20 дней до его начала. Если вы откажетесь от участия в мероприятии менее, чем за 15 дней до его начала, то уплаченную сумму мы не возвращаем и счёт подлежит оплате.

Порядок решения споров: все проблемные ситуации стороны спора решают между собой в письменной форме. На претензии клиентов Eesti Koolitus-ja Konverentsikeskus отвечает в течение 7 дней. Если договорённости не удаётся достичь, то спор решается в судебном порядке в соответствии с законами Эстонской республики.

Руководитель проекта:

Оксана Кабритс

Кейтеринг:

Нет

*Eesti Koolitus- ja Konverentsikeskus оставляет за собой право вносить изменения в программу.