Учебный курс: аналитик данных

Общая информация

Дата проведения: 28.09.2023 - 14.12.2023 Завершение регистрации: 13.12.2023 Продолжитель­ность: 50 академических часов Расположение: Онлайн обучение Цена: 1788 € + НСО Цена одного учебного дня: 149 € + НСО
Льготная цена для клиентов Эстонского центра обучений до 24 декабря Льготная цена программы: 1308 € + НСО Льготная цена одного дня: 109 € + НСО
Подпишись и получи скидку -30%

Самая востребованная профессия ближайших лет — аналитик данных.

Эстонский центр обучения — партнёр Кассы по безработице. Спросите у своего консультанта, как компенсировать затраты на обучение.

Спрос на специалистов в сфере сбора, обработки и анализа данных растёт с каждым годом. Тем не менее пока лишь 1% данных, хранящихся на предприятиях, используется по назначению. Понимаете, какой потенциал у этой профессии? Исследования показали, что 77% компаний, имеющих в штате аналитика данных, значительно улучшили свои финансовые показатели и обошли конкурентов. Почему? Потому, что когда знаешь, кому, что, когда и по какой цене продавать, стабильные денежные потоки фирме обеспечены.

Аналитик данных — человек, который при помощи структурного подхода к отбору и управлению данными, может многократно повысить  эффективность любых бизнес-процессов.

Для кого:

  • Для менеджеров и руководителей отделов продаж.
  • Для владельцев бизнеса, которые непосредственно отвечают за продажи.
  • Для директоров по развитию продукции и предприятия.
  • Для специалистов различных сфер, которым важно понимать кто их целевой клиент, находить этих клиентов, максимально использовать информацию об этих клиентах на пользу бизнеса.

 

Цель обучения: научить участников при помощи структурного подхода собирать, обрабатывать и анализировать данные именно для своей сферы бизнеса. Пояснить, по каким критериям анализировать данные, чтобы этот анализ приносил реальную пользу предприятию.

 

Прошедший обучение научится:

  • Разбираться в индустрии данных и понимать, кто и чем занимается в этой сфере.
  • Работать с данными с нуля.
  • Работать с разными источниками данных и собирать данные, которые находятся в открытом доступе.
  • Анализировать данные и извлекать из них полезную именно для своей компании информацию.
  • Находить закономерности и тенденции, которые помогут принимать взвешенные решения в компании.
  • Автоматизировать процесс сбора данных и экономить массу времени на более важные процессы.
  • Овладеет Python на уровне, достаточном для анализа данных.
  • Сможет работать с различными форматами представления, хранения и передачи данных CSV, XML и XLS.
  • Создавать, изменять и управлять базами данных при помощи SQL.

Организационная информация:

 

Прошедший обучение сможет:
1. Определять задачи и понимать, для каких целей его предприятию нужны данные.
2. Определять, какие именно данные нужны и составлять пошаговый план по их сбору.
3. Собирать данные.
4. Обрабатывать их под нужды своего бизнеса, используя различные методы, о которых узнает на курсе.
5. Анализировать данные.

Программа

28.09.2023

1 модуль. Введение в специальность аналитик данных. Основы анализа данных.


14:00 – 17:00

  • Чем занимается аналитик данных?
  •  Основные навыки, которыми должен обладать аналитик данных.
  •  Различные направления в data-индустрии: (Data Analyst, Data Scientist, Business Intelligence, администратор и инженер Big Data, DevOps-инженер, DataOps, Chief Data Officer, специалист по безопасности и др).
  •  Что такое датасеты?
  •  Анализ состояния предприятия на предмет необходимости иметь в штате аналитика данных.
  • Какие источники данных больше всего подходят для вашего   бизнеса?
  •  Инструменты и техники пассивного сбора информации.

05.10.2023

2 модуль. Фундаментальные основы для анализа данных. Источники данных и работа с ними.


14:00 – 17:00

  • Что такое наука о данных(data science)?
  • Что входит в процесс анализа данных?
  • Данные и их применение в бизнесе;
  • Категории бизнес-аналитики;
  • Различные применения анализа данных;
  • С чего начать внедрение анализа данных в компании?
  • Практические примеры сбора, анализа данных и эффективных результатов.

12.10.2023

3 модуль. Excel - основной инструмент для анализа данных.


14:00 – 17:00

  • Екатерина Трунин

    Екатерина Трунин

    Присяжный аудитор, член Палаты аудиторов, специалист по корпоративным финансам и хозяйственному учёту

  • Сводные таблицы — базовый инструмент для работы с большим количеством неструктурированных данных.
  • Использование полей и элементов в сводной таблице, в том числе создание новых полей и элементов.
  • Группировка полей.
  • Систематизация и настройка данных в таблице Excel.
  • 4 техники анализа данных в Excel.
  • Анализ данных через сводные таблицы Excel.
  • Автоматизация анализа данных в Excel.
  • Дисперсионный анализ.
  • Корреляционный анализ.
  • Ковариация.
  • Вычисление скользящего среднего. Очень популярный метод в статистике и в трейдинге.
  • Случайные числа.
  • Операции с выборкой.
  • Быстрый анализ баз данных в Excel.
  • Лист прогнозов.

19.10.2023

4 модуль. Создание клиентской базы с нуля, исходя из запросов конкретного бизнеса


14:00 – 17:00

  • Как собирать и структурировать элементарные базы данных с нуля?
  • Список сайтов, на которых можно собирать данные по запросу.
  • Поиск и хранение данных.
  • Перевод базы из СSV в Excel.
  • Парсинг (web scraping) — это автоматизированный сбор открытой информации в интернете по заданным условиям.
  • Примеры парсеров-программ.
  • От Excel к CRM. Что такое CRM-система и какие задачи бизнеса решает?

26.10.2023

5 модуль. Python для анализа данных.


14:00 – 17:00

  • Анна Альянаки

    Анна Альянаки

    Tartu Ülikool, Институт компьютерных наук, преподаватель информатики.

  • В какой степени необходимо владеть Python data-специалисту?
  • Устанавливаем Python.
  • Рабочая среда аналитика: jupyter и colab.
  • Язык разметки Markdown.
  • Основной синтаксис языка Python. Синтаксис при сборе данных.
  • Методы работы со списками и словарями.
  • Методы работы с разными типами данных.
  • Работа с файлами.
  • Работа со строковыми величинам.
  • Работа со временем и датами.
  • Распознаем даты в Python.
  • Учимся складывать и вычитать даты.
  • Объединение данных из разных источников.

02.11.2023

6 модуль. Pandas - библиотека на языке Python для обработки и анализа данных.


14:00 – 17:00

  • Анна Альянаки

    Анна Альянаки

    Tartu Ülikool, Институт компьютерных наук, преподаватель информатики.

  • Библиотека Pandas: как с ней работать?
  • Учимся группировать данные по колонкам средствами Pandas.
  • Распределяем датасет поисковых запросов по количеству слов.
  • Знакомимся с Pivot и сложной агрегацией средствами Pandas.
  • Учимся работать со сводными таблицами.
  • Объект DataFrame для манипулирования индексированными массивами двумерных данных.
  • Инструменты для обмена данными между структурами в памяти и файлами различных форматов.
  • Встроенные средства совмещения данных и способы обработки отсутствующей информации.
  • Переформатирование наборов данных, в том числе создание сводных таблиц.
  • Срез данных по значениям индекса, расширенные возможности индексирования, выборка из больших наборов данных
  • Вставка и удаление столбцов данных.
  • Возможности группировки позволяют выполнять трёхэтапные операции типа «разделение, изменение, объединение» (англ. split-apply-combine).
  • Слияние и объединение наборов данных.
  • Иерархическое индексирование позволяет работать с данными высокой размерности в структурах меньшей размерности.
  • Работа с временными рядами: формирование временных периодов и изменение интервалов и т.д.

09.11.2023

7 модуль. Лайфкодинг: анализ реальных данных (EDA - exploratory data analysis).


14:00 – 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Загрузка данных на Google Drive.
  • Чтение данных в Google Colab.
  • Подготовка данных к анализу: переименование столбцов, замена форматов данных, проверка на дубликаты, анализ пропущенных значений.
  • Первичный анализ: распределение, поиск выбросов.
  • Анализ с помощью сводных таблиц.
  • Анализ непрерывных переменных с помощью разбиения на диапазоны.
  • Анализ с помощью графиков и диаграмм: line plot, bar plot, histogram, scatter plot.
  • Принципы проверки своих вычислений и преобразований.
  • Принципы написания аналитических выводов.
  • Принципы профессионального оформления Jupyter Notebook.
  • Практическая часть.

16.11.2023

8 модуль. SQL - незаменимый инструмент при сборе и анализе данных.


14:00 – 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • SQL как основной инструмент для создания, модификации и управления данными.
  • Какие бывают базы данных?
  • Как подключиться к базе данных: SQL + python + jupyter?
  • Как при помощи SQL:
    — создать в базе данных новую таблицу;
    — добавить в таблицу новые записи;
    — изменить записи;
    — удалить записи;
    — сделать выборку записей из одной или нескольких таблиц (в соответствии с заданным условием);
  • Можно ли научиться писать простые SQL-запросы без образования программиста?
  • Как при помощи SQL-запроса получать данные из баз данных?
  • Аналитические функции SQL.
  • Оконные функции SQL.
  • Где тренировать SQL?

23.11.2023

9 модуль. Статистика и вероятность. Как отличить реальный эффект анализа от простой случайности?


14:00 – 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Закон больших чисел и Центральная предельная теорема: когда работают, а когда нет?
  • Метод Монте-Карло: как взломать вероятность?
  • АБ тестировние: как отличить случайное от не случайного?
  • Использование статистических калькуляторов.
  • Z-test, T-test, Chi-Square test.
  • Множественная проверка гипотез: как не стать жертвой случайности?

30.11.2023

10 модуль. BI-аналитика, построение интерактивных отчетов.


14:00 – 17:00

  • Введение в BI аналитику.
  • Что такое BI системы?
  • Обзор продуктов Qlik, Tableau, Power BI.
  • Что такое дашборд, их виды и предназначение.
  • Story telling (презентация данных).
  • Основные элементы интерфейса и типы визуализаций.

Работа в Power BI:

  • Получение и моделирование данных в Power BI. Import и Direct Query.
  • Создание модели данных. Таблица фактов и таблицы мер (dimensions).
  • Создание отчета
  • Основы языка DAX. Создание calculated measures.
  • Управление закладками и фильтрами.
  • Публикация отчета.
  • Основные методы защиты данных и разграничения доступа.

07.12.2023

11 модуль. Автоматизация информации и программы по управлению данными.


14:00 – 17:00

  • От процесса к технологии. Из чего состоит автоматизация информации? Понимание автоматизации данных.
  • Формирование Data Driven в компании и жизненный цикл данных.
  • Программы по управлению данными. Разработка решений платформы данных.
  • Выбор внешней или разработка собственной платформы для работы с данными.
  • Когда нужны облака?
  • Коммерческие и открытые платформы управления данными.
  • Интеграция. Извлечение данных из различных источников для создания единой среды аналитики.
  • Процессы предобработки и автоматизации данных (ETL/ELT, data pre-processing).
  • Как реализовать озеро данных (Data Lake) и не утонуть в болоте?
  • Использование интерфейса API.

14.12.2023

12 модуль. Машинное обучение на Python: автоматическое определение стоимости.


14:00 – 17:00

  • Глеб Михайлов

    Глеб Михайлов

    Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.

  • Анализ данных на Pandas.
  • Создание алгоритма предсказания цены вручную.
  • Предсказание цены с помощью машинного обучения (catboost).
  • Поймем, за счет чего алгоритм машинного обучения назначает цену.
  • Никакой математики и теории: только интуиция и понятные практические примеры.

Основы организации обучения

Тип мероприятия:

Учебный курс

Количество лекторов:

7

Целевая группа:

Руководители предприятий, менеджеры, специалисты по продажам, все лица, заинтересованные в эффективном использовании хранящихся в фирме данных для повышения производительности предприятия. А также лица, заинтересованные в получении новой профессии.

Методы обучения:

Практическое онлайн-обучение. Один учебный день — 4 академических часов. Весь курс — 50 академических часов.

Прошедший обучение получит свидетельство о прохождении курса.

Пожалуйста, ознакомьтесь с основами обеспечения качества обучения.

Условия отказа:

100% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии минимум за 30 дней до его начала, 50% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии за 20 дней до его начала. Если вы откажетесь от участия в мероприятии менее, чем за 15 дней до его начала, то уплаченную сумму мы не возвращаем и счёт подлежит оплате.

Порядок решения споров: все проблемные ситуации стороны спора решают между собой в письменной форме. На претензии клиентов Eesti Koolitus-ja Konverentsikeskus отвечает в течение 7 дней. Если договорённости не удаётся достичь, то спор решается в судебном порядке в соответствии с законами Эстонской республики.

Руководитель проекта:

Oksana Kabrits

Кейтеринг:

Нет

*Авторское право на учебную программу принадлежит Eesti Koolitus- ja Konverentsikeskus. Любое копирование и использование программы для коммерческих целей ЗАПРЕЩЕНО! Организатор имеет право вносить изменения в программу.

Консультации

Если у вас возникли вопросы и вам необходима индивидуальная консультация, выберите лектора и запишитесь на консультацию.