Учебный курс: аналитик данных
Общая информация
Отправь другу Дата проведения: 24.08.2021 - 30.09.2021 Завершение регистрации: 23.08.2021 Продолжительность: 50 академических часов Расположение: онлайн обучение Цена: 1788 € + kmСамая востребованная профессия ближайших лет — аналитик данных.
За два последних года спрос на специалистов в сфере сбора и анализа данных (data-специалистов или data-аналитиков, аналитиков данных) вырос в два раза (по данным HeadHunter), прогноз на 2021 по 2024 год: этот рынок вырастет ещё на $64,27 млрд.
Почему же такой спрос на специалистов, умеющих собирать и обрабатывать данные и на аналитиков данных?
Объем данных в мире удваивается каждые три года. Все эти данные нужно уметь сортировать, обрабатывать и использовать с максимальной пользой для бизнеса. Для этого и нужны data-специалисты и аналитики данных, которые при помощи структурного подхода к управлению данными, могут многократно повысить эффективность любых бизнес-процессов.
Реальность же такова, что ¾ компаний сегодня повсеместно ощущают серьёзный дефицит специалистов, обладающих навыками и технологиями, которые позволяют использовать имеющиеся у них данные наилучшим образом.
Цель обучения : научить участников собирать и обрабатывать данные для повышения прибыльности своей компании, получать реальную пользу от структурного анализа данных, хранящихся в фирме.
Прошедший обучение научится:
- Разбираться в индустрии данных и понимать, кто и чем занимается в этой сфере.
- Работать с данными с нуля.
- Работать с разными источниками данных и собирать данные, которые находятся в открытом доступе.
- Анализировать данные и извлекать из них полезную именно для своей компании информацию.
- Находить закономерности и тенденции, которые помогут принимать взвешенные решения в компании.
- Автоматизировать процесс сбора данных и экономить массу времени на более важные процессы.
- Овладеет Python на уровне, достаточном для анализа данных.
- Сможет работать с различными форматами представления, хранения и передачи данных CSV, XML и XLS.
- Использовать статистические калькуляторы.
- Создавать, изменять и управлять базами данных при помощи SQL.
В группе 20 мест!
Программа
24.08.2021
1 модуль. Введение в специальность аналитик данных. Основы анализа данных.
10:00 - 13:00
-
Data Architect в Luminor Group.
- Чем занимается аналитик данных?
- Основные навыки, которыми должен обладать аналитик данных.
- Различные направления в data-индустрии: ( Data Analyst, Data Scientist, Business Intelligence, администратор и инженер Big Data, DevOps-инженер, DataOps, Chief Data Officer, специалист по безопасности и др).
- Что такое датасеты?
- Анализ состояния предприятия на предмет необходимости data-специалиста.
- Формирование Data Driven в компании.
- Как понять, какие специалисты и знания нужны для внедрения data- технологий на вашем предприятии?
- По каким критериям структурировать информацию?
- Какие источники данных больше всего подходят для вашего бизнеса?
- Инструменты и техники пассивного сбора информации.
26.08.2021
2 модуль. Фундаментальные основы для анализа данных. Источники данных и работа с ними.
14:00 - 17:00
-
Principal Member Of Technical Staff at Oracle. Специалист по анализу данных.
- Что входит в процесс анализа данных?
- Процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации для принятия оптимальных решений.
- Автоматизация процесса сбора данных? Что можно, а что нельзя делать?
- Сбор данных из различных источников.
- Форматы данных: CSV, XML и XLS.
- Методы и приложения, связанные с алгоритмами обработки данных.
- Что такое фичеселект (feature selection) или препроцессинг?
- Главные инструменты работы аналитика — язык SQL, основы языка Python, базовые библиотеки Python для анализа данных (NumPy, Pandas, Matplotlib, Scikit-learn).
- Подключение к источникам данных (FTP, API).
- Обработка и очистка данных после загрузки.
- Автоматическая очистка.
- Ручная очистка данных.
- Набор инструментов для сбора и очистки данных.
31.08.2021
3 модуль. Excel - основной инструмент для анализа данных.
10:00 - 13:00
-
Присяжный аудитор, член Палаты аудиторов, специалист по корпоративным финансам и хозяйственному учёту
- Сводные таблицы - базовый инструмент для работы с большим количеством неструктурированных данных.
- Использование полей и элементов в сводной таблице, в том числе создание новых полей и элементов.
- Группировка полей.
- Систематизация и настройка данных в таблице Excel.
- 4 техники анализа данных в Excel.
- Анализ данных через сводные таблицы Excel.
- Автоматизация анализа данных в Excel.
- Дисперсионный анализ.
- Корреляционный анализ.
- Ковариация.
- Вычисление скользящего среднего. Очень популярный метод в статистике и в трейдинге.
- Случайные числа.
- Операции с выборкой.
- Быстрый анализ баз данных в Excel.
- Лист прогнозов.
02.09.2021
4 модуль. Парсинг (web scraping) — это автоматизированный сбор открытой информации в интернете по заданным условиям.
14:00 - 17:00
-
Data Architect в Luminor Group.
- Учащиеся будут собирать и структурировать элементарные базы данных под руководством преподавателя.
- Практическая часть: анализ социальных сетей и других источников, где хранятся данные.
- Практическое занятие. Процессы предобработки неструктурированных данных и их хранения в различных базах данных для дальнейшего анализа.
- Примеры облачных парсеров с русскоязычным интерфейсом.
- Примеры парсеров-программ.
- Парсеры на основе Python.
07.09.2021
5 модуль. Python для анализа данных.
10:00 - 13:00
-
Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.
- В какой степени необходимо владеть Python data-специалисту?
- Устанавливаем Python.
- Рабочая среда аналитика: jupyter и colab.
- Язык разметки Markdown.
- Основной синтаксис языка Python. Синтаксис при сборе данных.
- Методы работы со списками и словарями.
- Методы работы с разными типами данных.
- Работа с файлами.
- Работа со строковыми величинам.
- Работа со временем и датами.
- Распознаем даты в Python.
- Учимся складывать и вычитать даты.
- Объединение данных из разных источников.
09.09.2021
6 модуль. Pandas - библиотека на языке Python для обработки и анализа данных.
14:00 - 17:00
-
Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.
- Библиотека Pandas: как с ней работать?
- Учимся группировать данные по колонкам средствами Pandas.
- Распределяем датасет поисковых запросов по количеству слов.
- Знакомимся с Pivot и сложной агрегацией средствами Pandas.
- Учимся работать со сводными таблицами.
- Объект DataFrame для манипулирования индексированными массивами двумерных данных.
- Инструменты для обмена данными между структурами в памяти и файлами различных форматов.
- Встроенные средства совмещения данных и способы обработки отсутствующей информации.
- Переформатирование наборов данных, в том числе создание сводных таблиц.
- Срез данных по значениям индекса, расширенные возможности индексирования, выборка из больших наборов данных
- Вставка и удаление столбцов данных.
- Возможности группировки позволяют выполнять трёхэтапные операции типа «разделение, изменение, объединение» (англ. split-apply-combine).
- Слияние и объединение наборов данных.
- Иерархическое индексирование позволяет работать с данными высокой размерности в структурах меньшей размерности.
- Работа с временными рядами: формирование временных периодов и изменение интервалов и т.д.
14.09.2021
7 модуль. Лайфкодинг: анализ реальных данных (EDA - exploratory data analysis).
10:00 - 13:00
-
Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.
- Загрузка данных на Google Drive.
- Чтение данных в Google Colab.
- Подготовка данных к анализу: переименование столбцов, замена форматов данных, проверка на дубликаты, анализ пропущенных значений.
- Первичный анализ: распределение, поиск выбросов.
- Анализ с помощью сводных таблиц.
- Анализ непрерывных переменных с помощью разбиения на диапазоны.
- Анализ с помощью графиков и диаграмм: line plot, bar plot, histogram, scatter plot.
- Принципы проверки своих вычислений и преобразований.
- Принципы написания аналитических выводов.
- Принципы профессионального оформления Jupyter Notebook.
- Практическая часть.
16.09.2021
8 модуль. SQL - незаменимый инструмент при сборе и анализе данных.
14:00 - 17:00
-
Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.
- SQL как основной инструмент для создания, модификации и управления данными.
- Какие бывают базы данных?
- Как подключиться к базе данных: SQL + python + jupyter?
- Как при помощи SQL:
- создать в базе данных новую таблицу;
- добавить в таблицу новые записи;
- изменить записи;
- удалить записи;
- сделать выборку записей из одной или нескольких таблиц (в соответствии с заданным условием); - Можно ли научиться писать простые SQL-запросы без образования программиста?
- Как при помощи SQL-запроса получать данные из баз данных?
- Аналитические функции SQL.
- Оконные функции SQL.
- Где тренировать SQL?
21.09.2021
9 модуль. Визуализация данных.
10:00 - 13:00
-
Principal Member Of Technical Staff at Oracle. Специалист по анализу данных.
- Визуализация больших массивов данных.
- Выбор инструментария для визуализации.
- Подключение к большим массивам данным. Типы, источники, возможности.
- Преобразование данных на этапе подключения (схемы данных, очистка, трансформация).
- Расчеты с помощью инструментария (быстрые расчеты, расчеты на разных уровнях агрегации данных).
- Интеграция кода Python в расчеты
- Основные типы графиков, построение.
- Ключевые подходы к визуализации, ошибки новичков.
23.09.2021
10 модуль. Статистика и вероятность. Как отличить реальный эффект анализа от простой случайности?
14:00 - 17:00
-
Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных. Создатель системы обучения Python и SQL для начинающих.
- Закон больших чисел и Центральная предельная теорема: когда работают, а когда нет?
- Метод Монте-Карло: как взломать вероятность?
- АБ тестировние: как отличить случайное от не случайного?
- Использование статистических калькуляторов.
- Z-test, T-test, Chi-Square test.
- Множественная проверка гипотез: как не стать жертвой случайности?
28.09.2021
11 модуль. Что нужно знать аналитикам и data-специалистам о защите личных данных?
10:00 - 13:00
-
Адвокат адвокатского бюро Pallo&Partnerid, специалист по защите данных. Тартуский университет право информационных технологий.
- Обеспечение конфиденциальности и защиты при сборе и хранении личных данных.
- Какие данные можно собирать и для чего?
- Когда обработка персональных данных является незаконной?
- Сбор, обработка и хранение персональных данных в маркетинговых целях.
- Какие данные нельзя обрабатывать?
- Права лиц, персональные данные которых подвергаются обработке.
- Что такое нарушение личных данных?
- Как должна происходить защита данных?
- Что делать, если права всё же нарушены?
- Кто следит за исполнением регламента? Куда обращаться в случае выявленного нарушения?
- Наказание за нарушение использования личных данных.
- Дигитальное архивирование данных клиентов и партнёров.
30.09.2021
12 модуль. Основы методов машинного обучения.
14:00 - 17:00
-
Tartu Ülikool, лектор по тематике искусственного интеллекта. Инструктор в Data Carpentry и Software Carpentry.
- В чем разница между искусственным интеллектом и машинным обучением?
- Основные классы методов машинного обучения и их цели.
- Самые базовые методы машинного обучения с учителем (k-ближайших соседей, линейная регрессия и дерево решений).
- Проблема переобучения и что с ней делать.
- Алгоритм перекрестной проверки.
- Общий подход к применению методов машинного обучения для решения аналитических задач.
- Практическая работа по предсказанию цен на поездки в такси в Нью-Йорке, на основании соревнования на Kaggle.com (если останется время).
Основы организации обучения
Тип мероприятия:
Webinar
Количество лекторов:
7
Целевая группа:
Методы обучения:
Практическое онлайн-обучение. Один учебный день - 4 академических часов. Весь курс - 50 академических часов.
Прошедший обучение получит свидетельство о прохождении курса в случае, если прослушает программу обучения в объёме 80%.
Пожалуйста, ознакомьтесь с основами обеспечения качества обучения.
По окончании курса - сертификат.
Условия отказа:
100% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии минимум за 30 дней до его начала, 50% от оплаченной суммы возвращаем в случае, если вы откажетесь от участия в мероприятии за 20 дней до его начала. Если вы откажетесь от участия в мероприятии менее, чем за 15 дней до его начала, то уплаченную сумму мы не возвращаем и счёт подлежит оплате.
Порядок решения споров: все проблемные ситуации стороны спора решают между собой в письменной форме. На претензии клиентов Eesti Koolitus-ja Konverentsikeskus отвечает в течение 7 дней. Если договорённости не удаётся достичь, то спор решается в судебном порядке в соответствии с законами Эстонской республики.
Руководитель проекта:
Оксана Кабритс
Кейтеринг:
Нет
*Eesti Koolitus- ja Konverentsikeskus оставляет за собой право вносить изменения в программу.