S
SlivInfoKurs
Модератор
- Регистрация
- 31.03.2020
- Сообщения
- 149 133
- Реакции
- 366
- Онлайн
- 6дн 5ч 18м 8с
- #1
Голосов: 0
Описание:
Ваш обучающий путь на модуле Exploratory Data Analysis:
◆ Модуль представляет собой комплексное изучение стохастического подхода к анализу данных. Вы овладеете навыками классификации переменных и выбора соответствующих мер для определения местоположения и разброса значений, а также освоите применение разнообразных методов анализа данных.
Курс включает изучение математической статистики, линейной алгебры, математического анализа и теории вероятностей, которые используются в области оптимизации и машинного обучения. Вы получите навыки проведения базового исследовательского анализа, визуализации данных, исправления ошибок, заполнения пропущенных значений и оптимизации больших датасетов.
◆ Погружение в стохастический подход
Exploratory Data Analysis (EDA) активно применяется для исследования и анализа наборов данных с целью получения первичных знаний о их структуре, характеристиках и возможных шаблонах и зависимостях. В рамках модуля вы освоите особенности EDA, узнаете о стохастическом подходе и областях его применения.
◆ Работа с различными типами переменных
В процессе обучения вам предстоит изучить использование различных типов переменных в рамках EDA: непрерывных, дискретных, порядковых, номинальных, количественных. Также вас ждет знакомство с такими понятиями как зависимость переменных, корреляция и регрессия.
◆ Основы работы с массивами данных
Специфика EDA включает работу с большими массивами данных, начиная от этапа подготовки данных до анализа, визуализации, агрегации и трансформации. Вы узнаете о необходимых для этого инструментах и методах.
◆ Оптимизация работы с большими датасетами
Модуль научит вас эффективно работать с большими объемами данных, повышать скорость обработки информации и уменьшать время на её анализ. Мы расскажем вам о правилах удаления ненужных переменных, принципах индексации и методах компрессии данных.
Модуль включает следующие темы:
Введение в Exploratory Data Analysis, его алгоритмы и методы
Математическая статистика в рамках EDA и типы признаков
Линейная алгебра и её применение в линейных методах
Математический анализ в задачах оптимизации
Теория вероятностей и математическая статистика
Применение теории вероятностей в Наивном Байесовском классификаторе
Анализ данных
Общая программа модуля:
Продолжительность курса: 16 академических часов / 4 недели
Формат обучения: Лекция + семинар
Изучение истории стохастического подхода, типов переменных. Основные метрики для анализа данных. Визуализация диапазона значений (диаграмма размаха)
Создание таблиц частот и оценка метрик по неполным данным. Гистограммы плотности распределения
Изучение зависимости двух переменных. Корреляция и регрессия
Непараметрическая корреляция. Вычисление корреляции и построение регрессии в Python
Мониторинг приложений. Автоматизация процесса деплоя с помощью GitHub Actions
Оптимизация работы с большими датасетами и библиотеки для обработки больших объемов данных
Ваши навыки после прохождения модуля:
Способность применять математическую статистику в рамках EDA
Создание таблиц частот и гистограмм плотностей, оценка метрик по неполным данным
Вычисление корреляции и построение регрессии в Python
Работа с массивами данных, устранение пропусков. Классификация и агрегация данных. Визуализация в Tableau
Оптимизация работы с большими датасетами и использование специализированных библиотек
Mathshub — это международная школа, специализирующаяся на анализе данных и разработке.
Преподаватель модуля: Георгий Милютин. Он специализируется на EDA, математике и статистике. Ранее он был главой отдела математики в группе London Gate Education.
Записи занятий модуля
Проверка домашних заданий
Стоимость курса на текущий момент: 10099р. (старая цена - 14399р.)
Секретная ссылка
Этот курс появится в скором времени на форуме SLIVINFOKURS.BIZ. Проверьте по поиску форума, возможно данный курс уже слит.