Мы используем файлы cookie для обеспечения работоспособности сервиса, улучшения навигации и маркетинговых активностей Yolonce. Нажимая "Согласен", вы соглашаетесь с нашей Политикой конфиденциальности

Основы работы с большими данными (Data Science)

  Сложность

Пока неизвестно

  Длительность

16 ак. ч. + 4 ак. ч. самостоятельно

  Формат

онлайн

  Документ по выпуску

Пока неизвестно

Стоимость курса
11 950

Подробнее о курсе

В процессе деятельности любая компания постоянно ищет новые способы развития: оптимизирует производство, улучшает бизнес-процессы, увеличивает вложения в рекламу и маркетинг, повышает уровень сервиса. Но если успехи компании сходят на нет, зачастую сложно понять, что именно идет не так и почему. Есть область, ресурсы которой еще не исчерпаны – это Data Science. Накопленные в компании данные, полученные из разных источников, таят в себе огромный потенциал. Грамотный анализ больших объемов разнородных данных (Big Data), выведение скрытых закономерностей приводят аналитиков порой к неожиданным открытиям и выводам. Оперируя этими сведениями, можно вывести свою компанию в лидеры рынка. Этот курс – введение в сложную и многогранную область науки по работе с большими данными – Data Science. Вопросы, на которые вы получите ответы: Что представляет собой Data Science и как она связана с большими данными (Big Data)? Как «приложить» Data Science к вашему бизнесу и нужно ли? Какие данные можно использовать для анализа? Где именно искать и какие результаты ожидать? Для кого этот курс? Руководители компаний и подразделений Линейные менеджеры Бизнес-аналитики Разработчики Другие сотрудники, вовлеченные в аналитическую деятельность компании Что даст вам прохождение курса? Вы поймете, как подготовить компанию и сотрудников к практическому применению больших данных (Big Data) в работе. Вы сможете повысить эффективность принятия решений за счет грамотного сбора, структурирования и применения современных техник анализа больших данных (Big Data). Полученные знания и навыки позволят слушателям повысить эффективность принятия решений за счет грамотного сбора, структурирования и применения современных техник анализа больших объемов данных: Data – Information – Knowledge – Wisdom: от данных к мудрости в принятии решений! В курсе рассматриваются вопросы: источники информации: структурированные и неструктурированные; стандартный межотраслевой процесс анализа данных CRISP-DM; основные характеристики больших данных и способы их анализа; понятие «озер данных» (data lake) и обзор инструментария; элементы классификации данных и машинного обучения; основы статистического анализа, построение регрессионных зависимостей; визуализация «больших данных»; обзор классов задач, решаемых инструментами машинного обучения и ИИ: распознавание образов, звуков, текста, прогностика, анализ соцсетей; обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики; обзор прикладных инструментов: AWS, Azure AI, machine learning.ru c демонстрацией применения; обзор инструментов «без кода» (nocode); специальности в области «больших данных» и формирование команд: аналитики данных, «ученые по данным», программисты по «большим данным», менеджеры по «большим данным» (CDO); методы реорганизации работы компании при применении анализа «больших данных». Спешите записаться на наш курс «Основы работы с большими данными (Data Science)», чтобы освоить Big Data и вывести свою компанию в лидеры! Обучение проходит на основе национальных стандартов: ГОСТ Р 59276-2020 «Системы искусственного интеллекта. Способы обеспечения доверия. Общие положения» и ГОСТ Р 59277-2020 «Системы искусственного интеллекта. Классификация систем искусственного интеллекта».

Автор курса

Ведущий компьютерный учебный центр России с высочайшим уровнем качества обучения, сервиса и организации учебного процесса Лучший учебный центр авторизованный Microsoft в России, Центральной и Восточной Европе в 2011-2014 гг Центр «Специалист» — первый в России авторизованный учебный центр по обучению Adobe — Adobe Authorised Training Centre Крупнейший авторизованный учебный центр ведущих IT-компаний мира С 2012 г. Центр «Специалист» входит в «Круг совершенства EC-Council»

Программа курса

  Модуль 1. Область применения больших данных. Типовые задачи &nbsp(1&nbspак.&nbspч.)

Цели курса Определение основных понятий История науки о данных Выгоды от работы с большими данными Типовые задачи: прогноз продаж, производства, спроса. Анализ поведения. Распознавание образов. Экспертные системы.

  Модуль 2. Сбор и подготовка исходных данных. Методика CRISP-DM &nbsp(2&nbspак.&nbspч.)

С чего начать. Межотраслевая стандартная методика работы с данными CRISP-DM. Описательное и ассоциативное исследование исходных данных. Сегментирование и очистка данных (slice and dice). Примеры инструментов Excel . Визуализация данных в Excel. Как использовать сводные таблицы и диаграммы. «Озера данных» (Data lakes). Отличия озер данных от структурированных хранилищ. Обзор инструментария. Практическая работа. Сегментировать и очистить тестовый набор данных.

  Модуль 3. Модуль 3. Основы математической статистики, ANOVA. Надстройка Excel «Пакет анализа» &nbsp(2&nbspак.&nbspч.)

Описательная статистика. Среднее, наиболее вероятное, медиана. Дисперсия, стандартное отклонение, стандартная ошибка. Виды распределений. Пакет анализа данных Excel. Обзор других прикладных средств работы с данными (R, Python, Octave, MathLab, специализированные БД). Практическая работа. Определить статистические характеристики выборки данных.

  Модуль 4. Задача прогноза продаж. Понятие машинного обучения. Корреляция. Регрессионный анализ. &nbsp(3&nbspак.&nbspч.)

Постановка задачи оценки взаимосвязи между различными факторами и построение прогноза. Корреляция. Коэффициент Пирсона. Критерий Стьюдента (T-анализ). Основы машинного обучения. Регрессионный анализ. Построение и анализ трендов в Excel. Регрессионный анализ на трендах. Практическая работа. Определить наличие корреляции и регрессионную зависимость между двумя выборками данных. Построить тренд.

  Модуль 5. Задачи классификации и распознавания образов, видео, речи, текста. Понятие нейронных сетей. Примеры применения &nbsp(3&nbspак.&nbspч.)

Задача сегментации дискретных данных на примере задач распознавания (графика, речь, текст). Нейронные сети как инструмент решения задач классификации. Демонстрация источников библиотек и no-code.

  Модуль 6. Задача исследования социальных сетей. Задача прогнозирования поведения пользователя. Социальные и направленные графы. Деревья решений. Примеры применения &nbsp(3&nbspак.&nbspч.)

Задачи классификации данных в социальных сетях и поиска оптимального решения (маршрута). Графы как инструмент решения задач на социальных графах и прогнозирования поведения. Дерево решений. Разбиение на выборки (обучающую, тестовую, проверочную). Анализ ошибок обучения. Базис и отклонения. Ручная корректировка. Практическая работа: провести классификацию набора данных и его разбиение на сегменты.

  Модуль 7. Продвинутые инструменты: глубокое машинное обучение, искусственный интеллект, нечеткие множества &nbsp(1&nbspак.&nbspч.)

Понятие Deep Machine Learning. Понятия естественного языка и нечетких логик. Многофакторный бизнес анализ на примере нечетких логик.

  Модуль 8. Профориентация по специальностям в Data Science. Выводы и рекомендации по построению и организации работы команды &nbsp(1&nbspак.&nbspч.)

Роли специалистов по DS: аналитик данных, ученый по данным, программист, цифровой директор. Требования к компетенциям и взаимодействию сотрудников в области аналитики данных. Состав и требования к проектной команде для DS. Подготовка компании к применению «бигдата».

Что вы получите

определять источники сбора информации и формировать требования к ним;

применять стандартный CRISP-DM процесс для Вашей организации;

подбирать команду для работы с большими данными (Big Data);

выбирать инструментарий для практической работы;

применять специализированные инструменты Excel – «Пакет анализа данных» и «Тренды»;

применять «дерево решений»;

определять подходящие инструменты и методы для решения основных классов задач машинного обучения и взаимодействовать с разработчиками;

использовать методы классификации данных для машинного обучения;

подбирать выборки разработки, тестовую и обучающую для достижения наилучших результатов анализа информации;

работать с nocode инструментом (на примере одного инструмента);

организовывать реорганизацию работы компании для применения управления на основе больших данных.

Оставьте отзыв

Напишите ваш коментарий, не менее 30 символов

Нажимая кнопку, вы даете согласие на обработку персональных данных

обновлено: 24.11.2024

Похожие курсы

Основы хранилищ данных

Основы хранилищ данных

Библиотеки Python для Data Science

Библиотеки Python для Data Science

Data Science для руководителей

Data Science для руководителей

Data Science с Глебом Михайловым

Data Science с Глебом Михайловым

Data Science для руководителей

Data Science для руководителей

Математика для Data Science. Специализация. Тариф «Перельман»

Математика для Data Science. Специализация. Тариф «Перельман»

Big Data и Data Science: перейди на новый уровень

Big Data и Data Science: перейди на новый уровень

Stepik
 онлайн
 26-28 часов6 недель по 4-5 часов
  Перейти к курсу
Big Data и Data Science: перейди на новый уровень

Big Data и Data Science: перейди на новый уровень

Stepik
 онлайн
 26-28 часов6 недель по 4-5 часов
  Перейти к курсу

Оставьте заявку

Наши консультанты ответят на все вопросы
И помогут в выборе

Комментарий ...

Нажимая кнопку, вы даете согласие на обработку персональных данных