DP - 203: Проектирование решений для данных в Microsoft Azure
DP - 203: Проектирование решений для данных в Microsoft Azure
Пока неизвестно
32 ак. ч.
онлайн
Пока неизвестно
Подробнее о курсе
Программа курса
Модуль 1. Изучение возможностей вычислений и хранения для рабочих нагрузок инженерии данных  (1 ак. ч.)
Введение в Azure Synapse Analytics Описание Azure Databricks Введение в хранилище озера данных Azure Опишите архитектуру озера Дельта Работа с потоками данных с помощью Azure Stream Analytics Лабораторная работа: Изучение возможностей вычислений и хранения для рабочих нагрузок инженерии данных. Объедините потоковую и пакетную обработку в едином конвейере Организуйте озеро данных по уровням преобразования файлов Индексируйте хранилище озера данных для ускорения запросов и рабочих нагрузок
Модуль 2. Разработка и реализация уровня обслуживания  (2 ак. ч.)
Разработайте многомерную схему для оптимизации аналитических рабочих нагрузок Масштабируемое преобразование без кода с помощью фабрики данных Azure Заполнение медленно меняющихся измерений в конвейерах Azure Synapse Analytics Лабораторная работа: Разработка и реализация уровня обслуживания. Разработайте звездообразную схему для аналитических рабочих нагрузок Заполнение медленно изменяющихся измерений с помощью фабрики данных Azure и сопоставление потоков данных
Модуль 3. Рекомендации по проектированию данных для исходных файлов  (2 ак. ч.)
Проектирование современного хранилища данных с помощью Azure Synapse Analytics Защита хранилища данных в Azure Synapse Analytics Лабораторная работа: Вопросы инженерии данных. Управление файлами в озере данных Azure Защита файлов, хранящихся в озере данных Azure
Модуль 4. Выполнение интерактивных запросов с использованием бессерверных пулов SQL в Azure Synapse Analytics  (2 ак. ч.)
Изучите возможности бессерверных пулов SQL в Azure Synapse Запрос данных в озере с помощью бессерверных пулов SQL Azure Synapse Создание объектов метаданных в бессерверных пулах SQL Azure Synapse Защита данных и управление пользователями в бессерверных пулах SQL Azure Synapse Лабораторная работа: Выполнение интерактивных запросов с использованием бессерверных пулов SQL. Запрос данных Parquet с помощью бессерверных пулов SQL Создание внешних таблиц для файлов Parquet и CSV Создание представлений с помощью бессерверных пулов SQL Безопасный доступ к данным в озере данных при использовании бессерверных пулов SQL Настройка безопасности озера данных с помощью управления доступом на основе ролей (RBAC) и списка управления доступом
Модуль 5. Изучение, преобразование и загрузка данных в хранилище данных с помощью Apache Spark  (2 ак. ч.)
Понимание инженерии больших данных с помощью Apache Spark в Azure Synapse Analytics Получение данных с помощью записных книжек Apache Spark в Azure Synapse Analytics Преобразование данных с помощью DataFrames в пулах Apache Spark в Azure Synapse Analytics Интеграция пулов SQL и Apache Spark в Azure Synapse Analytics Лабораторная работа: Изучение, преобразование и загрузка данных в хранилище данных с помощью Apache Spark. Выполнение исследования данных в Synapse Studio Получение данных с помощью записных книжек Spark в Azure Synapse Analytics Преобразование данных с помощью DataFrames в пулах Spark в Azure Synapse Analytics Интеграция пулов SQL и Spark в Azure Synapse Analytics
Модуль 6. Исследование и преобразование данных в Azure Databricks  (2 ак. ч.)
Описание Azure Databricks Чтение и запись данных в Azure Databricks Работа с DataFrames в Azure Databricks Работа с расширенными методами DataFrames в Azure Databricks Лабораторная работа: Исследование и преобразование данных в Azure Databricks. Использование DataFrames в Azure Databricks для изучения и фильтрации данных Кэшировать DataFrame для более быстрых последующих запросов Удалить повторяющиеся данные Управление значениями даты / времени Удалить и переименовать столбцы DataFrame Сводные данные, хранящиеся в DataFrame
Модуль 7. Получение и загрузка данных в хранилище данных  (2 ак. ч.)
Используйте рекомендации по загрузке данных в Azure Synapse Analytics Прием петабайтов с помощью фабрики данных Azure Лабораторная работа: Получение и загрузка данных в хранилище данных. Выполнение приема петабайтов с помощью Azure Synapse Pipelines Импорт данных с помощью PolyBase и КОПИРОВАНИЕ с помощью T-SQL Используйте рекомендации по загрузке данных в Azure Synapse Analytics
Модуль 8. Преобразование данных с помощью фабрики данных Azure или Azure Synapse Pipelines  (2 ак. ч.)
Интеграция данных с фабрикой данных Azure или Azure Synapse Pipelines Масштабируемое преобразование без кода с помощью фабрики данных Azure или Azure Synapse Pipelines Лабораторная работа: Преобразование данных с помощью фабрики данных Azure или Azure Synapse Pipelines. Выполняйте масштабные преобразования без кода с помощью Azure Synapse Pipelines Создайте конвейер данных для импорта плохо отформатированных файлов CSV Создание потоков данных сопоставления
Модуль 9. Управление перемещением и преобразованием данных в Azure Synapse Pipelines  (2 ак. ч.)
Управляйте перемещением и преобразованием данных в фабрике данных Azure Лабораторная работа: Управление перемещением и преобразованием данных в Azure Synapse Pipelines. Интеграция данных из записных книжек с фабрикой данных Azure или конвейерами Azure Synapse
Модуль 10. Оптимизация производительности запросов с помощью выделенных пулов SQL в Azure Synapse  (2 ак. ч.)
Оптимизация производительности запросов к хранилищу данных в Azure Synapse Analytics Ознакомьтесь с функциями Azure Synapse Analytics для разработчиков хранилища данных. Лабораторная работа: Оптимизация производительности запросов с помощью выделенных пулов SQL в Azure Synapse. Изучите особенности Azure Synapse Analytics для разработчиков Оптимизация производительности запросов к хранилищу данных в Azure Synapse Analytics
Модуль 11. Анализ и оптимизация хранилища данных  (2 ак. ч.)
Анализируйте и оптимизируйте хранилище хранилища данных в Azure Synapse Analytics Лабораторная работа: Анализ и оптимизация хранилища данных. Проверьте искаженные данные и использование пространства Сведения о хранилище хранилища столбцов Изучите влияние материализованных представлений Изучите правила для минимально регистрируемых операций
Модуль 12. Поддержка гибридной аналитической обработки транзакций (HTAP) с помощью Azure Synapse Link  (2 ак. ч.)
Разработка гибридной транзакционной и аналитической обработки с помощью Azure Synapse Analytics Настройка ссылки Azure Synapse с помощью Azure Cosmos DB Запросы к Azure Cosmos DB с пулами Apache Spark Запросы к Azure Cosmos DB с бессерверными пулами SQL Лабораторная работа: Поддержка гибридной аналитической обработки транзакций (HTAP) с помощью Azure Synapse Link. Настройка ссылки Azure Synapse с помощью Azure Cosmos DB Запросы к Azure Cosmos DB с помощью Apache Spark для Synapse Analytics Запросы к Azure Cosmos DB с бессерверным пулом SQL для Azure Synapse Analytics
Модуль 13. Комплексная безопасность с помощью Azure Synapse Analytics  (2 ак. ч.)
Защита хранилища данных в Azure Synapse Analytics Настройка и управление секретами в Azure Key Vault Внедрить контроль соответствия для конфиденциальных данных Лабораторная работа: Комплексная безопасность с помощью Azure Synapse Analytics. Безопасная инфраструктура поддержки Azure Synapse Analytics Защита рабочей области Azure Synapse Analytics и управляемых служб Защита данных рабочей области Azure Synapse Analytics
Модуль 14. Обработка потоков в реальном времени с помощью Stream Analytics  (2 ак. ч.)
Обеспечьте надежный обмен сообщениями для приложений больших данных с помощью концентраторов событий Azure Работа с потоками данных с помощью Azure Stream Analytics Получение потоков данных с помощью Azure Stream Analytics Лабораторная работа: Обработка потоков в реальном времени с помощью Stream Analytics. Используйте Stream Analytics для обработки данных в реальном времени из концентраторов событий Используйте оконные функции Stream Analytics для создания агрегатов и вывода в Synapse Analytics. Масштабируйте задание Azure Stream Analytics для увеличения пропускной способности за счет секционирования. Переразбейте входной поток для оптимизации распараллеливания
Модуль 15. Создание решения для потоковой обработки с концентраторами событий и Azure Databricks  (2 ак. ч.)
Обработка потоковых данных с помощью структурированной потоковой передачи Azure Databricks Лабораторная работа: Создание решения для потоковой обработки с концентраторами событий и Azure Databricks. Изучите ключевые функции и способы использования структурированной потоковой передачи Потоковая передача данных из файла и запись их в распределенную файловую систему Используйте скользящие окна для агрегирования фрагментов данных, а не всех данных Применение водяных знаков для удаления устаревших данных Подключение к концентраторам событий для чтения и записи потоков
Модуль 16. Создание отчетов с использованием интеграции Power BI с Azure Synpase Analytics  (2 ак. ч.)
Создавайте отчеты с помощью Power BI, используя его интеграцию с Azure Synapse Analytics. Лабораторная работа: Создание отчетов с использованием интеграции Power BI с Azure Synpase Analytics. Интеграция рабочей области Azure Synapse и Power BI Оптимизировать интеграцию с Power BI Повышение производительности запросов с помощью материализованных представлений и кэширования набора результатов Визуализируйте данные с помощью SQL Serverless и создайте отчет Power BI
Модуль 17. Выполнение интегрированных процессов машинного обучения в Azure Synapse Analytics  (1 ак. ч.)
Используйте интегрированный процесс машинного обучения в Azure Synapse Analytics Лабораторная работа: Выполнение интегрированных процессов машинного обучения в Azure Synapse Analytics. Создание связанной службы машинного обучения Azure Запуск эксперимента Auto ML с использованием данных из таблицы Spark Обогащайте данные с помощью обученных моделей Показывать результаты прогнозов с помощью Power BI
Что вы получите
Изучать варианты вычислений и хранения для рабочих нагрузок инженерии данных в Azure
Разработке и реализации уровня обслуживания
Понимать особенности инженерии данных
Выполнению интерактивных запросов с использованием бессерверных пулов SQL
Изучать, преобразовывать и загружать данные в хранилище данных с помощью Apache Spark
Выполнению исследования и преобразования данных в Azure Databricks
Получению и загрузке данных в хранилище данных
Преобразованию данных с помощью фабрики данных Azure или Azure Synapse Pipelines
Интеграции данных из записных книжек с фабрикой данных Azure или конвейерами Azure Synapse
Оптимизации производительности запросов с помощью выделенных пулов SQL в Azure Synapse
Анализировать и оптимизировать хранилище данных в хранилище данных
Поддержке гибридной транзакционной аналитической обработки (HTAP) с помощью Azure Synapse Link
Обеспечению сквозной безопасности с помощью Azure Synapse Analytics
Выполнять потоковую обработку в реальном времени с помощью Stream Analytics
Созданию решения для потоковой обработки с концентраторами событий и Azure Databricks
Создавать отчеты с помощью интеграции Power BI с Azure Synpase Analytics
Выполнению интегрированных процессов машинного обучения в Azure Synapse Analytics
Оставьте отзыв
Похожие курсы
Бесплатные курсы
Оставьте заявку
Наши консультанты ответят на все вопросы
И помогут в выборе
Нажимая кнопку, вы даете согласие на обработку персональных данных