Каталог курсов
Такого курса сейчас нет
К сожалению, сейчас невозможно записаться на курс. Вы можете посмотреть похожие программы обучения.
Перейти в каталог курсов
Похожие программы
Нео
IT-профессии: как выбрать направление и реализовать себя
Подробнее о программе
онлайн
Нео
Основы анализа данных в SQL, Python, Power BI, DataLens
Подробнее о программе
онлайн
Нео
Основы аналитики и аналитическое мышление
Подробнее о программе
4 недели
онлайн
удостоверение
Нео
Excel: простые шаги для оптимизации работы с данными
Подробнее о программе
10 дней
онлайн
Нео
Введение в SQL и работу с базой данных
Подробнее о программе
14 дней
онлайн
Нео
Профессии в аналитике: что выбрать
Подробнее о программе
3 дня
онлайн
К сожалению, курс сейчас недоступен
Избранное

Практический курс

Распознавание и генерация речи. Диалоговые системы

Реализуете 5 кейсов: от обучения моделей распознавания звука, перевода из текста в аудио и обратно до создания диалоговой системы

Получите консультацию по своему проекту от личного наставника — эксперта из Сбера или JustAI

Когда
5 сентября — 20 октября
Набор вот-вот закончится
Курс стартовал, но еще можно попасть в этот набор

Формат

1,5 месяца: 2 занятия в неделю

Практика 

5 воркшопов по 3 часа и итоговый проект

Документ

Удостоверение о повышении квалификации

Вы научитесь работать со звуком, чтобы расширить свою экспертизу и предвидеть тренды

Многие специалисты привыкли использовать готовые решения по обработке речи, что может негативно влиять на качество работы со звуком и экономику проекта. На курсе вы научитесь кастомизировать решения, чтобы добиваться более точных результатов в распознавании и генерации звуков, будете создавать нейросети для перевода текста в речь и наоборот.

Для обучения на курсе нужно знать Python, математику, классические методы машинного обучения, основы работы с нейросетями, NLP. Желательно знание основ Deep Learning

Преподаватели курса

Илья Шигабеев

Основатель сервиса по переозвучке видео на английском Langswap.app

Участвовал в автоматизации техподдержки в Cisco, создании голосового ассистента Сбера и голосовой биометрии в будущих телефонах Huawei. Жил в Кремниевой долине

Артур Сапрыкин

NLP-разработчик, предприниматель

C 2019 года с командой создаёт решения с применением технологий ИИ для организаций любого масштаба

Автор телеграм-канала «Магия данных | Артур Сапрыкин»

Вы выполните 5 проектов

Распознавание эмоций по голосу

Создадите систему распознавания эмоций говорящего на основе свёрточной нейронной сети

Перевод звука в текст

Построите языковую модель для распознавания речи и её конвертации в текст

Генерация голоса

Обучите нейросетевую модель для генерации речи из текста

Создание диалоговой системы

Спроектируете вопросно-ответную систему для голосового помощника или чат-бота

Разбор своего кейса

На личной консультации с ментором найдёте оптимальный метод решения своей задачи в рамках итогового проекта

Программа обучения —
1,5 месяца

Вам понадобится 5-6 часов в неделю на обучение

● 5 воркшопов по 2,5 часа с перерывами и итоговый проект, который можно делать на основе своих данных

● 14 часов теории и 24 часа практики, 2 занятия в неделю, начинаются с 19:00 до 19:30

● Личная консультация ментора по своему проекту

Как работать со звуком: специфика данных и актуальные фреймворки

Познакомитесь с основными методами цифровой обработки аудиосигналов и базовыми библиотеками для работы со звуком: Pydub и Librosa.

1,5 часа теории

Как обрабатывать и очищать звуковые сигналы

Разберётесь в спектральных разложениях сигналов, из каких характеристик состоит звук. Узнаете основные понятия теории цифровой обработки сигналов и методы фильтрации.

1,5 часа теории

Как транскрибировать звук

Поймёте, как извлекать из аудио текст, что такое связь с языковыми моделями, как классифицировать тексты с помощью SOTA нейронных сетей для Speech to text.

1,5 часа теории

Извлечение текста из аудио

Воркшоп

Изучите проблемы извлечения признаков и современные подходы к решению подобных задач.

2,5 часа практики

Распознавание аудио

Воркшоп

Узнаете про биометрию голоса, методы обработки сигналов, распознавание естественной речи, идентификационные признаки голоса, речевые декодеры.

2,5 часа практики

Поиск аудио

Воркшоп

Попрактикуетесь применять основные методы поиска аудиоинформации и технологии интеллектуального поиска музыки.

2,5 часа практики

Синтез речи

Воркшоп

Погрузитесь в этапы построения систем Text to speech, Speech to text, в подходы к решению задач.

2,5 часа практики

Диалоговые системы

Воркшоп

Познакомитесь с технологиями на стыке SR и NLP. Узнаете основные подходы к созданию диалоговых систем, платформы для создания ИИ-ассистентов.

2,5 часа практики

Разбор вашего проекта

Вы реализуете кейс, в котором можете использовать свои данные. Например, решить задачу по распознаванию речи, её генерации или созданию диалоговой системы.

В работе над проектом вас будет курировать ментор. Вы вместе с экспертом выберете удобную дату для персональной консультации.

10 часов практики

Как проходит обучение

  • Приходите на онлайн-лекции или смотрите их в записи в удобное время

  • Практикуетесь на групповых воркшопах

    они начинаются в промежутке с 19:00 до 19:30

  • Общаетесь в телеграм-чате с преподавателями курса и наставниками

  • Консультируетесь по индивидуальному проекту с наставником

Наши выпускники становятся частью сообщества дата-сайентистов в Discord

Вы сможете получить совет, предложить тему или кейс для обсуждения, а ещё найти партнёра или сотрудника, подходящую вакансию, стать ментором или самому выбрать наставника.

Вы можете пройти обучение за счёт работодателя

Обсудите возможность со своим руководителем и оставьте заявку. Подробнее о том, как это сделать, читайте по ссылке.

Отвечаем на вопросы

  • Кто будет обучаться вместе со мной?

    Курс ориентирован на IT-специалистов, которые знают язык Python, классические методы машинного обучения, основы работы с нейросетями, основы NLP и математику для Data Science. Также для обучения желательно понимание основ Deep Learning.

  • Как будет проходить практика на курсе?

    Вас ждут 5 кейс-стади по 2,5 часа каждая. Они начинаются в промежутке с 19:00 до 19:30. Если не получится лично присутствовать на занятии, можно посмотреть запись и задать эксперту вопросы в чате.

  • Смогу ли я применить эти практики в работе?

    Да, вы можете использовать знания сразу же во время обучения. Например, обучать нейросеть для детекции ключевых слов в собственном проекте.