Audio Course documentation

Добро пожаловать на аудиокурс Hugging Face!

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Добро пожаловать на аудиокурс Hugging Face!

Уважаемый слушатель,

Добро пожаловать на курс по использованию трансформеров в аудио. Трансформеры снова и снова доказывают, что они являются одной из наиболее мощных и универсальных архитектур глубокого обучения, способных достигать передовых результатов в широком спектре задач, включая обработку естественного языка, компьютерное зрение, а с недавних пор и аудио.

В этом курсе мы рассмотрим, как трансформеры могут быть применены к аудиоданным. Вы узнаете, как использовать их для решения ряда задач, связанных с аудио. Если вас интересует распознавание речи, классификация аудиоданных или генерация речи из текста, трансформеры и данный курс помогут вам в этом.

Чтобы вы могли оценить возможности этих моделей, произнесите несколько слов в демонстрации ниже и посмотрите, как модель транскрибирует их в режиме реального времени!

В ходе курса вы получите представление о специфике работы с аудиоданными, узнаете о различных архитектурах трансформеров, а также обучите свои собственные аудио трансформеры, используя мощные предварительно обученные модели.

Этот курс рассчитан на слушателей, имеющих опыт глубокого обучения и общее представление о трансформерах. Знаний в области обработки аудиоданных не требуется. Если вам нужно подтянуть свое понимание трансформеров, ознакомьтесь с нашим курсом по NLP, в котором очень подробно рассматриваются основы трансформеров.

Знакомство с командой курса

Санчит Ганди, инженер-исследователь в области машинного обучения в Hugging Face

Привет! Меня зовут Санчит, и я работаю инженером-исследователем в области машинного обучения звука в Open Source команде компании Hugging Face 🤗. Основным направлением моей работы является автоматическое распознавание речи и перевод, а текущей целью - сделать речевые модели более быстрыми, более легкими и простыми в использовании.

Маттиджс Холлеманс, инженер по машинному обучению в Hugging Face

Меня зовут Маттиджс, я работаю инженером по машинному обучению аудио в команде Hugging Face с открытым исходным кодом. Я также являюсь автором книги о том, как писать звуковые синтезаторы, а в свободное время создаю аудиоплагины.

Мария Халусова, отдел документации и курсов в Hugging Face

Меня зовут Мария, и я создаю образовательный контент и документацию, чтобы сделать библиотеку Transformers и другие инструменты с открытым исходным кодом еще более доступными. Я раскрываю сложные технические концепции и помогаю людям начать работу с передовыми технологиями.

Вайбхав Шривастав, ML-разработчик, инженер по продвижению интересов разработчиков в компании Hugging Face

Меня зовут Вайбхав и я являюсь инженером по продвижению интересов разработчиков в области аудио в Open Source команде компании Hugging Face. Я занимаюсь исследованиями в области аудио с низким потреблением ресурсов и помогаю продвигать передовые исследования в области обработки речи в массы.

Структура курса

Курс состоит из нескольких разделов, в которых подробно рассматриваются различные темы:

  • Раздел 1: охватывает специфику работы с аудиоданными, включая методы обработки аудиоданных и их подготовку.
  • Раздел 2: познакомит с аудиоприложениями и научит использовать конвейеры 🤗 Transformers для решения различных задач, таких как классификация аудио и распознавание речи.
  • Раздел 3: познакомит с архитектурами аудио трансформеров, расскажет, чем они отличаются и для каких задач лучше всего подходят.
  • Раздел 4: научит создавать собственный классификатор музыкальных жанров.
  • Раздел 5: углубится в распознавание речи и построение модель для расшифровки записей совещаний.
  • Раздел 6: научит генерировать речь из текста.
  • Раздел 7: научит создавать реальные аудиоприложения с использованием трансформеров.

Каждый раздел включает в себя теоретическую часть, где вы получите глубокое понимание основных концепций и методов. На протяжении всего курса мы предлагаем тестовые задания, которые помогут вам проверить свои знания и закрепить полученные навыки. Некоторые главы также включают практические упражнения, где вы сможете применить полученные знания.

К концу курса вы получите прочную базу в области использования трансформеров для аудиоданных и будете хорошо подготовлены к применению этих методов для решения широкого круга задач, связанных с аудио.

Разделы курса будут выходить несколькими последовательными блоками со следующим графиком публикации:

Раздел Дата публикации
Раздел 0, Раздел 1, и Раздел 2 14 июня 2023
Раздел 3, Раздел 4 21 июня 2023
Раздел 5 28 июня 2023
Раздел 6 5 июля 2023
Раздел 7, Раздел 8 12 июля 2023

Траектории обучения и сертификация

Не существует правильного или неправильного способа изучения этого курса. Все материалы данного курса являются 100% бесплатными, общедоступными и открытыми. Вы можете изучать курс в удобном для вас темпе, однако мы рекомендуем проходить его по порядку.

Если вы хотите получить сертификат по окончании курса, мы предлагаем два варианта:

Тип сертификата Требования
Сертификат о прохождении обучения Выполнить 80% практических заданий в соответствии с инструкциями.
Cертификат c отличием Выполнить 100% практических заданий в соответствии с инструкциями.

В каждом практическом упражнении указаны критерии его выполнения. Если вы выполнили достаточное количество практических упражнений, чтобы претендовать на получение сертификата, обратитесь к последнему разделу курса, чтобы узнать, как его получить. Удачи!

Зарегистрироваться на курс

Разделы этого курса будут выходить постепенно в течение нескольких недель. Мы рекомендуем вам подписаться на обновления курса, чтобы не пропустить появление новых разделов. Учащиеся, подписавшиеся на обновления курса, также первыми узнают о специальных социальных мероприятиях, которые мы планируем проводить.

Зарегистрироваться

Наслаждайтесь курсом!

< > Update on GitHub