УДК 004

Плагин для транскрибации видео-лекций

Чупеев Андрей Дмитриевич – студент кафедры Программного обеспечения Тюменского государственного университета

Титов Павел Сергеевич – студент кафедры Программного обеспечения Тюменского государственного университета

Герасимов Александр Владимирович – студент кафедры Программного обеспечения Тюменского государственного университета

Коняев Илья Асеевич – студент кафедры Программного обеспечения Тюменского государственного университета

Аннотация: Статья представляет новый плагин для транскрибации видео-лекций, который обеспечивает автоматическое преобразование аудио в текст. Плагин использует современные алгоритмы обработки речи и машинного обучения для точной транскрибации речи преподавателей. Плагин значительно сокращает время и усилия, необходимые для создания текстовых версий видео-лекций, улучшая доступность и удобство обучения.

Ключевые слова: плагин, транскрибация, распознавание речи, доступность, образование.

Введение

В современном образовании акцент делается на повышении эффективности усвоения учебного материала студентами. Однако с развитием онлайн-образования и доступности видео-лекций, возникают новые вызовы. Для многих студентов просмотр видео-лекций может представлять собой настоящий вызов, особенно при работе с большим объемом информации. Эта статья вводит в оборот новый плагин, разработанный специально для транскрибации видео-лекций, который имеет потенциал значительно улучшить способность студентов усваивать обучающий материал.

Суть данного плагина заключается в автоматическом преобразовании речи в видео-лекциях в текст. Это означает, что студенты получают возможность визуально и аудиально воспринимать информацию одновременно, что может способствовать улучшению их концентрации, понимания и усвоения материала. Путем совмещения текстовой версии и аудио-содержания лекций, студенты могут более эффективно осваивать учебный материал и преодолевать трудности, которые могли бы возникнуть при простом просмотре видео.

Этот плагин представляет собой важное новшество для образовательных платформ и онлайн-курсов, а также для образовательных учреждений, которые стремятся улучшить образовательный опыт студентов и повысить их образовательные результаты. В данной статье мы подробно рассмотрим работу этого плагина, его преимущества и перспективы в современной среде образования.

Проблема

Проблема, которую решает наш плагин, заключается в низкой просматриваемости видео-лекций среди студентов. В ходе исследования выявлены несколько вероятных причин данной проблемы.

Во-первых, низкая мотивация студентов для просмотра видео-лекций является одной из возможных причин. Студенты могут испытывать отсутствие интереса к предмету или недостаточное понимание важности усвоения материала из видео-лекций.

Во-вторых, нежелание выделять достаточное количество времени для изучения материала также может приводить к низкой просматриваемости видео-лекций. Студенты могут ощущать нехватку времени из-за загруженности расписанием или иметь другие приоритеты, что снижает их мотивацию и возможность уделить достаточно времени просмотру видео-лекций.

В результате эти факторы могут препятствовать эффективному усвоению материала и влиять на успех студентов в образовательном процессе. Понимание причин низкой просматриваемости видео-лекций является важным шагом в разработке и предложении решений, которые могут повысить мотивацию студентов и помочь им эффективно использовать видео-лекции для обучения.

image001

Рисунок 1. Опрос об отношении предполагаемой аудитории к проблеме и её решению.

Гипотеза

Гипотеза, предложенная в данной статье, основывается на предположении, что интеграция текстовой версии видео-лекций в систему управления обучением (LMS) может иметь значительное положительное воздействие на процесс обучения студентов. Более подробно, гипотеза может быть развернута следующим образом:

Улучшение усвоения информации: предоставление студентам текстовых версий видео-лекций позволит им более эффективно усваивать учебный материал. Визуальная и текстовая информация могут дополнять друг друга, что способствует более глубокому и полному пониманию учебных концепций.

Повышение вовлеченности и концентрации: предполагается, что наличие текстового контента поможет студентам легче удерживать внимание и концентрироваться на материале. Это особенно актуально в условиях современного информационного общества, где внимание студентов часто разрознено.

Облегчение поиска информации: текстовое описание видео-лекций может служить важным инструментом для поиска и извлечения необходимой информации. Студенты могут использовать ключевые слова или фразы, чтобы быстро найти нужные разделы лекции, что сэкономит их время и усилит мотивацию к обучению.

Улучшение результатов обучения: предполагается, что вышеуказанные факторы, в совокупности, должны привести к улучшению общих результатов обучения. Студенты, получившие доступ к текстовым версиям лекций, могут показать более высокие баллы на экзаменах и заданиях, так как они могут более эффективно учиться и повышать свои знания.

Увеличение удовлетворенности студентов: путем предоставления студентам дополнительных ресурсов, способствующих более эффективному обучению, удовлетворенность студентов может возрасти. Это может повысить их мотивацию и интерес к учебному процессу, что в свою очередь может снизить отток студентов и улучшить общий опыт обучения.

Эта гипотеза предоставляет основу для дальнейшего исследования и анализа эффективности интеграции текстовых версий видео-лекций в LMS, и она может иметь важное значение для образовательных учреждений, которые стремятся улучшить качество образования и удовлетворенность студентов.

image002

Рисунок 2. Опрос об отношении предполагаемой аудитории к гипотезе.

Реализация

Реализация плагина включал несколько этапов, каждый из которых использовал определенные языки программирования и инструменты.

Для создания пользовательского интерфейса плагина были использованы JavaScript, CSS и HTML. JavaScript обеспечивал динамическую интерактивность и функциональность плагина, CSS позволял стилизовать элементы интерфейса, а HTML использовался для разметки и структурирования контента.

Для процесса транскрибации видео-лекций использовался Python в связке с Whisper OpenAI[2]. Whisper OpenAI[2] предоставлял возможность распознавания речи в видео и преобразования ее в текст. Python использовался для разработки скриптов и интеграции Whisper OpenAI[2] в плагин.

Для извлечения ключевых слов из текста был использован Python с использованием библиотек Yake[3] и PyMorphy2[1]. Yake предоставлял возможность автоматического извлечения ключевых слов из текста, а PyMorphy2[1] использовался для лемматизации и морфологического анализа слов, повышая качество извлеченных ключевых слов.

Для обеспечения работы backend-сервера, API и кеширования данных использовался Python в связке с FastAPI[4], MongoDB[5] и Nginx. FastAPI[4] обеспечивал создание эффективного API для обработки запросов клиентов, MongoDB[5] служила базой данных для хранения и извлечения данных, а Nginx использовался в качестве веб-сервера для обеспечения высокой производительности и масштабируемости системы.

image003

Рисунок 3. Архитектура приложения.

Результат

Результаты проведенных опросов в рамках данной статьи явно подтверждают, что разработанный плагин для транскрибации видео-лекций представляет значительный потенциал для улучшения эффективности усвоения материала студентами. Подробно проанализируем результаты и их важность:

Гибкий подход к обучению: из опросов следует, что предоставление текстовых версий видео-лекций позволяет студентам гибко подходить к процессу обучения. Они могут выбирать свой собственный темп изучения материала, что особенно важно, учитывая разнообразие уровней подготовки и стилей обучения среди студентов.

Повышение концентрации и понимания: предоставление текстовых версий видео-лекций способствует повышению концентрации студентов. Они могут одновременно видеть и слушать материал, что увеличивает вероятность полного понимания и запоминания информации.

Увеличение вовлеченности студентов: опросы также указывают на увеличение вовлеченности студентов в образовательный процесс. Возможность обращаться к текстовым версиям лекций и искать нужную информацию делает учебный материал более доступным и интересным.

Исходя из этих результатов, можно заключить, что разработанный плагин для транскрибации видео-лекций является важным инструментом для улучшения усвоения материала студентами. Это расширяет доступность образования, делая его более инклюзивным, и улучшает образовательный опыт студентов. Этот инновационный подход к предоставлению учебного материала может помочь повысить уровень образования и удовлетворенность студентов в современных образовательных учреждениях.

image004

Рисунок 4. Интерфейс плагина.

image005

Рисунок 5. Интерфейс плагина.

image006

Рисунок 6. Интерфейс плагина.

Заключение

Применение разработанного плагина для транскрибации видео-лекций на платформах онлайн-образования имеет потенциал принести значительные пользы образовательному процессу. Разберем более подробно, какие выгоды и перспективы предоставляет этот плагин:

Повышение успехов студентов: внедрение текстовых версий видео-лекций способствует улучшению успехов студентов. Гибкий доступ к материалам и улучшенное понимание помогают им лучше усваивать знания и достигать высоких результатов.

Укрепление мотивации: возможность выбора темпа изучения и более гибкого подхода к материалу может укрепить мотивацию студентов. Учебный процесс становится более адаптивным и персонализированным, что способствует активной учебной деятельности.

Эффективное усвоение материала: текстовые версии лекций помогают студентам более эффективно усваивать информацию, что приводит к улучшению образовательных результатов. Студенты могут использовать текст для восполнения пробелов в понимании материала.

Дальнейшее развитие: следующим шагом может быть дальнейшее развитие и совершенствование этого плагина. Внедрение технологий машинного обучения и искусственного интеллекта позволит автоматизировать процесс транскрибации и сделать его более точным и быстрым.

Обеспечение доступности: применение данного плагина также способствует обеспечению доступности образования для всех студентов, включая лиц с ограниченными возможностями. Это способствует созданию более инклюзивной образовательной среды.

В итоге, плагин для транскрибации видео-лекций представляет собой важный инструмент, который способен повысить качество образования, удовлетворенность студентов и успехи в обучении. Дальнейшее развитие этой технологии может привести к новым возможностям для онлайн-образования и обеспечения доступности образования для всех.

Список литературы

  1. Коробов М. (2023). Morphological Analyzer and Generator for Russian and Ukrainian Languages. Yekaterinburg, Russia. URL: https://link.springer.com/chapter/10.1007/978-3-319-26123-2_31  (дата обращения 22.04.2023). Текст: электронный.
  2. Leo Smigel (2023). OpenAI Whisper Python Tutorial: Step-by-Step Guide. URL: https://analyzingalpha.com/openai-whisper-python-tutorial (дата обращения 03.04.2023). Текст: электронный.
  3. Campos R., Mangaravite V., Pasquali A., Jatowt A., Jorge A., Nunes C. and Jatowt A. (2020). YAKE! Keyword Extraction from Single Documents using Multiple Local Features. URL: sci-hub.ru/10.1016/j.ins.2019.09.013 (дата обращения 22.04.2023). Текст: электронный.
  4. Себастьян Рамирес. (2023). FastAPI framework, high performance, easy to learn, fast to code, ready for production. URL: https://fastapi.tiangolo.com/ (дата обращения 18.05.2023). Текст: электронный
  5. Дуайт Мерриман. (2023). MongoDB Documentation. URL: https://www.mongodb.com/docs/ (дата обращения 09.05.2023). Текст: электронный.

Интересная статья? Поделись ей с другими: