gototopgototop

Корпус текстов как дидактический материал: лингвистическая обработка и технология обучения

Гусева Алла Ханафиевна – кандидат педагогических наук, доцент Российского государственного гуманитарного университета.

Аннотация: Статья посвящена описанию методики работы с корпусом текстов, применяемой на практических занятиях по предмету «Перевод научных текстов гуманитарной тематики». Рассмотрена технология обработки и переводческого чтения научных текстов по гуманитарным специальностям. В статье приведены характеристики корпуса специальных текстов, описаны основные этапы работы и учебные действия этого образовательного курса. Делается вывод, что анализируемая методика помогает сформировать навыки интерредактирования и создания гипертекстов, что помогает усовершенствовать переводческие компетенции студентов.

Ключевые слова: Концепция дисциплины, корпус текстов, лингвистическая обработка, перевод гипертекста, технология интрерредактирования.

Современные компьютерные технологии интегрированы в образовательный процесс на уровне магистратуры. Одной из ключевых задач профессионального обучения будущих переводчиков является совершенствование навыков работы в Интернет-среде с использованием текстовых редакторов, электронных справочников и энциклопедий, лексикографических материалов, специального лингвистического и программного обеспечения. В предлагаемом образовательном курсе «Перевод научных текстов гуманитарной тематики» (далее – «ПНТГТ»), который читается студентам магистратуры Института филологии и истории РГГУ (специальность «Перевод и переводоведение»), обязательному освоению подлежат заранее определенные официальные электронные ресурсы на иностранных языках, которые служат основой создания собственного гипертекста, лексикографической базы данных и прокладывания индивидуальных сетевых маршрутов.

Обозначим терминологическое пространство предлагаемой статьи. Безусловно, данный курс является логическим продолжением освоения переводчиками и языковедами современных информационных технологий. В языкознании под информационными технологиями подразумевается множество правил, методов и средств получения, хранения, передачи, распространения и преобразования «информации о языке и законах его функционирования с помощью компьютера и различного программного обеспечения» [3, с. 135].

Предмет «ПНТГТ» можно определить как обучение анализу информационных систем и освоение функциональных способов обработки гипертекста и лингвистического корпуса. Следует уточнить, что методическая концепция «ПНТГТ» основана на изучении и обработке материалов цифровых образовательных ресурсов посредством электронных систем перевода, а также на анализе, комментировании, реферировании и обобщении результатов научных исследований с использованием современных отечественных и зарубежных методик и методологий. Предметную область предлагаемой учебной дисциплины составляют сравнительный анализ и построение типологии научных гуманитарных текстов, обработка гипертекста на иностранном языке, работа с мультиязычной базой данных, разработка интерактивного тематического глоссария. Такие виды учебной деятельности, как творческие итоговые задания по поиску, анализу, отбору и синтезу данных, продиктованы современными требованиями к обработке и усвоению информации, что увеличивает мотивацию студентов магистратуры к овладению как предметом специальности, так и иностранным языком.

Необходимо уточнить, что в рамках «ПНТГТ» применяется специальная технология коллективной обработки гипертекста и корпуса текстов в режиме работы в аудитории, что позволяет смоделировать ситуацию работы группы лингвистов в агентствах перевода.

Сформулируем концептуальные подходы к решению обозначенных образовательных задач. Содержание и средства оценки «ПНТГТ» созданы с учетом требований методической документации ФГБОУ ВО РГГУ. Задача освоения первого блока «ПНТГТ» – обработка иностранного гипертекста научно-технической тематики. В предлагаемой статье мы понимаем термин «гипертекст» как «технологию хранения и обработки текстовых документов на естественном языке, которая позволяет устанавливать и поддерживать предопределенные связи между документами и/или отдельными их фрагментами, обеспечивая возможности навигации в такой структуре для перехода от одного ее компонента к другому» [4, с. 2].

Магистранты готовят итоговые проекты по «ПНТГТ» не только в виде презентаций. Кроме того, они моделируют проекты-сайты, которые позволяют разместить гипертекст, необходимый аудиовизуальный контент, ЛБД и другой объемный лингвистический материал, а также участвовать в научной полемике по заданной теме, корректно используя терминологию и сохраняя стилистику научного дискурса.

Организация объемных массивов информации в формате гипертекста не только делает их обозримыми и облегчает их использование, но и позволяет извлекать из них такие сведения, которые намеренно не закладываются при их моделировании. Продуктивность и эффективность этой системы зависит, в первую очередь, от тех возможностей, которые она предоставляет пользователю в поиске информации и доступе к ней. Анализируя гипертекст как формат, следует упомянуть определение информационного потока как множества текстов, выступающих как единый объект: адресатов интересует смысл, заключенный сразу в сотнях и даже тысячах текстов.

Главной характеристикой гипертекста является нелинейность, т.е. связность, структурированность и насыщенность разнородными связями, а также содержательная полнота, т.е. отражение всех мыслимых позиций и точек зрения на конкретную историко-научную проблему. Отметим, что такие когнитивные инструменты, как критический отбор, переработка и интерпретация информации, наиболее эффективны при обработке гипертекста и переводе текстовых корпусов.

В процессе освоения второго раздела «ПНТГТ» магистранты выполняют задания в последовательных либо параллельных режимах в специализированном ПО переводчика по блок-схемам, передаваемым в электронном виде, создают эссе-презентации, ЛБД, комментированные глоссарии, корпусы текстов по выбранным областям научного гуманитарного знания.

Понимание текста при чтении лингвистом является именно средством выполнения перевода, а не целью, потому что перед переводчиком стоит задача осознать и создать объективную трактовку полученных данных для «последующей передачи на языке перевода» [5, с. 48]. В образовательной дисциплине «ПНТГТ» этот вид деятельности является одним из методов объективизации знаний о технике чтения текста на языке оригинала, а также о способах и разновидностях перевода научных текстов, формирует навыки работы лингвиста с применением интерредактирования при чтении, а также позволяет определить возможную тематику выпускной квалификационной работы.

Работа по второму модулю курса проводится с применением корпуса текстов, понимаемого как лингвистический корпус текстов – объемный, представленный на электронном носителе информации, унифицированный, структурированный, размеченный массив языковых данных, предназначенный для решения конкретных лингвистических задач.

На базе лингвистического корпуса можно вычленить следующую информацию: частоту использования словоформ, лексем, грамматических категорий, изменения частот, изменения контекстов в различное время, поведение языковых единиц в текстах разных авторов, совместную встречаемость языковых единиц, особенности сочетаемости, управления и т. д. [2, с. 26-27]. 

Текстовый корпус, разработанный для проведения практических занятий по данной методике, включает 36 параллельных текстов на русском, английском, французском и немецком языках, охватывающих двенадцать периодов развития научных знаний человечества по историко-научной классификации – от доцивилизационного до первого десятилетия XXI века. Студенты обрабатывают текст с применением ИКТ, стандартного и специализированного переводческого ЛО и ПО.

Следует обозначить этапы работы и интерактивные задания по дисциплине «ПНТГТ»: 1. ознакомление с содержанием корпуса научных текстов гуманитарной тематики; 2. выбор научной дисциплины и исторического периода для переводческого чтения; 3. выбор текста для лингвистической обработки в процессе чтения; 4. аналитическое и дискурсивное чтение оригинала; 5. поисковое и выборочное чтение для создания терминологического глоссария; 6. детальное чтение и структурирование текста для перевода; 7. дискурсивное чтение для перевода текстов конкретного корпуса.

Основные учебные действия практического модуля, выполняемые студентами при освоении данного метода работы с научными текстами гуманитарной тематики с целью перевода, включают: 1. формулировку основной мысли; 2. вычленение терминов и понятий в процессе чтения оригинала; 3. разработку тематического глоссария; 4. определение в процессе чтения текстов корпуса терминов и понятий, используемых в выбранном тексте. Далее магистранты переходят к аналитическому чтению оригинала, которое включает: 5. определение ядерных предложений в процессе чтения без перевода; 6. составление компресс-текста; 7. определение ядерных предложений в процессе чтения текстов корпуса; 8. составление корпуса компресс-текстов.

В результате применения различных видов обработки текстов данного корпуса магистранты вырабатывают стратегию перевода с учетом экстралингвистических, языковых, социокультурных и дискурсивных знаний. В контексте «ПНТГТ» работа с гипертекстом и лингвистическим корпусом является одним из способов объективизации знаний о технике переводческого чтения, а также о видах и способах перевода научных текстов, формирует навыки работы переводчика с применением технологии интрерредактирования текста в процессе чтения оригинала, а также позволяет оптимизировать процесс проведения исследования по теме выпускной работы магистранта.

Таким образом, в процессе применения анализируемой методики работы с гипертекстом при переводе научных гуманитарных текстов формируются навыки работы с применением технологии интерредактирования, магистранты развивают профессиональные компетенции, необходимые для эффективной и соответствующей стандартам деятельности в области перевода специальных текстов с учетом производственной необходимости использования ИКТ в современных условиях.

Список литературы

  1. Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб. пособие. – М.: МИЭМ, 2011. – 272 с.
  2. Боярский К.К. Введение в компьютерную лингвистику. Учебное пособие. – СПб: НИУ ИТМО, 2013. – 72 с.
  3.  Гиляревский Р.С. Основы информатики. Курс лекций для студентов гуманитарных специальностей. – М.: Изд-во МГУ, 2012. – 285 с.
  4. Данилкин А.А., Самсонов А.В., Дмитриев А.С. Живой англо-русский словарь по вычислительной технике, информационным технологиям и связи. – М.: ВНИИПВТИ, 2009-2015. [Электронный ресурс] Режим доступа: http://www.morepc.ru/dict/ (дата обращения: 11.05.2020)
  5. Фоломкина С.К. Обучение чтению на иностранном языке в неязыковом ВУЗе. – М.: Высшая школа, 2005. – 207 с.

Интересная статья? Поделись ей с другими:

Внимание, откроется в новом окне. PDFПечатьE-mail