В статье автор анализирует функции Corpus of Contemporary American English и выделяет его основные преимущества, которые помогут преподавателям и обучающимся в изучении грамматики английского языка.
Ключевые слова: языковой корпус, грамматика, обучение.
В современном мире существует множество способов изучения и анализа языков, однако одним из наиболее эффективных методов является использование корпусов.
Одним из наиболее известных корпусов является COCA — это корпус текстов на английском языке, который содержит более 420 миллионов слов и был создан профессором корпусной лингвистики- Марком Дэвисом.
Материалы корпуса объединены в пять жанров: устный (oral), художественная литература (fiction), популярные журналы (popular magazines), газеты (newspapers) и научные журналы (scientific journals). Тексты взяты из четко определенных источников.
Устные тексты состоят в общем из 118 миллионов слов, которые были произнесены в 150 телевизионных передачах и вошли в транскрипты записанных передач. К ним относятся такие популярные шоу как Good Morning America (ABC), Today Show (NBC), 60 Minutes (CBS) и другие [3].
Художественные тексты содержат 113 миллионов слов. В данном разделе мы можем найти материалы из литературных и детских журналов, коротких рассказов и сценариев фильмов.
Тексты популярных журналов состоят из 118 миллионов слов и соответствуют текстам почти из 100 различных журналов (о здоровье, домоводстве, садоводстве, воспитании, спорте и многих других). Например, Time, Cosmopolitan, Fortune, Sports Illustrated.
В газетных текстах содержится 14 миллионов слов из таких источников как New York Times, San Francisco Chronicle и других.
Тексты для научных журналов состоят из 112 миллионов слов [4].
Основными преимуществами языковых корпусов являются:
— предоставление доступа к аутентичным данным;
— определение частотности употребления слов и грамматические конструкции, что может быть использовано для улучшения материалов на иностранном языке или для непосредственного обучения студентов;
— наблюдение, анализ и интерпретация корпусных данных самими обучающимися может способствовать развитию автономии, что также дает возможность развития их когнитивных навыков.
Одним из главных преимуществ использования COCA при обучении английскому языку является то, что он предоставляет информацию о частотности различных грамматических конструкций в английском языке. Например, на сайте можно узнать, какие формы глаголов, существительных и прилагательных наиболее часто используются в текстах. Также можно узнать о том, какие предлоги и союзы чаще всего используются в определенных контекстах [2].
Кроме того, использование ресурса COCA облегчает возможность определения части речи. Часть речи — важное понятие в грамматике, которое может помочь обучающимся научиться правильно использовать новые словарные слова. Более того, необходимо отметить, что некоторые слова могут выступать в качестве разных частей речи в зависимости от контекстного окружения. Благодаря тегам и удобным инструментам COCA, в корпусе можно найти примеры предложений с искомым словом, что может дать учащимся представление о том, как это слово сочетается грамматически с другими словами.
В английском языке лишь некоторые слова обладают явным маркером, который показывает принадлежность слова к той или иной части речи, например, worker (-er — суффикс существительного), wonderful (-ful суффикс прилагательного). Тем не менее, многие слова имеют схожую морфологическую структуру, могут переходить из одной речи в другую. Следовательно, определить принадлежность слова к конкретной части речи по морфологическому признаку становится крайне сложно. В таком случае анализируются синтаксические свойства слова и его место в структуре предложения.
В качестве примера рассмотрим «eyes». Мы можем предположить, что это существительным во множественном числе («глаза»), но данное слово может также являться и глаголом: Tom always eyes unknown people suspociously. В этом случаe мы можем определить принадлежность слова” eyes“ к глаголам (eyes — «смотрит», где флексия -s — свидетельствует о 3 лице единственном числе глагола) [1].
С помощью страницы KWIC / concordance мы можем просмотреть целый список примеров предложений с интересующим нас словом и при этом отследить, какой именно частью речи оно является.
Конкорданс — это перечень (как правило, алфавитный) всех случаев употребления искомого слова в языковом корпусе в виде контекстов, в которых представлены цепочки из нескольких слов, стоящих слева и справа от искомого слова.
Идентифицировать часть речи помогает цветовое выделение каждого компонента предложения:
noun — существительное (бирюзовый)
pronoun — местоимение (голубой)
proper noun — имя собственное (серый)
adjective — прилагательное (зелёный)
verb — глагол (розовый)
adverb — наречие (оранжевый)
preposition — предлог (жёлтый)
Возьмем, например, слово “trigger”. Чтобы выполнить относительно части речи данной лексической единицы, необходимо нажать кнопку KWIC с цветовой кодировкой в верхней части экрана, затем ввести слово “trigger” в поле запроса слова и перейти к поиску [1]. Поиск немедленно выдает все примеры предложений с ключевым словом “trigger”, которые выделены двумя разными цветами, чтобы обозначить часть речи, розовым для глагола и бирюзовым для существительного. Итак, мы видим, что “trigger” может использоваться как в качестве глагола, так и в качестве существительного.
Разнообразие функций ресурса Corpus of Contemporary American English позволяет не только изучить теоретический грамматический материал на более глубоком уровне, но и применять полученные знания на практике. В ходе работы с COCA обучающимся могут быть предложены следующие задания:
1) Выявите основные тенденции употребления падежных форм who/whom.
2) Проанализируйте частоту употребления perfect и non-perfect форм для следующих глаголов: to hear, to understand, to see, to feel.
3) Опишите принадлежность к той или иной части речи лексемы unlike. Проведите анализ частеречных статусов по корпусу, затем по грамматическим справочникам.
4) Проанализируйте частотность конкурирующих грамматических форм want vs. is wanting и have understood vs. understood.
5) Выделите возможные различия употребления глагола protect against и protect from.
6) Подготовьте анализ атрибутивного/предикативного употребления прилагательного unstrustworthy и приведите примеры.
Таким образом, мы можем сделать вывод, что использование COCA при обучении английскому языку имеет множество преимуществ, позволяет получить подробную информацию о структуре английского языка и определить наиболее эффективные способы использования грамматических конструкций для достижения различных коммуникативных целей.
Литература:
1. English-corpora: COCA
2. Research Gate “On the Application of Corpus of Contemporary American English in Vocabulary Instruction”- Canadian Center of Science and Education, 2014.
- Атабоев Н. В. “Structure of ‘COCA’ (Corpus of Contemporary American English) and simple queries on it”- Наука образование и культура,2019.
- Павлова О. Ю. «Использование языковых корпусов в обучении иностранному языку», 2021.