В статье исследуется проблема использования современных информационных технологий в учебном процессе. В качестве объектов изучения авторами были выбраны лингвистические корпусы: Британский национальный корпус и корпус современного американского английского языка. Анализ корпусных данных позволяет получать объективные статистические сведения о языке, которые помогают учащимся самостоятельно проверять особенности употребления и точное значение слов и грамматических форм.
Ключевые слова: корпус, корпусная лингвистика, контекст, конкорданс, коллокация.
Abstract. The article is devoted to the problem of using modern technologies in the educational process. The authors of the article have chosen linguistic corpuses as targets of research. They are British National Corpus and Corpus of Contemporary American English. Study corpus’ data allows obtaining objective statistical data about the language that helps the student to check the exact using and meaning of words and grammatical forms.
Keywords: corpus, corpus-based linguistics, context, concordance, collocation.
Осуществляемая в контексте компетентностного подхода модернизация высшего профессионального образования, предполагает обновление содержания образования, что в свою очередь, ставит задачу совершенствования учебно-методического обеспечения каждой учебной дисциплины, в частности, применения современных информационных технологий, новых форм проведения занятий, обеспечивающих формирование у студентов предусмотренных Федеральными государственными образовательными стандартами компетенций.
Решение названной задачи видится в использовании в реальном образовательном процессе вуза не только бумажных и электронных учебников и учебно-методических комплектов, а скорее, в создании учебного окружения, которое базируется на применении интерактивных технологий обучения; освоении стратегий и технологий установления связи изучаемого материала с проблемами повседневной жизни, развитии дистанционных форм образования.
Одним их условий создания такой обучающей среды является готовность преподавателя вуза к использованию современных технологий работы с учебными текстами и базами данных.
Например, при изучении филологических дисциплин такими базами данных являются лингвистические корпусы. В последнее время появилось достаточное количество научных статей, сообщающих о важности и необходимости использования корпусов в обучении, в частности, английскому языку [1, 2, 3, 4].
Вкратце основные их преимущества были изложены в учебном пособии В. П. Захарова «Корпусная лингвистика»:
1) большой (репрезентативный) объем корпуса гарантирует типичность данных и обеспечивает полноту представления всего спектра языковых явлений;
2) данные разного типа находятся в корпусе в своей естественной контекстной форме, что создает возможность их всестороннего и объективного изучения;
3) однажды созданный и подготовленный массив данных может использоваться многократно многими исследователями и в различных целях;
4) спрос на корпусные данные совпал с появлением соответствующих технических возможностей [1].
Существует множество корпусов английского языка, которые упоминаются в учебниках и на сайтах посвященных корпусам и корпусной лингвистике. Однако, проблема в том, что многие из сайтов платные, и доступ к ним затруднен.
Так, одним из наиболее известных корпусов английского языка, по образцу которого создавались многие другие, является Британский национальный корпус – British National Corpus (BNC) [5]. Объем корпуса составляет 100 млн. слов. Полный доступ к корпусу в режиме on-line отсутствует. В этом режиме доступны далеко не все возможности поискового интерфейса, поставляемого вместе с полной версией корпуса, выдача ограничивается 50 случайными примерами.
Есть и доступные корпуса с удобным поисковым интерфейсом. Одним из них является Corpus of Contemporary American English (COCA) [6]. Самый большой, сбалансированный корпус английского языка, имеющий в свободном доступе материалы объемом 450 миллионов словоупотреблений американского английского языка. Создателем этого корпуса является Марк Дэвис, который разработал также доступную версию корпуса BNC.
Проиллюстрируем возможности корпусов COCA и BNC на примере лексемы ring, поскольку она является одной из наиболее употребляемых в английском языке.
Сравним частотность употребления лексемы ring в разных регистрах. Таблица 1 включает в себя непосредственные подсчеты и нормированные подсчеты. Непосредственные подсчеты показывают количество случаев встречаемости слова в каждом регистре. Однако эти регистры включают различное количество слов. Поэтому сравнение непосредственных подсчетов нельзя использовать в качестве критерия для вывода о большей или меньшей частотности слова в одном регистре по сравнению с другим. Достоверные основания для сравнения по регистрам обеспечивают нормированные подсчеты, которые преобразуют количество случаев встречаемости слова по стандартной шкале, обычно в пересчете на 1 млн. словоупотреблений.
Таблица 1.
Частотность лексемы RING в определенных регистрах
Регистр |
BRITISH NATIONAL CORPUS (BNC) |
THE CORPUS OF CONTEMPORARY AMERICAN ENGLISH (COCA) |
||||
Примерное количество слов в регистре |
Непосредственные подсчеты для ring (количество слов) |
Нормированные подсчеты (количество случаев встречаемости на 1 млн. словоупотреблений) |
Примерное количество слов в регистре |
Непосредственные подсчеты для ring (количество слов) |
Нормированные подсчеты (количество случаев встречаемости на 1 млн. словоупотреблений) |
|
Разговорная речь |
9.963.663 |
1558 |
156,37 |
95,577,943 |
2989 |
31.27 |
Художественная литература |
15.909.312 |
1920 |
120,68 |
90,429,400 |
8349 |
92.33 |
Журналы |
7.261.990 |
515 |
70,92 |
95,558,725 |
5138 |
53.77 |
Газеты |
10.466.422 |
694 |
66,31 |
91,713,978 |
3592 |
39.17 |
Научно-популярная литература |
16.495.185 |
634 |
38,44 |
|
|
|
Научная литература |
15.331.668 |
301 |
19,63 |
91,066,191 |
1684 |
18.49 |
Разное |
20.835.159 |
1072 |
51,45 |
|
|
|
Как видно из таблицы 1, наибольшей является частотность слова ring в BNC разговорной речи, а в COCA – в художественной литературе.
Лексема ring образует большое количество сочетаний. Для каждой коллокации (collocation) существует сильная тенденция ассоциироваться с одним смыслом или значением. Поэтому выделяя наиболее частые коллокации слова, можно проанализировать его значения.
В таблице 2 приведены коллокаты из 100-словного списка для слова ring в BNC в таких регистрах, как научная и художественная литература.
Таблица 2.
Частые коллокаты ring в двух регистрах корпуса BNC
Научная литература |
Художественная литература |
||
Левые коллокаты |
|||
inner |
13 |
‘ll |
99 |
wedding |
11 |
wedding |
52 |
outer |
8 |
engagement |
19 |
gold |
7 |
gold |
19 |
Правые коллокаты |
|||
road |
3 |
me |
55 |
laser |
3 |
him |
46 |
electrodes |
3 |
back |
26 |
round |
3 |
round |
16 |
Из данных, представленных в таблице, следует, что слово inner является наиболее частым левым коллокатом для ringв научной литературе, а me – частым правым коллокатом в художественной литературе.
Корпусы позволяют исследовать значения слов путем использования конкордансов. Анализ смысла слова можно исследовать, просмотрев списки конкордансов, которые показывают данные словосочетания.
В корпусах COCA и BNC информация о лексеме и ее коллокатах представлена следующим образом: по каждому регистру указывается source information – источник информации, включающий дату, а также expanded context – расширенный контекст.
Например, в BNC для коллокатов ringв художественной литературе можно отметить интересные сходства и различия со словосочетаниями в научной литературе. Так, совместное употребление wedding ring (явно в значении – обручальное кольцо) и gold ring (в значении – золотое кольцо) очень похоже в двух регистрах. Однако коллокация ring round является примером того, как пара сочетающихся слов может ассоциироваться с разными смыслами в разных регистрах: в художественной литературе пара ring round используется в значении глагола «окружать», а в научной литературе – в значении словосочетания по схеме «имя существительное с предлогом» «кольцо вокруг».
В целом COCA и BNC, сформированные на основе разнообразных источников, обладают огромными возможностями для использования в процессе обучения, позволяют увидеть многообразие употребления слов в различных вариантах английского языка, причем в самых различных областях человеческой жизни.
Литература:
1. Захаров В. П. Корпусная лингвистика: Учебно-метод. пособие. – СПб.: СПбГУ, 2005. – 48 с.
2. Перезенцева Ю.С., Атрощенко С.А. В ожидании «другой» лингвистики: идея национального корпуса и «революция» в языкознании // Приволжский научный вестник. – 2013. – № 12-1 (28). – С. 106-111.
3. Перевезенцева Ю.С., Атрощенко С.А. Бинарная терминология математики: структурно-семантический анализ // Мир науки, культуры, образования. – 2014. – № 5. – С. 122-124.
4. Перевезенцева Ю.С., Атрощенко С.А. Подготовка профессионального специалиста в контексте компетентностного подхода // Международный научно-исследовательский журнал. – 2014. – № 9-2 (28). – С. 109-111.
5. British National Corpus [Электронный ресурс]. URL: http:// http://www.natcorp.ox.ac.uk/ (дата обращения: 07.11.2014).
6. Corpus of Contemporary American English [Электронный ресурс]. URL: http://corpus.byu.edu/coca/ (дата обращения: 07.11.2014).