MS Word 2016 и фразеологические обороты
Автор: Лавошникова Элина Константиновна
Рубрика: Общее и прикладное языкознание
Опубликовано в Филология и лингвистика №1 (5) январь 2017 г.
Дата публикации: 27.12.2016
Статья просмотрена: 207 раз
Библиографическое описание:
Лавошникова, Э. К. MS Word 2016 и фразеологические обороты / Э. К. Лавошникова. — Текст : непосредственный // Филология и лингвистика. — 2017. — № 1 (5). — С. 52-54. — URL: https://moluch.ru/th/6/archive/45/1833/ (дата обращения: 16.11.2024).
Рассматривается проблематика компьютерных систем проверки правописания на примере текстового редактора Microsoft Word. Разбирается работа автокорректора (спеллера) с фразеологией и синтаксическими ошибками согласования и управления в текстах, написанных на русском языке. Предлагается дополнять текстовый редактор списками словосочетаний и фразеологизмов с наиболее «популярными» ошибками пользователей, не выявляемыми системой, и информацией об их правильном написании — для выдачи рекомендаций по исправлению замеченных в тексте ошибок и опечаток.
Ключевые слова: Microsoft Word, спеллер, компьютерная проверка правописания, фразеология, фразеологический оборот, синтаксис русского языка, идиома, синтагма
При компьютерной проверке правописания в текстовом редакторе MS Word автокорректор красной волнистой линией подчеркивает слова (или части слов при написании через дефис), отсутствующие или не порождаемые в Word’овских внутренних системных словарях. Синей волнистой линией система Word 2016, как и Word 2013, подчеркивает в текстах пользователя предполагаемые синтаксические огрехи — ошибки в согласовании и сочетаемости слов во фразе. В более ранних версиях Word’а, разработанных на основе системы «Орфо», такие фрагменты текста подчеркивались зеленым. Подчеркиваемые системой Word 2016 слова и словосочетания (синей или красной волнистой чертой) мы в наших примерах тоже будем ПОДЧЕРКИВАТЬ.
Фразеологизмы (устойчивые обороты речи) требуют особого подхода, так как в них нередко входят устаревшие слова и формы, которые в других контекстах уже не употребляются. Работа текстового редактора MS Word с фразеологическими оборотами не всегда бывает удовлетворительной. Приведем примеры. Автокорректор подчеркивает красным (как ненайденное) второе слово в конструкции ничтоже сумняшеся (слово ничтоже, однако, не подчеркивается). Из фразеологизмов «с лихвой», «аки тать в нощи» Ворд производит словоформы, которые в современных текстах практически не встречаются: лихва, лихву, лихвам, а также нощь, нощью и т. д. Подобные словоформы иногда можно увидеть в рекомендациях Word’овской программы-подсказки.
Имея более полный внутренний системный словарь фразеологизмов, автокорректор мог бы предупреждать ошибки в идиоматических выражениях (например, для ошибочного «скрипя сердце» системная программа-подсказка могла бы предлагать скрепя сердце). Спеллер можно было бы настроить так, чтобы он (к примеру) пропускал без подчеркивания словосочетание «друг сердешный» и выдавал бы в своей «подсказке» замену сердечный только в случае другого контекста, не предлагал бы для фразеологизма «вынь да положь» нормативную форму повелительного наклонения положи. Еще пример устойчивого выражения с вордовским подчеркиванием красной волнистой линией: Врачу, исцелися сам!
По поводу фразеологических оборотов можно привести цитату из статьи А. Е. Азимова и Елены Игоревны Большаковой: «Большая часть допустимых словосочетаний относится к нестандартной (идиоматической) сочетаемости, т. е. при изменении в таком словосочетании одного слова на другое, с близким или тем же смыслом, получается сочетание, в этом языке практически не употребляемое. Поэтому для каждого ЕЯ [естественного языка. — Э.Л.] лексическая сочетаемость определяется не правилами, а фиксируется специальными словарями устойчивых словосочетаний <...>, которые в то же время не могут охватить все допустимые словосочетания из-за их большого числа» [1, с. 78].
В книге, состоящей ровно из 256 страниц (сакральное число для программистов), Ирина Спира сетует: «Традиционная проверка правописания была реализована в Microsoft Word на высоком уровне. Программа замечала не только орфографические ошибки, но и “чувствовала” весьма тонкие грамматические и стилистические нюансы, решала даже непростые пунктуационные задачи. Но в Microsoft Word 2013 качество проверки правописания русского текста заметно ухудшилось» [8, с. 59].
В качестве иллюстрации приведем пример. В некоторых предыдущих версиях Word’а (основанных на системе ОРФО) подсказка выдавала рекомендацию по нормативному слитному написанию слова невтерпёж. Но текстовый редактор Word 2013 (а также и Word 2016) последовательность с пробелами «не в терпеж», иногда встречающуюся в текстах пользователей Интернета, уже не предлагает склеивать.
Справедливости ради следует заметить, что многие огрехи, которые мы и другие пользователи Интернета отмечали, в системе Word 2013 уже были устранены, но к синтаксическому анализу в этом текстовом редакторе по-прежнему остается много вопросов.
Приведем примеры фраз с необоснованным синим подчеркиванием.
Этот парень не чета тебе. (Word’овская программа-подсказка предлагает слитное написание «нечета», т. е. форму слова нечет.) Тогда под маркой спасения общего дела его уволили. (Предлагается «исправление»: «под маркие спасения»).
Если верить текстовому редактору Word 2016, то можно решить, что всегда до и после слова «например» следует ставить запятую.
Программа-подсказка Word’овского спеллера иногда требует запятую перед «как» вопреки правилам русской грамматики. Пример: Как же это исправить? Не знаю как. Во второй фразе — синее подчеркивание. Согласно правилам пунктуации, однако, не ставится запятая между главным и следующим за ним придаточным предложением, «если придаточная часть состоит из одного союзного слова» [6, с. 141].
Далее продолжим приводить примеры «гипердиагностики» этого текстового редактора. Итак. Начинаем. Word 2016 хочет видеть запятую даже в конце предложения «или перед ним», как говорится в подсказке (т. е. перед фразой «Итак».) Всё шло само собой. Как слышно меня? Он уклоняется от критики по существу. Нечего сказать людям? В этих фразах система видит «вводные слова» (но они бывают вводными в других контекстах) и после каждого своего синего подчеркивания предлагает запятую.
Еще примеры «гипердиагностики». Знаешь что, давай уйдем отсюда. Они не будут говорить что попало. Черт знает что! Он иногда бывает как бы не в себе. В этих фразах Ворд-2016 предлагает запятую «перед подчиненным предложением» (даже перед «что» в первом примере). Его могли бы и не приглашать, если на то пошло. Для этой фразы подсказка Word’а предлагает запятую даже после «на» — «перед союзом». Все в этом участвовали, и стар и млад. (Вордовская подсказка опять выдает: «Пропущена запятая перед союзом».)
Далее приводятся специально сконструированные предложения с ошибками и опечатками (в том числе с разбиениями или склеиваниями слов), помеченные астериском (звездочкой). В этих фразах текстовый редактор Ворд-2016 либо не видит огрехов, либо считает ошибочным правильное написание.
*Я спокоен зазрение своего ребенка, что за страсти-мордасти! Подчеркнуто (красным) только «мордасти», хотя здесь допущено ошибочное склеивание предлога со словом. К словарному слову зазрение в весьма представительном академическом словаре [7] дается фразеологизм «без зазрения совести», но Word 2016, как и предыдущие версии автокорректора, в своих системных словарях порождает все падежи этого слова и даже множественное число (например, форму зазрений).
*Занимайте места согласно купленных билетов. Замечаний у Word’а к этой фразе с ошибками в стереотипном фразеологическом обороте нет.
*Он в течении всей недели вставал до статочно рано, ни свет ни заря. Подсказка предлагает запятую перед вторым «ни». В начале фразы допущена очень «популярная» ошибка. Можно было бы в подсказке указать, что такое написание правомерно только в контекстах наподобие «в течении реки». К прилагательному статочный в словаре [7] приведен фразеологизм «статочное ли дело?», однако Ворд содержит его полную парадигму, даже краткие формы им не подчеркиваются.
*Они шли путем из варяг в греки со всеми до спехами, стараясь не от кого ни от ставать. Word’овская программа-подсказка предлагает для исправления единственного в этом предложении подчеркнутого фрагмента словосочетание «из варяга». Для фразеологизма «не к спеху» Ворд порождает всю парадигму (спех, спеха и т. д.). Синтаксический анализ текстового редактора не обнаружил неправильного употребления «не» и «ни». Нет замечаний по поводу нахождения предлога («от») перед глаголом ставать. Кроме того, этот устаревший глагол (см. помету в словаре [7]) нежелательно иметь в системном словаре автокорректора, поскольку наличие всей его парадигмы (стающий и т. п.) только мешает выявлению опечаток в современных текстах.
Подобные фразы с ошибками и опечатками могут быть использованы при тестировании последующих версий Word’а. Другие примеры некорректных фраз и синтагм (словосочетаний) со специально подобранными ошибками согласования, управления и примыкания для проверки работы автокорректоров приведены в наших статьях [4, 5]. В этих и других работах (см., например, статью [3]) мы также писали о перегруженности внутренних системных словарей автокорректоров низкочастотной и устаревшей лексикой и демонстрировали на многочисленных примерах, как это затрудняет выявление ошибок и опечаток в современных текстах.
Приведем еще характерные примеры. Ни пуха ни пера! Получаем синее подчеркивание, хотя в этом фразеологизме не должно быть запятой. *Нет ни пуха ни пера в этой подушке. А в этом (достаточно искусственном) контексте запятая нужна, здесь спеллер прав. Но Ворд-2016 предлагает включать запятую и в другие подобные фразеологические обороты. Приведем примеры. Он мне ни сват ни брат. У него ни кола ни двора. И те и другие ничего не знают.
Разумеется, нормы правописания могут меняться. Приведем цитату из статьи Майи Владимировны Всеволодовой: «Так, в соответствии с нормой предлог по в значении ‘после’ управляет предложным падежом. <…> В настоящее время не только все студенты-москвичи, но и ведущие наших телепрограмм, журналисты системно употребляют с экрана и в печати словоформы по приезду, по прилёту (президента), по приходу (поезда), хотя никто пока старой нормы не отменял» [2, с. 31].
До 1956 г. синтагма «на ощупь» писалась слитно, теперь — раздельно (см. словарь [7]). При этом Ворд-2016 пропускает без подчеркивания оба варианта написания.
В словаре Ушакова (1935 г.) были даны в слитном написании выражения «без удержу», «без умолку», «без устали», «в охотку», «в пику», «в розницу», «в тиши» [9]. При этом текстовый редактор Word содержит в своем системном словаре такие искусственно порожденные словоформы, как «умолков», «усталям», «охотками» и т. п. Наречие вовсю и вводное «должно быть» в словаре Ушакова даны в написании через дефис, но эти нормы устарели. Однако ненормативное «должно-быть» Word 2016 пропускает без подчеркивания, как и многие ошибочные дефисные образования.
Мы предлагаем дополнять компьютерные системные словари списками наиболее вероятных и часто встречающихся искажений словосочетаний с их исправленными вариантами. Конечно, для первых компонентов некоторых из этих пар иногда можно придумать фразы, в которых они грамматически обоснованы. Но это будут маловероятные примеры.
Список для выдачи программой-подсказкой рекомендованных исправлений мог бы состоять из пар наподобие следующих:
{*в драбадан — вдрабадан} (оба варианта подчеркиваются красным как отсутствующие в системных словарях Word’а, слитное написание дано в словаре [7]),
{*в родные пенаты — к родным пенатам } (в древнеримской мифологии ‘боги-хранители и покровители домашнего очага’),
{*до упада — до упаду},
{*зав. лаборатории — зав. лабораторией},
{*извека в век — из века в век} (вордовского подчеркивания нет; в словаре [7] имеются наречие извека и выражение «из века в век», при этом левый вариант написания был включен в словарь Ушакова [9]),
{*мало по малу — мало-помалу},
{*не взирая на — невзирая на},
{*никто иной, как — не кто иной, как},
{*по завершению — по завершении} (хотя можно придумать с натяжкой пример фразы, в которой первый вариант тоже вполне нормативен: «По завершению этого спектакля можно судить о замысле его автора»),
{*по здравому размышлению — по здравом размышлении},
{*при том, что — притом что} (пишется с предлогом слитно, без запятой — вопреки синему подчеркиванию и рекомендации текстового редактора Word 2016, см. словарь [7]),
{*черти-что — черт-те что}.
Списки с другими некорректными словосочетаниями и их исправлениями, которые тоже могли бы быть использованы при обновлении автокорректоров, приведены в статьях [4, с. 77] и [5, с. 379].
Очевидно, что множество самых частотных примеров ненормативного написания словосочетаний — даже с их вариациями (по падежам и т. п.) — не бесконечно, а вполне обозримо. Перечни «популярных» в текстах пользователей Интернета ошибочных фрагментов с их исправленным написанием, подобные приведенному выше, должны способствовать более эффективной работе текстового редактора при компьютерной проверке правильности написания фразеологизмов и других словосочетаний.
Литература:
- Азимов А. Е., Большакова Е. И. Подход к автоматической коррекции ошибок сочетаемости слов в текстах на естественном языке // Новые информационные технологии в автоматизированных системах. — 2011. — № 14. — С. 78–91.
- Всеволодова М. В. Система морфосинтаксических типов русских предлогов // Вестник Московского ун-та. Серия 9: Филология. — 2012. — № 5. — С. 30–78.
- Лавошникова Э. К. Microsoft Word и причины пропуска ошибок // Современные информационные технологии и ИТ-образование. — 2015. — Т. 1, № 11. — С. 471–476.
- Лавошникова Э. К. MS Word и синтаксические ошибки // Актуальные проблемы гуманитарных и естественных наук. — 2016. — № 8 (91). — С. 74–77.
- Лавошникова Э. К. Word: О компьютерной проверке синтаксических конструкций // Science Time. — 2016. — № 5 (29). — С. 374–380.
- Розенталь Д. Э. Справочник по русскому языку. Пунктуация. — М.: Издательский дом «ОНИКС 21 век», 2003. — 264 с.
- Русский орфографический словарь: ок. 200 000 слов / Под ред. В. В. Лопатина, О. Е. Ивановой. — Изд. 4-е, испр. и доп. — М.: АСТ-ПРЕСС КНИГА, 2015. — 896 с.
- Спира И. Microsoft Excel и Word 2013: Учиться никогда не поздно. — СПб: Питер, 2014. — 256 с.
- Толковый словарь русского языка (под ред. Д. Н. Ушакова). — в 4-х томах, т. 1. — М., 1935.
Ключевые слова
фразеология, идиома, спеллер, Microsoft Word, компьютерная проверка правописания, фразеологический оборот, синтаксис русского языка, синтагмаПохожие статьи
MS Word: Тестирование проверщика правописания и причины пропуска ошибок
Рассматривается проблематика компьютерных систем проверки правописания. Работа автокорректоров разбирается на примере текстового редактора MICROSOFT WORD (версии 2013 и 2003 гг.). На конкретных примерах показано, что перегруженность системных словаре...
Анализ качества машинного перевода системами Google Translate и Яндекс.Переводчик (на материале отрывка из научно-популярного издания по медицине)
В рамках данного исследования был проведён анализ ошибочно переведённых фрагментов машинного перевода на материале отрывка из научно-популярного издания о деменции. Мы выделили массив ошибок, допущенных системами Google Translate и Яндекс.Переводчик,...
Представление и организация учебного материала в грамматических пособиях зарубежных и отечественных авторов (на примере «Практической грамматики английского языка» и «MyGrammarLab»)
Грамматика занимает важную роль при обучении иностранному языку, так как способствует грамотному изъяснению на изучаемом языке. Также обучение грамматике формирует продуктивные умения в устной и письменной речи, облегчает понимание иноязычной речи на...
«Умные» технологии запоминания слов на уроках английского языка
В данной статье рассмотрены и проанализированы особенности современных технологий для заучивания английской лексики, предложены нетрадиционные способы запоминания слов в методике иностранного языка.
Разработка вопросно-ответной системы с использованием машинного обучения
Обоснована задача создания автоматизированной вопросно-ответной системы. Рассмотрены возможные подходы к решению задачи: метод векторного представления слов и метод синтаксических деревьев. Исследованы технологии word2vec, NLTK, pymorphy2, использова...
Эффективные приёмы обучения иностранным языкам (английский язык, на примере Word Search Grid)
В настоящей работе рассматривается проблема выбора приёмов обучения иностранным языкам. Автором представлен конкретный пример одного из эффективных приёмов обучения английскому языку — «поиск слова в решётке» (Word Search Grid), который не утратил ак...
Разработка комплексной нейросетевой модели по оценке уровня дизайна веб-страниц
Проведен систематический анализ применения нейросетевых алгоритмов при оценке дизайна веб-страниц. Показана возможность определения параметров функциональности и эстетической ценности элементов веб-дизайна при использовании нейросетевых алгоритмов тр...
Стереотипы ошибок правописания и текстовые редакторы MS Word
Обсуждается проблематика компьютерной проверки правописания и психологические причины возникновения неслучайных орфографических ошибок. Даются многочисленные примеры «популярных» искажений слов, встречающихся не только у детей, но даже у достаточно о...
Анализ тональности высказываний в Twitter
В данной работе рассматривается применение методов машинного обучения с учителем к анализу тональности русскоязычных высказываний в социальной сети Twitter. Подробно разбираются методы предварительной обработки текста, описываются способы анализа тон...
Упрощение текстов через чат GPT при обучении иностранным языкам
Данная статья рассматривает применение чата GPT для упрощения текстов в контексте обучения иностранному языку. Цель статьи — исследование процесса упрощения сложных текстов с помощью чата GPT Prompt Perfect версии 3.5, который делает их более доступн...
Похожие статьи
MS Word: Тестирование проверщика правописания и причины пропуска ошибок
Рассматривается проблематика компьютерных систем проверки правописания. Работа автокорректоров разбирается на примере текстового редактора MICROSOFT WORD (версии 2013 и 2003 гг.). На конкретных примерах показано, что перегруженность системных словаре...
Анализ качества машинного перевода системами Google Translate и Яндекс.Переводчик (на материале отрывка из научно-популярного издания по медицине)
В рамках данного исследования был проведён анализ ошибочно переведённых фрагментов машинного перевода на материале отрывка из научно-популярного издания о деменции. Мы выделили массив ошибок, допущенных системами Google Translate и Яндекс.Переводчик,...
Представление и организация учебного материала в грамматических пособиях зарубежных и отечественных авторов (на примере «Практической грамматики английского языка» и «MyGrammarLab»)
Грамматика занимает важную роль при обучении иностранному языку, так как способствует грамотному изъяснению на изучаемом языке. Также обучение грамматике формирует продуктивные умения в устной и письменной речи, облегчает понимание иноязычной речи на...
«Умные» технологии запоминания слов на уроках английского языка
В данной статье рассмотрены и проанализированы особенности современных технологий для заучивания английской лексики, предложены нетрадиционные способы запоминания слов в методике иностранного языка.
Разработка вопросно-ответной системы с использованием машинного обучения
Обоснована задача создания автоматизированной вопросно-ответной системы. Рассмотрены возможные подходы к решению задачи: метод векторного представления слов и метод синтаксических деревьев. Исследованы технологии word2vec, NLTK, pymorphy2, использова...
Эффективные приёмы обучения иностранным языкам (английский язык, на примере Word Search Grid)
В настоящей работе рассматривается проблема выбора приёмов обучения иностранным языкам. Автором представлен конкретный пример одного из эффективных приёмов обучения английскому языку — «поиск слова в решётке» (Word Search Grid), который не утратил ак...
Разработка комплексной нейросетевой модели по оценке уровня дизайна веб-страниц
Проведен систематический анализ применения нейросетевых алгоритмов при оценке дизайна веб-страниц. Показана возможность определения параметров функциональности и эстетической ценности элементов веб-дизайна при использовании нейросетевых алгоритмов тр...
Стереотипы ошибок правописания и текстовые редакторы MS Word
Обсуждается проблематика компьютерной проверки правописания и психологические причины возникновения неслучайных орфографических ошибок. Даются многочисленные примеры «популярных» искажений слов, встречающихся не только у детей, но даже у достаточно о...
Анализ тональности высказываний в Twitter
В данной работе рассматривается применение методов машинного обучения с учителем к анализу тональности русскоязычных высказываний в социальной сети Twitter. Подробно разбираются методы предварительной обработки текста, описываются способы анализа тон...
Упрощение текстов через чат GPT при обучении иностранным языкам
Данная статья рассматривает применение чата GPT для упрощения текстов в контексте обучения иностранному языку. Цель статьи — исследование процесса упрощения сложных текстов с помощью чата GPT Prompt Perfect версии 3.5, который делает их более доступн...