Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Реферат'
Манихейство – синкретическая дуалистическая религия, созданная в III в. нашей эры на территории Сасанидской империи. Манихейство несет в себе элемент...полностью>>
'Литература'
Русская литература XIX века отмечена феноменальным явлением: творчество целого ряда крупных писателей, таких, как Н. А. Некрасов, А. И. Герцен, М. Е....полностью>>
'Реферат'
Мерами красоты у японцев служат четыре понятия, три из которых (саби, ваби, сибуй) уходят корнями в древнюю религию синто, а четвертое (югэн) навеяно...полностью>>
'Автореферат'
Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Пермская государственная медицинская академия им...полностью>>

Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии

Главная > Лекция
Сохрани ссылку в одной из сетей:

1

Смотреть полностью

Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии.

Прикладная лингвистика — направление в языкознании, занима­ющееся разработкой методов решения практических задач, свя­занных с использованием языка.

Прикладные сферы языкознания издавна отличались широким разнообразием. Наиболее древние из них — письмо (графика), методика обучения родному и неродному языкам, лексикография. В дальнейшем появились перевод, дешифровка, орфография, терминоведение. Одно из традиционных направлений приклад­ной лингвистики связано с участием в языковой политике госу­дарства и формируется как языковая политика и языковое строи­тельство. Одновременно с развитием и совершенствованием классических областей прикладного языкознания во второй поло­вине XX в. наметился и определился ряд новых его направлений, которые представляют собой логическое продолжение историче­ского развития прикладной лингвистики на новом этапе, обусловленном современной научно-технической революцией, укреплением взаимосвязи общественных, естественных и техни­ческих наук. К этим направлениям относятся: обработка инфор­мации, моделирование знаний, автоматическая обработка языка в его письменной и устной формах.

Методы прикладной лингвистики. Разнообразие методов прикладной лингвистики вполне сопоставимо с разнообразием конкретных областей приложения научных знаний о языке: каждая конкретная прикладная дисциплина обладает своим уникальным набором методов. Тем не менее можно выделить нечто общее, характерное для методов прикладной лингвистики в целом. Эта общая часть хорошо видна при сравнении методических инструментариев описательной, теоретической и прикладной лингвистики.

Перед описательной лингвистикой стоит задача описания фактов языка. На первом плане при этом находится метод классификации, т.е. выявления той сетки параметров, которая позволяет охватить все существенные свойства языковых структур. Теоретическая лингвистика формирует само представление о том, какие свойства языка являются существенными, а какие – нет. Создаваемые в теоретической лингвистике концептуальные модели языка не просто описывают наблюдаемые факты, но и претендуют на их объяснение. При этом как описательная, так и теоретическая лингвистика исходят из познавательной установки, известной как «God"s Truth» («Божественная Истина»). Иными словами, классификации языковых фактов и концептуальные модели теоретической лингвистики претендуют на описание того, как действительно устроен язык.

Прикладная лингвистика также использует и метод классификации, и метод моделирования. Однако поскольку задачи прикладной лингвистики сосредоточены в области оптимизации функций языка, а оптимизация определяется конкретной задачей, то в прикладной лингвистике широкое распространение имеет познавательная установка, известная под несколько ироническим названием «Фокус-покус» (более уважительное название – «инженерный подход»). Эта установка в качестве основной ценности выдвигает не познание того, «как все обстоит на самом деле», а решение конкретной задачи, в частном случае – удовлетворение требований «заказчика», преследующего свои собственные цели. Это, впрочем, не означает, что результаты прикладных исследований не представляют никакой ценности для теории языка: напротив, прикладные модели оказывают значительное влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания.

В силу сказанного важнейшим общим свойством методов прикладной лингвистики является ориентация на создание такой модели данной проблемной области, которая отображает только те ее свойства, которые необходимы для решения конкретной практической задачи. Иными словами, если теоретическое исследование в идеале стремится к полному описанию проблемной области со всеми ее сложностями и т.п., то прикладное описание обязано удовлетворять только данной конкретной задаче. Оно, конечно, может обладать и большей, чем это необходимо для решения конкретной прикладной задачи, описательной адекватностью и объяснительной силой, но принципиально этого от него не требуется.

Суммируя основные частные отличия прикладных моделей от теоретических и описательных, можно сказать, что прикладные модели в целом ориентированы на конкретные подъязыки, а не весь язык в целом; они часто (но не всегда) требуют большей степени формализации; прикладные модели используют знания о языке выборочно; прикладные модели не делают различий между собственно лингвистическими и экстралингвистическими аспектами семантики языковых выражений; прикладные модели в существенно большей степени огрубляют моделируемый объект, чем теоретические модели и, наконец, прикладные модели не налагают никаких существенных ограничений на инструмент моделирования.

Термин «квантитативная лингвистика» характеризует междисциплинарное направление в прикладных исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Иногда квантитативная (или количественная) лингвистика противопоставляется комбинаторной лингвистике. В последней доминирующую роль занимает «неколичественный» математический аппарат – теория множеств, математическая логика, теория алгоритмов и т.д. С теоретической точки зрения, использование статистических методов в языкознании позволяет дополнить структурную модель языка вероятностным компонентом, т.е. создать структурно-вероятностную модель, обладающую значительным объяснительным потенциалом. Эту сторону использования количественных методов следует считать приложением статистики в языкознании. Иными словами, задача построения структурно-вероятностной модели функционирования языка относится к теоретическим проблемам лингвистики и входит в компетенцию теории языка. В прикладной же области квантитативная лингвистика представлена прежде всего фрагментами этой модели, используемыми для лингвистического мониторинга функционирования языка, дешифровки кодированного текста, авторизации/атрибуции текста и т.п.

Языковая политика

Языковая политика— совокупность общефилософских и част-нонаучных принципов и практических мероприятий по решению языко­вых проблем в социуме, государстве.

Реформы русского письма. В данном параграфе необходимо расска­зать о реформах русского письма как одного из фрагментов отноше­ния общества к языку; коллективном выборе языка и соотношении языка и власти с точки зрения Л.Р. Зиндера. Развитие русского письма, его орфографии было постепенным. Его история знала две реформы: петровскую реформу азбуки (1708—1710) и реформу ор­фографии 1917—1918 гг. Петр I вместо церковной кириллицы, ис­ключив из нее некоторые буквы, ввел новый гражданский шрифт, установил начертательное различие строчных и прописных букв (до этого использовались только прописные буквы), отменил обяза­тельность постановки знаков ударения в каждом слове, что строго соблюдалось в печатных текстах. Вторую реформу провело Совет­ское правительство, хотя готовилась она в рамках Академии наук с начала XX в. 23 декабря 1917 г. Народный комиссариат просвеще­ния издал декрет о введении нового правописания. 10 октября 1918 г. Советом народных комиссаров был издан специальный дек­рет, подтвердивший декрет Народного комиссариата просвещения. Советская реформа была вызвана необходимостью расширить сфе­ру применения новой орфографии, утвердить ее во всей советской печати. Реформа изъяла ставшие совершенно чуждыми духу русско­го языка церковно-славянские окончания -аго, -яго у прилагатель­ных, причастий и местоимений (доброго, пятого, которого, синяго и т.п.), заменив их русскими окончаниями -ого, -его (доброго, пято­го, которого, синего). Было устранено разграничение форм одни они, с одной стороны, и однђ, онђ) — с другой (первые употреблялись для слов мужского и среднего рода, вторые — для слов женского ро­да). Формы одни, они теперь предназначались для всех трех родов. Реформа изменила также написание окончаний прилагательных, причастий и местоимений женского и среднего рода в именитель­ном и винительном падежах множественного числа, которые писа­лись с окончаниями -ыя, -ия (большыя старыя липы). Была изъята форма ея (ея сестра) и оставлена только форма её (её сестра). Лик­видировалась буква ђ («ять») и другие дублетные буквы, еще оста­вавшиеся в алфавите, и т.д.

Реформа 1917—1918 гг. была первой и пока единственной ре­формой русской орфографии (петровская реформировала только азбуку).

В 1956 г. было проведено упорядочение орфографии. Это не было реформой правописания, поскольку не затронуло его основ, но уни­фикация колеблющихся написаний коснулась всех его разделов.

Кроме названных реформ и упорядочения 1956 г. были еще два не проведенных в жизнь проекта реформ, подготовленных: 1) Сектором науки Наркомпроса РСФСР в 1930 г.; 2) Комиссией по усовершенст­вованию русской орфографии при Институте русского языка АН СССР и Отделении литературы и языка АН СССР в 1964 г.

Первый из этих проектов, декларировавший равнение на малогра­мотных и неграмотных, узаконивавший малограмотные написания был отвергнут как научно не обоснованный.

Подготовка проекта 1964 г., длившаяся два года, сопровождалась большой и чрезвычайно интенсивной исследовательской работой. Научная его платформа отражала одно из направлений в теории ор­фографии (построенное на концепции Московской фонологической школы). Однако к обсуждению проекта не была подготовлена обще­ственность, что показала развернувшаяся дискуссия. Особенно ост­рой критике проект был подвергнут на страницах «Литературной га­зеты». При этом больше всего возражений вызвали первые четыре его пункта: изъять из алфавита ъ, заменив его на ь: съезд, объявление и т.п.; отменить употребление ь в грамматической функции: ноч, доч, береч, не плач и т.п.; писать огурци, циган и т.п.; писать по произноше­нию чорный, жоны, смягчонный, течот и т.п. В результате реформа была отложена.

Совершенствование русской орфографии продолжается непре­рывно, хотя и не в рамках реформы. Большая роль в упорядочении правописания принадлежит словарям. Новые правописные тенден­ции отражают различные справочники. При этом необходимость координационной работы изданном этапе языковой политики и язы­кового строительства в начале третьего тысячелетия остается актуаль­ной, в связи с чем в 1990 г. при Институте русского языка РАН была образована новая Орфографическая комиссия.

Нормирование языка.

Орфоэпия — совокупность произносительных норм национально­го языка, обеспечивающая сохранение единообразия его звукового оформления; раздел языкознания, изучающий произносительные нормы.

Культура речи — владение нормами устного и письменного ли­тературного языка, а также умение использовать выразительные средства языка в различных условиях общения в соответствии с целя­ми и содержанием речи; раздел языкознания, исследующий пробле­мы нормализации с целью совершенствования языка как орудия культуры.

Норма в языке. Для исследования литературно-языковой нормы вообще и произносительной нормы в частности, как считает Л.А. Вербицкая, необходимо изучение не только внутренних системных, но и социо­лингвистических факторов, а также определенных психологических за­конов, которые управляют речевой деятельностью людей. До сих пор остается нерешенным вопрос, существует ли норма в самом языке или она вносится в язык извне, противопоставляется ли норма кодифика­ции или не отличается от нее.

При рассмотрении одного из частных вопросов общей проблемы нормы — произносительной нормы принято различать два аспекта по­следней — орфоэпию и орфофонию.

Орфоэпия и орфофония. В самом общем виде можно сказать, что орфоэпия — это правила, определяющие нормативный фонемный со­став слов, а орфофония — правила произношения вариантов фонем. Так, вопрос о том. следует ли употреблять в слове тихий твердое [х] или мягкое [х'], регулируется правилами орфоэпии, а требование про­износить согласный [j] в конце слова как сонорный, а не глухой, от­носится к правилам орфофонии.

Орфоэпия для устной речи играет роль, подобную той, которую играет орфография для письменной речи (орфография определяет буквенный состав слова на письме, орфоэпия — фонемный со­став). Сознательной кодификации подвергается именно орфо­эпия, так как фонемный состав слов хорошо осознается носителя­ми языка.

Орфофонические различия носителями языка часто не осознают­ся. Вместе с тем диалектные и просторечные особенности обычно про­являются не в нарушении фонемного состава слова, а в изменении фонетических характеристик фонем, в искажении звуковой их реали­зации (например, недостаточная редукция безударных гласных, недо­статочная мягкость [с']).

Реальные пути развития произносительной нормы определяются фонологической системой языка, прежде всего существующей в ней вариантностью. Произносительная норма также характеризуется из­вестной вариантностью, которую допускает система.

При утверждении того или иного орфоэпического или орфофони-ческого варианта в качестве ведущего варианта нормы большое значе­ние имеет анализ основных тенденций развития фонологической системы. Чаще побеждают варианты, соответствующие этим тенден­циям.

Знание основных направлений развития фонологической системы имеет особое значение для кодификаторов, вынужденных сознательно выбирать один из вариантов в случаях, когда один становится ведущим вариантом нормы, а второй — отживающим. При выборе одного из ва­риантов необходимо учитывать разнообразные фонетические, фоно­логические, морфонологические и экстралингвистические факторы, опираться на экспериментально-фонетические исследования реаль­ной речи носителей языка.

Стилеметрия и атрибуция текстов.

Стилеметрия — прикладная филологическая дисциплина, зани­мающаяся измерением стилевых характеристик с целью систематиза­ции и упорядочения (типологии, атрибуции, датировки, диагностики, реконструкции и т.д.) текстов и их частей.

Стилеметрия. Термин «Стилеметрия» ввел в научный обиход немецкий филолог В. Диттенбергер, решавший в конце XIX в. проблему автор­ства диалогов Платона с помощью частот слов, реализация которых не зависит от тематики текста. В России первым «стилеметром» был Н.А. Морозов, известный писатель и разносторонний ученый. Он ис пользовал частотные распределения служебных слов для отличения плагиата от подлинных произведений.

Объектом стилеметрии является текст, созданный конкретным ав­тором, в конкретное время, в конкретной ситуации. Предметом ис­следования являются элементы стиля, которые понимаются как осо­бенности периферии характеристики объекта. Стиль может быть описан через факультативные, поверхностные признаки текста, кото­рые лишь неявным образом затрагивают его сущностные, глубинные характеристики.

Стилеметрия имеет дело с количественным классифицированием, а эта область классификационных занятий тесно соприкасается с не­сколькими научными направлениями: теорией группировок, теорией оценивания, распознаванием образов, теорией корреляции, количе­ственной таксономией, методами психологического тестирования и др. Границы между этими направлениями стираются, и сегодня мож­но говорить о комплексе подходов и методов, занимающихся теми или иными видами количественной систематизации объектов произ­вольной природы.

К настоящему времени, как показывают исследования Г.Я. Мар-тыненко и С.В. Чебанова, накоплен большой опыт в применении ста­тистического метода для решения проблемы спорного авторства (ат­рибуции) текстов; в сущности, этот метод стал хрестоматийным, причем не только в филологии (текстологии, источниковедении, сти­листике), но и в криминалистике, медицинской диагностике, соци­альной психологии.

В последние годы круг решаемых стилеметрией задач и репертуар применяемых ею методов существенно расширились. Практической повседневностью стала количественная таксономия текстов, стилис­тическое приложение нашли дешифровочные модели, относительно самостоятельное направление образовала квантитативная типология текста, начала формироваться стилистическая диагностика, большое развитие получили методы реконструкции древних текстов.

Атрибуция текстов. При решении таких традиционных филологи­ческих задач, как атрибуция анонимного или псевдонимного текста, определение или уточнение датировки текста, типология жанров и Функциональных стилей, становится очевидно, что, по мнению М.А. Марусенко, во всех вышеперечисленных случаях мы имеем дело только с одной научной задачей — либо с объединением объектов в однородные классы, либо с отнесением объекта (группы объектов) к какому-либо классу, либо с определением меры близости/удаленнос­ти между разными объектами (группами объектов).

При всей актуальности этих проблем и несмотря на то, что работа над ними ведется со времен филологов-классиков, нынешнее состо­яние дел не позволяет однозначно и с фиксированной достовернос­тью производить атрибуцию анонимного или псевдонимного текста как и другие классификационные процедуры. Произведения ано­нимного или спорного авторства существуют в любой литературе. До настоящего времени процедура атрибуции таких текстов сводилась к тому, что филолог-литературовед, хорошо знакомый с периодом, в который был написан спорный текст, и с творчеством писателей, ра­ботавших в то время, пытался найти те или иные доказательства, поз­воляющие приписать данный текст известному ему автору. При этом самым важным являлись свидетельства внешнего характера, такие, как биографические данные предполагаемого автора, его пребыва­ние в данном месте, круг его знакомств, переписка, политические взгляды и т.д. Пользуясь этим методом, разные исследователи зачас­тую приходят к совершенно противоположным выводам относитель­но предполагаемого автора анализируемого текста. Необходимо учи­тывать и субъективный фактор, который оказывает негативное воздействие в двух планах: с одной стороны, исследователи выбира­ют в качестве оснований для атрибуции те критерии, которые лучше «укладываются» в их гипотезу, с другой — проявляется отчетливая тенденция приписывать спорные тексты перу наиболее крупных и значительных писателей.

Новые перспективы в этой области открываются при комплекс­ном подходе к проблеме атрибуции, когда для признания принадлеж­ности анализируемого произведения данному автору необходимо учитывать доводы по меньшей мере трех основных групп: а) биогра­фические; б) идеологические; в) стилистические. Чем большее число разных методов используется в процессе атрибуции, тем выше его точность и надежность, достоверность окончательных выводов.

Совершенствование исследовательских приемов связано с исполь­зованием средств и методов прикладной лингвистики, а также с чет­ким разграничением сферы действия и возможностей традиционных филологических методов, их комплексным сочетанием со статисти-ко-вероятностными методами, разработанными для решения класси­фикационных задач и применяемых для задач атрибуции на основе межнаучного переноса.

Стиховедение.

Стиховедение — отрасль филологии, изучающая стихотворную природу литературного произведения; разделы стиховедения — фони­ка, метрика, ритмика, строфика.

Стихотворный текст в лингвистике. Стиховедение — это дисциплина, находящаяся на стыке лингвистики и литературоведения. Стихо­творный текст интересует лингвистику как особого рода речь. Спе­цифику этой речи определяют прежде всего метрика, ритмика, риф­ма и строфика.

Предметом изучения стиховедения являются: а) принципы орга­низации стихотворного текста, отличающие его от прозаического; б) отражение этих принципов в тексте; в) вытекающие из них другие стороны звуковой организации текста.

Приведем мнение относительно всех этих проблем, принадлежа­щее М.А. Красноперовой.

В XX в. стиховедение активно опиралось на математические мето­ды исследования, связанные в основном со статистической обработ­кой текстовых данных. Используемый аппарат переносился в стихове­дение в готовом виде или разрабатывался специально применительно к его задачам. Такое направление исследований называется матема­тическим стиховедением. Направление стиховедческих исследований, обслуживающее внешние по отношению к стиховедению задачи, на­зывается прикладным стиховедением.

Наиболее развитыми направлениями математического стиховеде­ния в метрике и ритмике являются вероятностно-статистическое мо­делирование и автоматизация.

Прикладное стиховедение. Прикладное стиховедение может обслу­живать литературоведческие, лингвистические и другие задачи. В об­ласти литературоведения значимость стиховедческих исследований обусловлена тем, что они являются частью поэтики — науки о строе­нии литературного произведения. Цели, выдвигаемые поэтикой пе­ред стиховедением, связаны, с одной стороны, с изучением жанровых и стилистических типов, с другой — с изучением свойств отдельных произведений, творчества определенного автора, школы, литератур­ной эпохи и т.д.

Прикладное стиховедение находит применение в поэзии и худо­жественном переводе. Даже близкие разноязычные системы стихо­сложения, например русский и английский ямб, различаются осо­бенностями в деталях. Во многих случаях арсенал стихотворных форм в разных языках настолько различен, что без тщательного изу­чения принципов и практики иноязычного стихосложения становит­ся невозможным качественный перевод. Совмещение переводческой и стиховедческой деятельности вполне обычно. Н.И. Гнедич, созда­тель классического русского перевода «Илиады» Гомера, был одно­временно и создателем классической формы русского гекзаметра. Сам он опирался на гекзаметр, созданный в переводческой работе В.К. Тредиаковского. Переводчиками являются крупные стиховеды нашего времени — М.Л. Гаспаров, А.Л. Жовтис и др.

Задачи стиховедения в области лингвистики определяются тем, что стихотворные тексты представляют собой речь особого рода. В си­лу этого лингвистический интерес имеют любые результаты их стихо­ведческого анализа. Лингвистика дает лишь свое направление в ос­мыслении этих результатов. Один из аспектов данного направления касается взаимоотражения стиховедческих и общелингвистических категорий — грамматики, фонетики, стилистики. Сюда относятся та­кие проблемы, как ритм и синтаксис, ритм и интонация, стилистиче­ские типы ритма и др. Самодовлеющую роль в ритмическом строении стиха играет его слоговая организация. Изучение свойств слоговых структур может быть продуктивным направлением прикладного сти­ховедения.

Дешифровка.

Дешифровка — изучение сообщений или текстов для обнаружения информации, закодированной или представленной способом, неиз­вестным исследователю.

Объекты и задачи дешифровки. Объектами дешифровки, по мнению Е.Д. Савенковой, являются тексты на языках каких-либо народов или записи на иных знаковых системах (ноты, картографические доку­менты, математические формулы и т.д.). Этим определяется различие между лингвистической и нелингвистической дешифровкой. Послед­няя лежит за пределами языковедческих дисциплин, но ее роднят с ними общие семиотические закономерности.

Лингвистическая дешифровка включает в себя исследование исто­рических письмен и чтение тайнописи (криптограмм). В первом слу­чае непонятность текста для исследователя обусловлена разрывом традиции, во втором — специальными усилиями, предпринятыми ав­тором или шифровальщиком, чтобы сузить круг адресатов.

Лингвистическая дешифровка в широком смысле слова предпола­гает решение задач четырех типов.

  1. Неизвестна только письменность, язык известен. Аналог: про­стой шифр, основанный на замене. Решение этой задачи, т.е. установ­ление чтения забытых знаков, есть дешифровка в узком смысле слова.

  2. Неизвестен только язык, письменность известна. Аналог: код, решение этой задачи, т.е. установление значения единиц языка, зву­чание которых известно, называется интерпретацией.

  3. Неизвестный язык записан неизвестным письмом. Аналог: за­шифрованный код. Решение этой задачи, т.е. установление и звуча­ния, и значения языковых единиц, называется раскрытием.

Чтение, перевод и анализ особенностей конкретного текста, за­писанного на неизвестном языке или неизвестной письменностью.

Хотя такая деятельность, опирающаяся на решение приведенных вы­ше задач, относится уже к области филологии, она качественно от­лична от анализа текста на хорошо известном языке, поэтому ее называют дешифровкой текста.

Методика.

Методика обучения родному языку.

Методика обучения родному языку— одна из педагогиче­ских наук; изучает процессы обучения родному языку: усвоение знаний о языке, формирование языковых и речевых умений и навыков; опирается на лингвистические и психологические концепции о роли языка в соци­альном развитии, о связи языка и сознания, речи и мышления.

Основные вопросы методики. Методика обучения тому или иному предмету должна обязательно содержать ответы на три главных во­проса: 1) о содержании обучения (чему учить?); 2) о целях обучения (для чего учить?); 3) о принципах, методах и приемах обучения (как учить?). Методика обучения родному языку обусловлена спецификой самого учебного предмета «русский язык» по сравнению с другими дисциплинами, а также связями методики обучения родному языку со смежными науками — лингвистикой, психологией и педагогикой. Специфика русского языка как учебного предмета обусловлена тем, что родной язык является не только предметом изучения, но и средст­вом обучения (т.е. с его помощью учащиеся изучают все другие пред­меты), а также важнейшим средством общения в национальном кол­лективе, в частности средством передачи и получения самой разной информации.

Родная речь и ее освоение. Мышление человека развивается одно­временно с процессом овладения им родным языком, усвоения форм родной речи. Предметом изучения на занятиях по русскому языку становятся различные значимые единицы языка — предложе­ния, словосочетания, слова и морфемы, в которых зафиксированы, материализованы результаты познавательной деятельности людей.

В связи с этим различным упражнениям — лексическим и грамма­тическим — придается форма собственно логических упражнений. В результате многократных упражнений обучающийся все более четко и глубоко начинает выражать свои мысли в понятиях, сужде­ниях и умозаключениях.

Постепенно овладевая на занятиях по русскому языку литератур­ными нормами, обогащая свою речь, совершенствуя ее точность, вы­разительность и таким образом развивая свой интеллект, человек при­обретает возможность успешно изучать все другие учебные предметы и тем самым расширять свои знания об окружающей действительно­сти. При этом усвоение знаний о языке не является самоцелью, а представляет собой средство для формирования навыков и умений, необходимых для оптимального использования языка как средства общения. Главной, преобладающей в обучении языку является его коммуникативная функция.

Что касается принципов обучения и выбора наиболее целесооб­разных, эффективных и экономных методов и приемов передачи зна­ний и формирования умений и навыков, то в значительной степени их определение и описание обусловлены связями методики с психо­логией (особенно с возрастной психологией) и педагогикой (главным образом с дидактикой — теорией обучения).

Методика обучения неродному (иностранному) языку.

Неродной язык— термин, включающий понятие языка межна­ционального общения, а также иностранного языка, изучаемого в язы­ковой среде и вне ее.

Обучение неродному (иностранному языку.

Наличие в каждом методе обучения иностранным языкам ведущей идеи, определяющей пути и наиболее эффективные способы достижения поставленной Цели, составляет его характерную особенность. Например, для группы так называемых прямых методов ведущая идея овладения языком связана с установкой на непосредственное (имманентное) восприятие материала, усваиваемого интуитивно, в процессе рече­вой практики. При этом метод направлен на достижение опреде­ленной цели. Так, назначение интенсивных методов — практичес­кое овладение устной речью в сжатые сроки, от которого зависят отбор учебного материала и способы его презентации, а главное — особая организация занятий, характерная именно для интенсивных методов: максимальная активизация учащихся в ходе занятий, мо­билизация скрытых психологических резервов личности, создание отношений доверия между учащимся и преподавателем.

Неадекватность избранного метода цели обучения делает его недо­статочно эффективным и затрудняет овладение языком в заданных учебной программой параметрах.

Лингвистическая концепция как теоретическая база метода. В каче­стве теоретической базы каждого метода (или группы методов) используется определенная лингвистическая концепция, анализ ко­торой позволяет классифицировать метод с учетом его принадлеж­ности к той или иной группе. Так, теоретической основой аудиови­зуального метода, возникшего во Франции в 1950-е гг., явилась концепция американской психологической школы — бихевиоризм, а лингвистическая теория опиралась на учение Ф. де Соссюра о язы­ке и речи.

Лингвистическая концепция аудиолингвального метода разраба­тывалась на основе дистрибутивной лингвистики американской лингвистической школы, возглавляемой Л. Блумфилдом и З. Харрисом. Сознательно-практический метод, получивший теоретическое обоснование в советской методике, использовал в качестве психоло­гической концепции теорию речевой деятельности (Л.С. Выготский), теорию поэтапного формирования умственных действий (П.Я. Галь­перин), теорию установки (Д.Н. Узнадзе), в то время как лингвисти­ческая концепция этого метода связана с именем Л.В. Щербы.

В основе метода преподавания иностранного языка лежит научно обоснованная система принципов обучения, являющихся отражени­ем определенных концепций — лингвистической, психологической, методической. С помощью таких принципов устанавливаются: а) от­бор языкового и экстралингвистического материала; б) приемы его введения; в) способы закрепления; г) последовательность подачи и дозировка материала по урокам. Другими словами, принципы обуче­ния обусловливают отбор учебного материала, содержание, формы и средства обучения в рамках избранного метода.

Метод не зависит от условий и этапа обучения. В то же время вы­бор метода должен соответствовать условиям и этапу занятий. Хоро­шо известно, что прямой метод с наибольшей эффективностью ис­пользуется на начальном этапе и при установке на овладение языком в узкой сфере общения. Фундаментальная подготовка по языку, вклю­чающая как практическое владение языком во всех сферах общения, так и знание системы языка, достигается в процессе занятий по груп­пе сознательных методов.

В истории преподавания иностранных языков зарегистрировано несколько десятков методов обучения, возникших как социальный заказ общества. Например, аудиовизуальный метод появился в связи с потребностью общества в овладении разговорной речью в сжатые сроки. Сходная ситуация наблюдается в наши дни с интенсивными методами.

Причиной возникновения методов могут быть и достижения в развитии науки и техники, которые оказывают влияние на формиро­вание новых методических концепций. Так, прогресс в области ком­пьютерных технологий способствовал разработке программирован­ного обучения. Исследования в области звукозаписи привели к созданию лингафонных кабинетов и концепции аудиолингвального метода.

Каждый новый метод нередко объявляется оптимальным и уни­версальным. Однако опыт работы и исследования в сфере дидактики свидетельствуют о том, что создание универсального метода — задача вряд ли осуществимая, ибо оптимальность метода определяется кон­кретными целями, задачами и условиями обучения. Так, аудиовизу­альный метод можно считать наиболее эффективным на занятиях по развитию устной речи в сжатые сроки с опорой на аудиовизуальные средства. При овладении языком специальности оптимальными будут варианты переводно-грамматического метода.

Автоматизированные обучающие системы.

Автоматизированные обучающие системы (АОС) — вспомогательные, аппаратурные, аудитивные, визуальные и аудиови­зуальные средства оптимизации учебного процесса и организации коммуникативности обучения в условиях аудиторной и внеаудитор­ной работы учащихся, а также их самостоятельной учебной деятель­ности.

Компьютеризация обучения. Компьютеризация обучения представляет собой одну из чрезвычайно сильных тенденций в современной педа­гогике. Вместе с тем это одна из сложнейших задач, стоящих перед системой образования. Именно автоматизированное дистанционное обучение способно коренным образом повысить эффективность обу­чающих воздействий благодаря повышенной мотивации, одновре­менно сокращая затраты человеческого труда вследствие того, что Рутинные операции, связанные с образовательным процессом, пере кладываются на «плечи» компьютера и, следовательно, выполняются человеком лишь однажды, повторяясь машиной столько раз, сколько необходимо.

Автоматизированные обучающие системы могут использоваться при обучении различным дисциплинам. Однако здесь мы будем гово­рить в основном о системах, предназначенных для обучения иност­ранным языкам.

Функции АОС (приводятся по работам И.В. Жаркова). Функции автоматизированных обучающих систем определяются теми обучаю­щими воздействиями, которые программы, входящие в систему, ока­зывают на обучаемых. К числу основных функций этих программ от­носятся: собственно обучение, тренировка, контроль, оценка. Такое разделение чрезвычайно существенно при проектировании и разра­ботке обучающих программ: оно определяет общий вид сценария программы, форму диалога с обучаемым (если диалог предусмотрен), а также в некоторой степени и действия обучающего как до, так и по­сле сеанса взаимодействия обучаемого с программой.

Возможно выделение нескольких дополнительных функций, вы­полняемых автоматизированными обучающими системами. Эти функции реализуются факультативно, в дополнение к одной или не­скольким из основных. К числу дополнительных функций можно отнести:

•регистрацию результатов учебной деятельности. Особое значе­ние эта функция приобретает в автоматизированных обучающих си­стемах, имеющих в своем составе соответствующую базу данных; бо­лее того, при наличии такой базы данных регистрация результатов обучающих воздействий является наиболее эффективным средством ее ведения;

  • информирование обучаемого. Эта функция может быть реали­зована в полном объеме при наличии в системе базы знаний: в этом случае обучаемому может быть предоставлена возможность посред­ством обращения к ней через запросы получать необходимую ему информацию;

  • ведение диалога. Для ведения диалога необходим хорошо проду­манный, приближающийся к естественному язык, позволяющий строить и распознавать необходимое множество высказываний;

  • выбор стратегии и тактики обучения (настройка системы на обу­чаемого).

Лингвокогнитивное моделирование

Моделирование языка

Моделирование — исследование какого-либо явления, объекта, процесса путем построения и изучения их моделей. Модель — в языкознании искусственно созданное лингвистом реаль­ное или мысленное устройство, воспроизводящее, имитирующее сво­им поведением (обычно в упрощенном виде) поведение какого-либо другого устройства (оригинала) в лингвистических целях.

Модели языка. В настоящее время принято говорить о трех типах моделей языка. Первый — это модели, воспроизводящие тот или иной тип речевой деятельности: понимания (анализа) текста, по­рождения речевых произведений (синтеза), автоматического пере­вода; обучающие модели языка; интеллектуальные системы разных типов, использующие диалог на естественном языке, и т.д. Второй тип моделей — речевые произведения, являющиеся обязательными компонентами любых типов речевой деятельности, а следовательно, и обязательными компонентами любых ее моделей. Третьим типом моделей являются модели собственно языкового механизма, кото­рые воспроизводят языковые закономерности понимания и постро­ения речевых произведений. Вопросы моделирования излагаются здесь в соответствии с мнениями М.И. Откупщиковой, Л.В. Бондар-ко, В.Д. Буторова, В.В. Богданова.

Проблемы моделирования. Основные трудности моделирования различных видов речевой деятельности связаны с тем, что речевые произведения — тексты — моделируют действительный мир. Отсюда следует практическая невозможность создания универсальной моде ли, воспроизводящей все виды речевого поведения человека и анали­зирующей/синтезирующей любые тексты, описывающие все миры действительности, реальные и нереальные.

Обычные лингвистические описания структуры языка могут быть классифицированы как интеллектуальные структурные моде­ли. Для ряда социально значимых целей эти модели оказываются высокоэффективными. Они используются для обучения родному и неродному языку, для перевода и редактирования. Очевидно, что они рассчитаны на интеллект человека, способный широко исполь­зовать так называемую интуицию, т.е. ассоциации, прошлый опыт, догадки и т.д.

Следует отметить, что в плане создания таких моделей лингвис­тика накопила материал, которому может позавидовать любая дру­гая наука и который, несомненно, должен в той или иной мере быть использован при разработке компьютерных моделей речевого поведения.

Сложившаяся в последнее время практика моделирования систем речевого поведения, ориентированных на узкую предметную об­ласть, получает теоретическое обоснование в идеях о моделировании мира при помощи речевых произведений. Однако следует подчерк­нуть, что даже при ориентации компьютерной системы на узкую предметную область эффективность и сама возможность автоматиче­ской обработки достаточно большого количества текстов существен­но зависит от полноты, универсальности модели языкового механиз­ма. Поэтому возникает необходимость построения общей такой модели, являющейся важнейшим компонентом компьютерной моде­ли речевого поведения.

Кроме создания математических моделей языка, являющихся компонентом математического обеспечения, для компьютерных мо­делей речевого поведения требуется разработка структурных лингви­стических моделей, воспроизводящих процессы функционирования языкового механизма, а также структурных моделей, воспроизводя­щих структуру языкового механизма. В отличие от обычных лингви­стических описаний, эти модели должны отвечать требованиям точ­ности, адекватности, простоты, компактности, непротиворечивости и полноты.

Моделироваие уровней языка.

Уровни языка — некоторые фрагменты языка, подсистемы обшей языковой системы, каждая из которых характеризуется сово­купностью относительно однородных единиц и набором правил, ре­гулирующих их использование и группировку в различные классы и подклассы.

Моделирование звуковой формы языка. Звуковая форма существова­ния языка является основной и исходной для любого естественного языка. Это определяет особую роль фонетических исследований в прикладной лингвистике. Можно говорить об основных направле­ниях в изучении звуковой формы языковых единиц, к которым от­носятся:

  1. анализ акустических характеристик речевого сигнала — для со­здания систем передачи речи по каналам связи, для разработки про­цедур автоматического распознавания и синтеза речи, для улучшения методики восстановления речи и слуха у больных с соответствующи­ми нарушениями;

  2. анализ артикуляторных характеристик процессов речепроизвод­ства — для выявления механизмов управления произносительными органами со стороны соответствующих центров коры головного моз­га, что облегчает понимание процессов, характеризующих высшую нервную деятельность человека. Такое понимание имеет и практиче­ское значение при лечении больных, страдающих различными фор­мами нарушения речи. Многие исследователи считают сведения о ме­ханизмах речеобразования очень важными для построения систем автоматического распознавания и синтеза речи;

3) исследование процессов восприятия речевых сообщений слу­ховой системой человека, важное как для оценки значимости акус­тических свойств этих сообщений, так и для построения модели слуховой обработки речевого сигнала. Такого рода исследования чрезвычайно важны для специалистов и в области записи и переда­чи речевых сообщений, и в области автоматического распознаванияи синтеза речи.

Все перечисленные направления в изучении свойств речевого сигнала имеют огромное значение при обучении родному или нерод­ному языку. Значительное место в этой проблеме занимают выработ­ка орфоэпических навыков, устранение диалектных и просторечных явлений, а также постановка так называемого сценического произ­ношения.

Моделирование синтаксической структуры языка. Синтаксический анализ предложения — необходимый этап автоматической обработки текста или речи при решении различного рода задач в прикладной лингвистике. Целью синтаксического анализа является распознава­ние синтаксической структуры предложения или отдельных его час­тей. К основным проблемам моделирования синтаксиса в приклад­ной лингвистике относятся представление синтаксических структур естественного языка и разработка оптимальных методов (алгоритмов) синтаксического анализа, ориентированных на то или иное представ­ление синтаксической структуры.

В настоящее время широко используются три основных способа представления синтаксической структуры предложения, а именно представление ее как: 1) структуры составляющих (дерева непосред­ственно составляющих); 2) структуры зависимостей (дерева зависи­мостей); 3) структуры, совмещающей свойства структур зависимостей и составляющих (ориентированной структуры составляющих).

Моделирование семантики. При моделировании семантики пред­ложения прежде всего возникает вопрос о том, что считать смыслом предложения. Однозначного ответа на него в настоящее время не су­ществует. Однако большинство исследователей сходится на том, что смысл предложения представляет собой сложное, многоаспектное образование. В содержании предложения сложнейшим образом сфо­кусированы характеристики экстралингвистической действительнос­ти, ее отражения в сознании человека в виде концептуальных струк­тур, коммуникативных установок участников общения, а также особенности самого языка. При моделировании семантики предло­жения каждый из названных аспектов может получить статус исход­ного или даже единственного, если прочие аспекты по каким-либо соображениям не рассматриваются. В зависимости от того, какой исходный аспект кладется в основу моделирования семантики пред­ложения, возможны, в принципе, четыре подхода: онтологоцентриче-ский, концептоцентрический, синтактикоцентрический, антропо­центрический. В рамках каждого из них существует некоторая система воззрений, разработанных с различной степенью детальнос­ти. Поэтому важно выявить фундаментальные принципы и постула­ты, которыми можно руководствоваться, строя теорию с преимущест­венной ориентацией на какой-нибудь один аспект.

Моделирование статичтическиз параметров языка. На фоне непреходящего интереса лингвистов к технике обработки данных в настоя­щее время на первый план выдвигается вопрос о месте и роли статис­тического метода в лингвистике и особенностях его применения к решению конкретных задач. Не теряет актуальности и попытка разо­браться в том, на что может претендовать статистический метод и на что он претендовать не может.

В статистическом методе — универсальном методе познания дей­ствительности — оптимально отражены взаимоотношения между субъектом и объектом исследования, объектом и методом, объектом и знанием о нем. Позиция исследователя при этом характеризуется объективностью, беспристрастностью, а его интерес к объекту дикту­ется прежде всего практическими, прикладными целями, например задачей автоматического индексирования текста, его дешифровки или атрибуции.

В результате взаимодействия исследователя с объектом рождается статистическое знание, обладающее свойствами, вытекающими из позиции и интереса исследователя (объективность, прагматичность), а также объекта исследования (системность, стохастичность, симпто­матичность, многомерность, конкретность, количественность) и ме­тода исследования (строгость, приближенность, верифицируемость). Обращает на себя внимание тот факт, что метод взаимодействует не только с объектом, но и добытым знанием, отсюда свойство верифицируемости знания.

Моделирование уровня текста. К актуальным проблемам модели­рования уровневой структуры языка, прежде всего уровня текста, относится компьютерная обработка древних рукописей и подготов­ка их к последующему изданию, что имеет большое историко-куль­турное значение. Немало рукописей на восточных, германских, ро­манских, славянских языках дошли до нас из глубины веков. Изучением древних рукописей занимаются специалисты самых раз­ных профессий: филологи, историки, этнографы, географы, эконо­мисты, социологи. С точки зрения лингвистов, целью подлинно на­учной истории языка является строгое объективное воссоздание системы языка текстов.

Синхронное моделирование систем языка древних текстов преду­сматривает построение различных моделей на уровне морфологии, лексики. Такие модели могут быть как собственно морфологически­ми, ареально-типологическими, функционально-семантическими, так и хронологически-статистическими, описательными, формаль­ными. При этом надо различать исследования, направленные, с од­ной стороны, на построение системы языка как таковой, а с другой — на воссоздание истории текста. При моделировании системы языка главным является выявление основных доминирующих типов и тен­денций; здесь наиболее показательны морфология, высокочастотные факты в статистике. История памятника связана с проблемами атри­буции текста, где главное — выделение диагностических различитель­ных его признаков. Наиболее показательны в этом отношении пись­мо текста, его лексика, синтаксис, собственно стилистика, редкие факты статистики.

В процессе моделирования языка особое место занимают слово­указатели к древним памятникам литературы. Они нужны языко­ведам, литературоведам, историкам, этнографам, поскольку дают полное представление о лексике памятника, о типах слов и форм по их структуре, о характере применения титл, о видах использова­ния графем и их последовательностях. Словоуказатели демонстри­руют абсолютную частоту словоформы в тексте и в целом позволя­ют судить об общем семантическом характере приведенных слов. Идя по пути создания полных словоуказателей, реестров грамма­тических форм, конкордансов и словарей к отдельным памятникам (центрам письменности), сопоставляя затем между собой словни­ки и словари текстов и зон, изученных лучше других, мы придем постепенно к относительно полной картине ареального и жанрово­го распределения лексики памятников письменности и сможем бо­лее уверенно говорить о неологизмах изводов, школ и авторов от­дельных текстов.

Актуальной нерешенной проблемой в сфере составления автома­тических словарей является автоматическое сведение словоформ к канонической (словарной) форме. Не говоря уже о трудности опреде­ления грамматической характеристики словоформы, следует отме­тить проблему отождествления графических вариантов одной и той же формы слова. Предпринимавшиеся в этой области усилия пока плодов не принесли, и единственной надежной процедурой сведения словоформ к канонической форме, к сожалению, является ручное постредактирование полученного словаря.

Искусственный интеллект.

Искусственный интеллект — условное обозначение ком­пьютерных систем, моделирующих некоторые стороны интеллекту­альной деятельности человека, его логическое, аналитическое мыш­ление.

Искусственный интеллект: ДА ИЛИ НЕТ? В 1950-х гг. был поставлен вопрос: можно ли научить машину мыслить, как человек, или, другими словами, можно ли создать искусственный интеллект? Ответ на него получить далеко не так просто, как это может показаться на первый взгляд. Сложность вопроса связана с тем, что мы очень плохо пред­ставляем себе, как человек мыслит. Общей теории мышления в насто­ящее время не существует. Более того, мы даже не знаем, что такое мышление, нет его определения, по крайней мере такого, которое удовлетворило бы одновременно философов, психологов, инжене­ров, лингвистов, а также других специалистов, участвующих в реше­нии задач искусственного интеллекта.

Хотя различные исследователи по-разному определяют набор сво­их задач, тем не менее существует «устойчивая сердцевина» — пробле­мы, которые практически всеми специалистами включаются в число задач искусственного интеллекта. К таковым относятся, как считает И.П. Панков, решение задач, принятие решений, распознавание об­разов.

Решение задач. Этот термин объединяет многие проблемы: от до­казательства теорем высшей алгебры и решения задач из учебника физики 6-го класса средней школы до бытовых проблем, например какой можно приготовить обед из имеющихся продуктов. Разумеет­ся, здесь речь идет не о непосредственном решении упомянутых вы­ше задач, а о нахождении общего механизма, который использует человек для решения подобных задач, т.е. не о решении задач, а о моделировании этого процесса.

Пока исследуются вопросы, в основном касающиеся моделирова­ния решения различных математических задач. Это связано в первую очередь с тем, что математические задачи проще поддаются формали­зации. Кроме того, для общего решения проблемы следует разобрать­ся с тем, каким образом человек проводит рассуждения, осуществляет логический вывод. Для моделирования решения только математичес­ких задач можно использовать формальную (математическую) логику. Однако для общего решения этой проблемы математическая логика (точнее, только математическая логика) вряд ли подойдет: человек пользуется логикой, весьма отличающейся от формальной. Это не зна­чит, что люди не пользуются формальной логикой (или чем-то вроде этого), но они явно используют что-то еще для логических преобразо­ваний. Вероятно, мир, где господствовала бы только формальная логи­ка, был бы очень скучен. Но если математическая логика — это хоро­шо разработанная научная дисциплина, то «логика человека» остается почти не исследованной.

Принятие решений. Эта проблема в основном рассматривается на материале стратегических игр, таких, как шахматы, шашки, го и т.д.

Работы по моделированию игр осуществляются отнюдь не только для развлечения скучающей публики. Скорее наоборот. Коммерческие программы, играющие в шахматы и другие игры, являются «побоч­ным эффектом» работ такого рода. Дело в том, что «правила игры» су­ществуют не только для перемещения фигур по шахматной доске, но и для размещения сырья и оборудования по предприятиям, передви­жения полков и армий по театру военных действий, перемещения де­нежных средств по финансовой системе и т.д.

Выработка общих методов принятия решения о выборе в каждом конкретном случае правил, которые приводят к наилучшим результа­там (т.е. нахождение оптимальной стратегии), не только дает возмож­ность создать эффективные автоматизированные системы управле­ния, экспертные системы, но и вносит свой вклад в общую теорию мышления.

Распознавание образов. Человеку свойственно классифициро­вать окружающий его материальный мир. Бесчисленное множество различных объектов он объединяет в группы. Два различных ябло­ка, не очень похожих друг на друга, человек называет одним сло­вом — яблоко. А груша, может быть, очень похожая на яблоко, тем не менее — груша.

Предполагается, что в процессе мышления человек создает некие эталонные образы объектов и групп объектов, с которыми имеет дело, и, сравнивая образ рассматриваемого объекта с эталонными образа­ми, относит этот объект к той или иной группе. Такое действие и на­зывается распознаванием образов.

Самое главное для решения проблемы распознавания образов — это найти ответ на два очень сложных вопроса: как создается эта­лонный образ (т.е. как человек членит, классифицирует мир) и ка­кие отличия образа объекта от эталона являются существенными, а какие нет?

Человек имеет различные каналы получения информации об окру­жающей его действительности — зрительный, слуховой, осязатель­ный и др., поэтому у него могут формироваться образы различных ти­пов, и проблема их распознавания распадается на отдельные проблемы: распознавание зрительных образов, распознавание акус­тических образов и т.д.

Не следует думать, что эти исследования так и остались исследовательской абстракцией. Наиболее простой и понятный пример применения данных разработок для широкого использования – это системы оптического распознавания текста (тот же Файнридер).

Общение человека и компьютера. Одна из наиболее важных про­блем искусственного интеллекта определяется необходимостью обес­печить общение человека с машиной на естественном языке. Акту­альность ее состоит не только в том, что любое продвижение вперед в данной области приближает нас к созданию искусственного интел лекта и вносит вклад в развитие общей теории мышления, но и в том, что даже частичное, с существенными ограничениями ее решение мо­жет быть использовано для многочисленных практических примене­ний, таких, как создание естественно-языковой надстройки для ин­формационно-поисковых диалоговых систем, автоматизированных систем управления и других систем, для эксплуатации которых сего­дня требуется изучать специальные языки, пользоваться специальны­ми словарями и т.д.

Таким образом, из широкого спектра задач искусственного ин­теллекта важнейшей для прикладной лингвистики является пробле­ма моделирования речевой деятельности человека, анализа и синте­за речи.

Терминоведение и лексикография.

Лексикография — раздел языкознания, занимающийся практи­кой и теорией составления словарей.

Словарь — справочная книга, которая содержит слова (морфемы, словосочетания, идиомы и т.д.), расположенные в определенном по­рядке, объясняет значения описываемых единиц, дает различную ин­формацию о них или их перевод на другой язык либо сообщает сведе­ния о предметах, обозначаемых ими.

В центре внимания лексикографии находятся методы создания словарей. В отличии от лексикологии – теоретической дисциплины, являющейся частью семантики и занятой разработкой методов описания значения слов (в том числе и методов их толкования), проблематика лексикографических работ лежит в сфере словарной практики. Центр ее интереса – способы организации словарной статьи, устройство словарей и технология их создания. Лингвисты принимают участие как в разработке лингвистических (филологических) словарей, так и в создании энциклопедических изданий. Национальные словарные проекты толковых и орфографических словарей тесно связаны с государственной языковой политикой, также представляющей собой одну из областей прикладной лингвистики.

Современная лексикография существенно расширила и усилила свой инструментарий компьютерными технологиями создания и эксплуатации словарей. Это направление прикладной лингвистики получило название компьютерной лексикографии. Специальные программы – базы данных, компьютерные картотеки, программы обработки текста – позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать ее. Множество различных компьютерных лексикографических программ можно разделить на две большие группы: программы поддержки лексикографических работ и автоматические словари различных типов, включающие лексикографические базы данных.

Создание компьютерных словарей значительно расширило возможности лексикографии в плане информативности словарных статей. Появилась возможность создания перекрёстных ссылок гипертекстового типа (при нажатии на ссылку открывается другая словарная статья или комментарий), подключения дополнительных баз данный профессиональной лексики, стала возможной обратимость переводного словаря (когда, например, англо-русская словарная статья легко превращается в русско-английскую; бумажные словари по определению «необратимы»: англо-русский и русско-английский словари – это два принципиально разных словаря).

Предметом исследования и описания терминографии является терминология, соотносящаяся в широком понимании с областью всех терминов естественного языка, а в узком – с терминами той или иной конкретной научной дисциплины или специальной области практической деятельности человека. В рамках отдельной теории термины образуют терминосистему. Термины можно определить как слова (или словосочетания) метаязыка науки и приложений научных дисциплин, а также слова, обозначающие специфические реалии конкретных областей практической деятельности человека. Обычно понятие термина задается через его свойства, реализуемые в терминосистеме. В отличие от обычной лексики, использование терминов в идеальном случае основывается не на интуиции, а на явным образом задаваемых определениях. Терминологические словари – один из результатов терминографии – сближают это направление прикладной лингвистики с лексикографией.

Прикладная лингвистика и перевод

Наука о переводе (англ. translation studies; нем. Ubersetzungswissenschaft или Translationswissenschaft) включает несколько направлений, среди которых выделяются теория перевода, анализ перевода, методика обучения переводу. Особое место занимает машинный перевод – научная и одновременно технологическая дисциплина, связанная и с наукой о переводе, и с компьютерной лингвистикой. Как и многие другие разделы прикладной лингвистики, наука о переводе по существу междисциплинарна и часто заимствует идеи не только из лингвистики, но и из литературоведения, когнитивных наук и культурной антропологии. По характеру переводческой деятельности традиционно выделяются устный и письменный перевод. Хотя с лингвистической точки зрения между этими видами перевода принципиальной разницы нет, психологически они сильно отличаются друг от друга. Прикладной аспект теории перевода связан, в первую очередь, с выявлением проблем несоответствия между грамматическими и лексическими системами различных языков, а также с различиями в прагматическом аспекте функционирования языковой системы. Сюда относятся сложности в категоризации действительности, обусловленные грамматическими особенностями различных языков (например, несовпадение набора грамматических категорий), спецификой лексического значения и т.п. Важнейшая лингвистическая проблема науки о переводе – адекватная передача так называемых «скрытых категорий» – категории неотчуждаемой принадлежности, определенности-неопределенности и пр. Будучи в одних языках грамматическими, в других языках эти аспекты значения могут выражаться не регулярно, а лишь при определенных условиях, что существенно осложняет работу переводчика.

Машинный перевод

Машинный перевод — выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия.

История машинного перевода (по работам Л.Н. Беляевой и М.Н. От­купщиковой). В истории машинного перевода традиционно выделялись два подхода: первый, связанный с индуктивным построени­ем систем машинного перевода, с использованием в первую очередь доступной информации лингвистического характера, без априор­ных дедуктивных построений, ориентированный на использование переводных соответствий в рамках данной языковой пары; и вто­рой — с декларированным преобразованием входного предложения через использование эксплицитного языка смысла в выходное предложение, передающее тот же смысл, что и входное, но необяза­тельно теми же или эквивалентными (по структуре) языковыми средствами. Первый подход носил в разное время разные наимено­вания: подход «грубой силы», инженерный подход, селективная стратегия, методы воспроизводящего инженерно-лингвистическо­го моделирования, лексический подход, «прямой» метод и пр., ино­гда эти наименования имели негативные или пренебрежительные оттенки (подход ао1 Ьос). Второй подход, появившийся позже пер­вого, также имел разные варианты названий (соответственно и оп­ределенные различия в технике анализа и синтеза), например: глобальные стратегии, подход «смысл—текст», перевод с использо­ванием семантических множителей, глубинного языка смысла и т.д. В настоящее время есть все основания констатировать, что в прак­тическом применении машинного перевода и в перспективах раз­вития его как части информационного обслуживания приходится иметь дело только с первым подходом, поскольку второй не ассоци­ируется более с действующими системами машинного перевода или вообще с машинным переводом — все действующие в мире его сис­темы так или иначе построены по принципу передачи определен­ных переводных соответствий в заданной паре языков, и нет ни од­ной действующей системы в рамках второго подхода. Это не означает, однако, что второй подход не дал позитивных результатов для проблемы машинного перевода в целом.

Рассматривая машинный перевод с точки зрения его реального вклада в развитие науки и техники, следует остановиться прежде все­го на аспекте экономическом. Экономически машинный перевод способствует научно-техническому прогрессу, ускоряя и удешевляя получение иностранной информации на растущем из года в год рын­ке научно-технических переводов. Однако машинный перевод не представляет собой нечто самостоятельное, не зависящее от окружа­ющей среды. У него лишь свои, особые требования ко всей установив­шейся системе научно-технического перевода и научно-технической информации в целом. Широкий спектр информационных услуг, кото­рые может оказать и уже оказывает машинный перевод, — избирательное распределение неотредактированных переводов в целях сиг­нального оповещения, перевод заголовков, рубрик, аннотаций и пр. в оперативном режиме — предполагает формирование новых норм об­ращения с информацией посредством определенного учета информа­ционных потребностей заказчика. При этом главный экономический эффект собственно машинного перевода пропорционален уменьше­нию вложенного в редактирование человеческого труда и, соответст­венно, прямо зависит от повышения качества машинного продукта. Последнее является следствием эффективности лингвистической мо­дели, лежащей в основе алгоритма.

Лингвистические модели машинного перевода. Современные линг­вистические концепции, лежащие в основе алгоритмических моде­лей современных систем машинного перевода, обычно идут не глуб­же так называемого этапа трансфера, т.е. переводных соответствий в рамках конкретной языковой пары. Практика внедрения и использо­вания систем машинного перевода требует совершенствования линг­вистического обеспечения этих систем в части словарей и алгорит­мов анализа и синтеза текстов. По мнению некоторых специалистов, актуальным становится формирование теории машинного перевода, которая позволила бы проверять гипотезы на практике. Как традици­онная теория перевода начинает использовать приемы, методы и ре­зультаты различных лингвистических дисциплин — функциональ­ной и контрастивной лингвистики, социо- и психолингвистики, — так и теория машинного перевода может быть создана только с уче­том содержательного анализа методов и результатов таких дисцип­лин, как лингвистическая теория перевода, теория научно-техничес­кого перевода, прикладная лингвистика, когнитология. Подобный учет в аспекте действия систем машинного перевода в существующих сетях научно-технической информации определил главное направле­ние совершенствования лингвистических моделей, а именно — вы­явление закономерностей перевода с одного естественного языка на другой на уровне собственно переводных соответствий. Стало оче­видным, что перевод принципиально отличается от смыслового тол­кования высказывания, от его представления на языке смысла. Опыт систем, которые базировались на смысловом представлении как це­ли анализа и на движении от глубинного смыслового представления к поверхностной структуре, показывает, что такое движение связано со значительными потерями информации, которая впоследствии должна быть снова восстановлена. В этом отношении наиболее пока­зателен опыт Гренобльской группы во Франции, которая, принципи­ально придерживаясь эксплицитно смыслового подхода, при разра ботке практических систем прибегает к переводу на уровне перевод­ных соответствий. Именно этим обстоятельством — необходимостью возврата к поверхностной структуре от глубинной — и объясняется отсутствие практических систем машинного перевода в рамках вто­рого подхода; подобный возврат связан с необходимостью запоми­нать последовательно все шаги от структуры входного предложения к глубинной и затем от глубинной к поверхностной структуре выход­ного языка.

Издательское дело

Издательское дело — отрасль культуры и производства, связан­ная с подготовкой, выпуском и распространением книг, журналов, га­зет, изобразительных материалов и других видов печатной продукции.

Автоматизация издательского дела. Автоматизация издательского процесса не только позволяет переложить на «плечи» компьютеров вос­произведение текста авторского оригинала в полиграфическом виде, но и разрешает автоматизировать целый ряд процессов его лингвисти­ческой обработки. Рассмотрим эти процессы с позиции В.В. Партыко. Компьютеризированная технология выпуска изданий несколько изменила границы и специфику этапов традиционной технологии. В настоящее время можно выделить следующие этапы в данном тех­нологическом процессе: авторский этап (состоит в записи автором текста своего произведения на машинный носитель информации); ре­дакционный этап, который включает в себя: а) корректуру и редакти­рование текста авторского оригинала; б) редакционно-издательскую деятельность (рецензирование, обработку корреспонденции, поиск информации в базах данных и т.д.); этап конструирования (состоит в задании полиграфических параметров для каждого элемента текста: формата набора и полосы, кегля и гарнитуры шрифтов и т.д., а также меток для выделения элементов текста); этап полиграфического вос­произведения (состоит в отработке полиграфических параметров для каждого элемента текста с помощью компьютера); этап тиражирова­ния, т.е. печатания текста в заданном количестве экземпляров (при­сутствует только при необходимости выпуска издания в традицион­ном «бумажном» виде); этап распространения (состоит в передаче информации из издательств к читателям с помощью носителей ин­формации или через электронные каналы связи, что в целом образует издательскую сеть).

Как видим, лингвистическое обеспечение отсутствует лишь на чи­сто техническом этапе тиражирования, на остальных этапах оно в той или иной мере присутствует обязательно.

Поскольку этапы издания хронологически могут быть совмещены (например, автор, набирая текст, сам осуществляет на первом этапе предварительное редактирование текста), то одни и те же функции лингвистического обеспечения могут реализовываться на разных этапах.

Лингвистическое обеспечение отдельных этапов издательского про­цесса. На авторском этапе авторы для набора текста используют раз­личные текстовые процессоры, т.е. программы, позволяющие наби­рать и модифицировать текст. В такие текстовые процессоры часто встраивают следующие лингвистические функции: поиск синонимов указанного автором слова и — при необходимости — автоматическая замена этого слова на синоним; поиск слов, содержащих ошибки или отсутствующих в эталонном орфографическом словаре; перенос слов при достижении заданного формата. Кроме того, на данном этапе можно автономно использовать толковые и энциклопедические сло­вари, позволяющие осуществлять быстрый доступ к нужной автору словарной статье.

На редакционном этапе реализуются такие функции по обработке текста, как корректура и редактирование. Кроме того, параллельно с обработкой текста осуществляется редакционно-издательская дея­тельность. Перечисленные функции реализуются как в специально предназначенных для этих целей редакционно-издательских систе­мах, так и в других типах используемых в процессе подготовки изда­ния систем, в которые встроены эти функции.

Тексты произведений как объект корректуры и редактирования со­стоят из следующих элементов: простые тексты (графемы-буквы, морфемы, слова, словосочетания, предложения, сверхфразовые единства; блоки — разделы, главы и т.п.; дискурс — текст как целое); специальные тексты, например рубрики, сокращения, наименования единиц измерений и т.д.; сложные тексты, т.е. формулы и таблицы; тексты, образующие аппарат произведений (титульный лист, выход­ные сведения, указатели и т.д.); служебные тексты, т.е. метки элемен­тов текста и команды полиграфического оформления.

Предметом обработки авторских текстов на данном этапе являют­ся два процесса: 1) приведение текстов в соответствие с оригиналом; 2) приведение текстов в соответствие с существующими нормами. Первый принято называть корректурой, а второй — редактировани­ем. В корректуре и редактировании можно выделить два типа опера ций: а) контроля, т.е. нахождения отклонений; б) реконструкции, т.е. исправления отклонений, найденных в процессе контроля. Весь текст, таким образом, является объектом операций контроля, и толь­ко те его сегменты, в которых найдены отклонения, — объектом опе­раций реконструкции. Среди отклонений следует различать: а) иска­жения — отклонения от оригинала; б) ошибки — отклонения от норм; в) погрешности — отклонения от оригинала и норм одновременно.

Лингвистическое обеспечение может быть разделено на автоном­ное и системное. Автономное содержит толковый словарь, энцикло­педические словари. Системное делится на блоки: опорная база дан­ных, массив норм, программы.

Опорная база данных включает в себя: словари антонимов, сино­нимов, орфографический, словарь с морфологической, синтаксиче­ской, семантической и прагматической информацией (общеязыко­вой и отраслевой), словари эталонных переносов (для разных языков), списки морфем, единиц измерений, сокращений, персона­лий, полиграфических команд, меток элементов текста, стандарт­ных элементов библиографических описаний, специализированные информационно-поисковые языки, рубрикаторы. Массив норм со­держит массивы лингвистических норм отдельно по уровням: гра­фем, морфем, слов, словосочетаний, предложений, сверхфразовых единств, блоков, дискурса; психолингвистических норм для читате­лей с высоким уровнем подготовки, с низким уровнем подготовки; правил переноса (для разных языков). Каждый компонент структу­ры можно представить как отдельный объект, хотя некоторые ком­поненты могут быть совмещены (например, словарь с лингвистиче­ской информацией может быть совмещен с орфографическим словарем и словарем синонимов). Для этого есть все необходимые технические предпосылки.

Гипертекст.

Развитие компьютерных технологий и, в частности, такого явления как электронный документы, привело к созданию особого вида текста, который не мог возникнуть в «бумажной» печатной продукции – гипертекст. Его главной отличительной особенностью является возможность создания перекрёстных ссылок и комментариев, открывающихся при нажатии на ссылку, оглавлений, позволяющих переходить по ссылке сразу к нужной странице и т.п. Проблематика гипертекста не стольк сложна в настоящее время, как проблематика систем аннотирования и реферирования, но исключительно широко используется в практической деятельности от Интернет-сайтов, до электронных словарей.

Информационно-поисковые системы

Информационно-поисковые системы (ИПС) возникли в конце 1950-х – начале 1960-х годов как ответ на резкий рост объемов научно-технической информации. По типу хранимой и обрабатываемой информации, а также по особенностям поиска ИПС разделяются на две больших группы – документальные и фактографические. В документальных ИПС хранятся тексты документов или их описания (рефераты, библиографические карточки и т.д.). Фактографические ИПС имеют дело с описанием конкретных фактов, причем не обязательно в текстовой форме. Это могут быть таблицы, формулы и другие виды представления данных. Существуют и смешанные ИПС, включающие как документы, так и фактографическую информацию. В настоящее время фактографические ИПС строятся на основе технологий баз данных (БД). Для обеспечения информационного поиска в ИПС создаются специальные информационно-поисковые языки, в основе которых лежат информационно-поисковые тезаурусы. Развитие современных информационно-поисковых систем связано с разработкой ИПС бестезаурусного типа. Такие ИПС работают с пользователем на ограниченном естественном языке, а поиск осуществляется по текстам рефератов документов, по их библиографическим описаниям, а часто и по самим документам. Для индексирования в ИПС бестезаурусного типа используются слова и словосочетания естественного языка. В качестве информационно-поисковых систем мы можем рассматривать поисковые машины Сети Интернет, такие, как Яндекс, Гугл и другие, а также – электронные каталоги библиотек.

К области компьютерной лингвистики в определенной степени могут быть отнесены работы в области создания гипертекстовых систем, рассматриваемых как особый способ организации текста и даже как принципиально новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской традиции книгопечатания.

Политическая лингвистика

Предмет политической лингвистики – политический дискурс как совокупность дискурсивных практик, идентифицирующих участников политического дискурса как таковых или формирующих конкретную тематику политической коммуникации. Под дискурсивной практикой понимаются тенденции в использовании близких по функции, альтернативных языковых средств выражения определенного смысла. Эти тенденции, естественно, находят отражение в частоте употребления соответствующих феноменов фонетического, морфологического, синтаксического и семантического уровня. Очень близким аналогом в лингвистической поэтике можно считать понятие идиостиля писателя.

Дискурсивные практики с лингвистической точки зрения определяются устойчивыми наборами языковых средств вариативной интерпретации, свойственными данному политическому субъекту или характерными для обсуждения данного предмета. В этом смысле можно говорить о таких предметах политической лингвистики, как «дискурс Рейгана», «дискурс Горбачева», «тоталитарный дискурс», «дискурс безопасности», «дискурс свободы и справедливости», «парламентский дискурс». Иными словами, дискурс Рейгана – это совокупность дискурсивных практик Р.Рейгана, проявляющихся в его политических выступлениях, интервью и т.д. Тоталитарный дискурс – это совокупность дискурсивных практик, характерных для политического языка тоталитарного общества, а дискурс безопасности – совокупность дискурсивных практик, встречающихся в дискуссиях о безопасности государства и формирующих эти дискуссии как часть политического дискурса в целом.

Наиболее известные примеры дискурсов, на которых развивалась политическая лингвистика, – русский политический язык советской эпохи (Lingua Sovietica), дискурс Великой французской революции, политический язык «Третьего Рейха», «вьетнамский английский» в США в период вьетнамской войны..

Изучение политического языка было инициировано по крайней мере тремя факторами. Во-первых, внутренними потребностями лингвистической теории, которая с завидным постоянством в разные периоды истории лингвистики обращалась к реальным сферам функционирования языковой системы. «Примат речи» часто становился главным лозунгом реформаторов учения о языке. Во-вторых, чисто политологическими проблемами изучения политического мышления, его связи с политическим поведением; необходимостью построения предсказывающих моделей в политологии, а также разработки методов анализа политических текстов и текстов средств массовой информации для мониторинга различных тенденций в сфере общественного сознания. И, наконец, социальным заказом – малорезультативными попытками освободить политическую коммуникацию от всякого рода манипуляций. Последний фактор одновременно стимулировал и становление теории речевого воздействия.

Теория речевого воздействия исследует механизмы вариативной интерпретации действительности не только в политическом языке, но и при функционировании языковой системы в любой сфере деятельности человека, будучи, тем самым, шире политической лингвистики и по постановке задачи, и по предмету исследования. Она, однако, не исследует сами дискурсивные практики, и в этом отношении оказывается уже политической лингвистики.

Наиболее значительны различия между теорией воздействия и политической лингвистикой в сфере приложений. Основные области приложения политической лингвистики в политологии связаны с изучением политического мышления политиков по языковым данным, а также реконструкция и мониторинг состояния общественного сознания по текстам средств массовой информации. Для работы с этими феноменами были разработаны специальные инструменты, среди которых наиболее известны методы контент-анализа и когнитивного картирования. Сущность контент-анализа заключается в том, чтобы по внешним – количественным – характеристикам текста на уровне слов и словосочетаний сделать правдоподобные предположения о его плане содержания и, как следствие, сделать выводы об особенностях мышления и сознания автора текста – его намерениях, установках, желаниях, ценностных ориентациях и т.д.

В политологии контент-анализ обычно используется для изучения когнитивных установок автора текста – его отношения к тем или иным событиям, понятиям, ценностным категориям и т.д. Типичный пример – исследование программ республиканской и демократической партии в их динамике по отношению к концепту «СВОЙ – ЧУЖОЙ». Превалирование «ЧУЖОГО» над «СВОИМ» позволяет сделать вывод о большей конфликтности политического дискурса, о наличии существенных проблем в межпартийных отношениях. И действительно, динамика реализации выделенного концепта коррелирует с динамикой политических конфликтов. Более того, пики «ЧУЖОГО» в партийных программах при отсутствии внешнего конфликта часто указывает на наличие внутреннего конфликта.

Когнитивное картирование как методика политологии и социальных наук развивалось в 1970–1980-х годах работах американского социолога и политолога Р.Аксельрода и его коллег в США и Скандинавии. Когнитивное картирование позволяет выявить представленную в политических текстах структуру каузального рассуждения (что чему способствует/препятствует, что из чего следует и т.п.) и на основании этого делать выводы о мышлении автора текста и его видении политической ситуации. Фактически когнитивное картирование позволяет определить факторы, которые учитывают политики при принятии решений. Стратегия выбора факторов и задает возможную типологию политического мышления.

К данному направлению прикладной лингвистики примыкает судебная лингвистика: в её компетенцию входит анализ текстов на наличие оскорблений, экстремистских высказываний, различного рода подстрекательства, мошенничества и т.п. При этом, следует помнить, что судебно-лингвистическая экспертия – не единственный случай применения знаний лингвистов в интересах правосудия.

Прикладное речеведение

Особым направлением а прикладной лингвистике является прикладное речеведение. Области его применения – автоматическое распознавание речи, синтез речи, идентификация говорящего по голосу и речи, диагностика лжи по речи и целый ряд других. Эта область знания охватывает целый ряд дисциплин: фонетику, психологию, физиологию акустику, социолингвистику, коммуникативную и когнитивную лингвистику и др. Принципиальная междисциплинарность области прикладного речеведения обусловлена исключительной сложностью объекта исследования и моделирования, каким является звучащая речь.

Анализ и синтез речи.

Устная речь представляет собой наиболее удобный и ес­тественный способ общения человека с компьютером, не требующий специального обучения. При этом используются не только все преимущества устного общения по сравнению с письменной речью (освобождаются руки, зрение, не нуж­ны специальные инструменты и освещение, применяются стандартные каналы связи, например, телефон), но и появ­ляются широкие возможности для гибкого взаимодействия с компьютером (без применения клавиатуры, "мыши", экрана монитора и т. д.). За последние 10—15 лет произошли замет­ные изменения в компьютерных технологиях синтеза и рас­познавания речи, обусловленные постоянно растущими воз­можностями компьютерной техники, совершенствованием математического аппарата и более глубоким пониманием ре­альных процессов порождения и понимания речи человеком.

К середине 90-х годов ученые перешли от исследований и ла­бораторных испытаний к промышленным разработкам. В ме­ждународной компьютерной сети Интернет собирается ин­формация о последних достижениях в сфере речевых техно­логий. Однако говорить о том, что с компьютером можно об­щаться так же, как мы общаемся друг с другом, пока нельзя. В каких же случаях "говорящие", "слышащие и понимающие человеческую речь" машины могут помочь человеку?

Области применения речевых технологий

В качестве главных стратегических направлений в раз­витии речевых технологий выделяются:

  • создание человеко-машинных интерфейсов с устным вводом/выводом информации;

  • речевое управление компьютером и другими техниче­скими устройствами (особенно в экстремальных, опасных для человека условиях);

  • организация информационно-справочной службы, по­зволяющей получать и выдавать различную информацию из базы данных в условиях, когда вопрос задается голосом (на
    транспорте, в медицине, банковской службе);

  • создание устройств для приема и озвучивания различ­ных сообщений, например, писем электронной почты по те­лефону;

  • многоязычный устный ввод/вывод речевой информа­ции с автоматическим переводом;

  • разработка приспособлений и компьютерных систем для помощи инвалидам (слепым, глухим, немым, парализо­ванным);

  • создание "автоматической машинистки" — машины, которая распознает произвольное речевое сообщение и за­писывает его в обычном текстовом виде;

  • озвучивание корректур и исправление орфографиче­ских ошибок;

  • помощь в обучении иностранному языку (автоматиче­ские фонетические тренажеры).

Речевые технологии используются также в более слож­ных системах искусственного интеллекта, воспроизводящих элементы порождения и понимания речи человеком.

Большое значение речевые технологии имеют и для на­учных исследований. Участвуя в создании систем автомати­ческого синтеза и распознавания речи, ученые имеют воз­можность проверить на практике правильность теоретиче­ских представлений об устройстве звукового механизма ре­чи и его отдельных частей (звуковой системы языка, рече-производящего механизма и механизма звукового воспри­ятия), выявить недостающие знания, слабую определенность используемых понятий и т. д.

Существенно также и то, что развитие речевых техно­логий требует совершенствования методов цифровой обра­ботки речевого сигнала, которые с успехом могут использо­ваться и в собственно научных целях в разных областях зна­ния: лингвистике, фонетике, физиологии слуха и речи. На­пример, высококачественные синтезаторы речи позволяют создавать речеподобные, близкие к естественным сигналы с точно задаваемыми и контролируемыми параметрами. Эта особенность синтезированной речи делает ее удобной и да­же необходимой для экспериментального изучения воспри­ятия речи человеком.

При разработке прикладных систем, работающих с уст­ной речью, возникают сложные и разноплановые проблемы, которые человек легко преодолевает в реальном языковом общении. Всё дело в том, что слуховое восприятие речи человеком является направленным, то есть навыки человека предоставляют возможность легко адаптироваться к любому акустическому фону и выделять из того акустического хаоса, который мы можем увидить при анализе звукового сигнала техническими средствами, полезную информацию в виде языковых знаков. Обучить такому машину оказалось исключительно сложной задачей, решаемой в настоящее время, притом, достаточно успешно, с одной стороны, за счёт большого количества накопленных знаний, с другой – за счёт введение некоторых ограничений на возможности системы автоматического распознанвания речи: ограниченное количество дикторов, либо ограниченная тематика. Задача синтеза речи оказалась несколько проще, но при этом оказалось необходимым учитывать, что тот акустический хаос, который можно увидить при анализе звукового сигнала, не является случайным, он имеет свою внутреннюю организацию, которая обеспечивает разборчивость речи, и нарушение этих законов приводит к снижению разборчивости и негативному восприятиу услышанного пользователем. В настоящее время основной сложностью синтеза речи является обеспечения «естественности» звучания синтезированной речи. В решении этих проблем участвуют ученые из раз­ных областей науки: лингвисты, физиологи, психологи, ма­тематики, инженеры, специалисты в области компьютерной науки.

Речеведение в криминалистике.

Одним их краеугольных вопросов прикладного речеведения является идентификация говорящего по устной речи. Идентификация говорящего — это процесс определения на основе характеристик речевого сигнала и речево­го потока в целом, принадлежит ли данное высказывание конкретному гово­рящему при условии выбора из п-стимулов, принадлежащих п-лицам. Из­вестно, что голоса и речь различных людей обычно отличаются друг от друга. Кроме того, помимо лингвистического сообщения голос и речь несут инфор­мацию о территориальной и социальной принадлежности говорящего, его эмоциональном состоянии, его отношении к собеседнику, высказыванию и ситуации в целом, о его физиологических, психических, психологических и интеллектуальных особенностях.

До середины 80-х гг. работа лингвистов сводилась в основном к идентификации говорящего по аудиозаписи. Однако в последние годы круг задач лингвистов значительно расширился и в настоя­щее время он включает целый ряд направлений:

  • анализ лингвистического материала с целью установления авторства, «портрет» говорящего и пишущего, анализ речи на орфографическом, фонолого-фонетическом, лексическом, синтактико-семантическом уров­нях в рамках высказывания и текста (дискурса);

  • интерпретация смысла слов, фраз, предложений и других спорных фраг­ментов в различного рода документах;

  • использование лингвистических доказательств в суде;

  • проведение исследования в рамках прикладной фонетики: слухового, аку­стического и лингвистического анализа речевого сигнала в целях иденти­фикации говорящего по голосу и речи.

В прикладном речеведении на данном этапе его развития в России и за рубежом можно выделить следующие основные направления в области теоре­тических и практических исследований:

• идентификация и верификация личности говорящего экспертом и автома­тической (полуавтоматической) системой;

  • объективность и субъективность методов идентификации;

  • автоматизация процесса идентификации и верификации;

  • процедура слухового опознания говорящего;

  • исследование факторов, оказывающих влияние на речевой сигнал (эмоциональное состояние, различные степени физического и психиче­ского напряжения, патология и наличие различных заболеваний и т. д.);

  • определение акустических характеристик речи говорящего (звуковой и просодико-интонационный аспекты);

  • установление подлинности (аутентичности) аудиозаписи и повышение качества звучания аудиоматериалов (фонограмм);

  • проблемы оценки показаний фонетистов-экспертов;

  • разработка методик и их практическое применение.

К числу активно разрабатываемых тем, помимо вышеперечисленных, можно отнести также различные виды произносительной маскировки, анализ спорных сегментов речи, идентификацию речевых расстройств, диалекталь­ный анализ речи, речь в состоянии интоксикации (алкогольной, наркотиче­ской, медикаментозной), имитируемую речь, анализ неречевых сегментов, влияние курения на идентифицируемый возраст говорящего, влияние различ­ных заболеваний на модификацию речевого сигнала, обнаружение фактов монтажа фонограммы и записи на различных устройствах звукозаписи (аналоговые способы, оцифровка и др.), возможность идентификации гово­рящего при переключении с одного языка на другой, влияние изменения стиля произношения на идентификацию говорящего, проблемы билингвизма и трилингвизма в криминалистической практике, организацию процесса иден­тификации говорящего, разработку базы фонетических данных, разработку автоматизированных и полуавтоматизированных систем идентификации лич­ности по голосу и речи, систем шумоочистки и т. д.

Сюда же примыкают такие направления исследований, как диагностика лжи, алкогольного и наркотического опьянения, стресса по речи, а также диагностика по речи различных заболеваний, но в отличие от тех направлений, о который шла речь ранее, данные направления пока не могут похвастаться широким практическим применением в сило недостаточной научтной разработанности и исключительной лсложности объекта исследования.

1

Смотреть полностью


Скачать документ

Похожие документы:

  1. Программа вступительного испытания Магистерская программа «Теория обучения иностранным языкам и культур»

    Программа
    1.Требования ФГОС ВПО, оценка соответствия которым проводится на вступительном экзамене в магистратуру МГОУ по программе «Теория обучения иностранным языкам и межкультурная коммуникация»
  2. Заместитель Министра

    Документ
    Нормативный срок освоения основной образовательной программы подготовки "Лингвиста, преподавателя" "Лингвиста, переводчика" "Лингвиста, специалиста по межкультурному общению", реализуемых в рамках направления
  3. Русская компьютерная и квантитативная лингвистика Способы различения простого и сложного предложения при автоматическом анализе текстов

    Документ
    При автоматическом анализе текстов возможны случаи, когда возникают трудности в определении, является ли то или иное предложение сложным или простым с однородными членами.
  4. Программы и учебный план отделения теоретической и прикладной лингвистики Издательство Московского университета 2009

    Документ
    Отделение теоретической (структурной) и прикладной лингвистики существует на филологическом факультете МГУ с 1960 года. Впервые программы читаемых на этом отделении обязательных курсов были опубликованы в 1996 году1.
  5. Словарь лингвистических терминов

    Документ
    Словарь включает 5270 терминов и понятий лингвистики. Он адресован широкому кругу пользователей: студентам, аспирантам, преподавателям, научным работникам, специалистам разного профиля, изучающим, преподающим, исследующим язык.

Другие похожие документы..