Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Документ'
Однією з важливіших проблем концепції стратегічного планування є оцінка результатів діяльності підприємства за кінцевим числом показників. У даній ро...полностью>>
'Программа дисциплины'
Общие сведения об учебном курсе: Дисциплина читается студентам третьего курса по направлению «Экономика» факультета Мировой экономики и мировой полит...полностью>>
'Урок'
В настоящее время происходит активный процесс информатизации общества. Под информатизацией понимается внедрение компьютерной техники и новых информац...полностью>>
'Доклад'
Для тех, кто действительно хочет понять, что же на самом деле случилось 11 сентября, и кто способен беспристрастно проанализировать ход и характер соб...полностью>>

Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии

Главная > Лекция
Сохрани ссылку в одной из сетей:

Искусственный интеллект.

Искусственный интеллект — условное обозначение ком­пьютерных систем, моделирующих некоторые стороны интеллекту­альной деятельности человека, его логическое, аналитическое мыш­ление.

Искусственный интеллект: ДА ИЛИ НЕТ? В 1950-х гг. был поставлен вопрос: можно ли научить машину мыслить, как человек, или, другими словами, можно ли создать искусственный интеллект? Ответ на него получить далеко не так просто, как это может показаться на первый взгляд. Сложность вопроса связана с тем, что мы очень плохо пред­ставляем себе, как человек мыслит. Общей теории мышления в насто­ящее время не существует. Более того, мы даже не знаем, что такое мышление, нет его определения, по крайней мере такого, которое удовлетворило бы одновременно философов, психологов, инжене­ров, лингвистов, а также других специалистов, участвующих в реше­нии задач искусственного интеллекта.

Хотя различные исследователи по-разному определяют набор сво­их задач, тем не менее существует «устойчивая сердцевина» — пробле­мы, которые практически всеми специалистами включаются в число задач искусственного интеллекта. К таковым относятся, как считает И.П. Панков, решение задач, принятие решений, распознавание об­разов.

Решение задач. Этот термин объединяет многие проблемы: от до­казательства теорем высшей алгебры и решения задач из учебника физики 6-го класса средней школы до бытовых проблем, например какой можно приготовить обед из имеющихся продуктов. Разумеет­ся, здесь речь идет не о непосредственном решении упомянутых вы­ше задач, а о нахождении общего механизма, который использует человек для решения подобных задач, т.е. не о решении задач, а о моделировании этого процесса.

Пока исследуются вопросы, в основном касающиеся моделирова­ния решения различных математических задач. Это связано в первую очередь с тем, что математические задачи проще поддаются формали­зации. Кроме того, для общего решения проблемы следует разобрать­ся с тем, каким образом человек проводит рассуждения, осуществляет логический вывод. Для моделирования решения только математичес­ких задач можно использовать формальную (математическую) логику. Однако для общего решения этой проблемы математическая логика (точнее, только математическая логика) вряд ли подойдет: человек пользуется логикой, весьма отличающейся от формальной. Это не зна­чит, что люди не пользуются формальной логикой (или чем-то вроде этого), но они явно используют что-то еще для логических преобразо­ваний. Вероятно, мир, где господствовала бы только формальная логи­ка, был бы очень скучен. Но если математическая логика — это хоро­шо разработанная научная дисциплина, то «логика человека» остается почти не исследованной.

Принятие решений. Эта проблема в основном рассматривается на материале стратегических игр, таких, как шахматы, шашки, го и т.д.

Работы по моделированию игр осуществляются отнюдь не только для развлечения скучающей публики. Скорее наоборот. Коммерческие программы, играющие в шахматы и другие игры, являются «побоч­ным эффектом» работ такого рода. Дело в том, что «правила игры» су­ществуют не только для перемещения фигур по шахматной доске, но и для размещения сырья и оборудования по предприятиям, передви­жения полков и армий по театру военных действий, перемещения де­нежных средств по финансовой системе и т.д.

Выработка общих методов принятия решения о выборе в каждом конкретном случае правил, которые приводят к наилучшим результа­там (т.е. нахождение оптимальной стратегии), не только дает возмож­ность создать эффективные автоматизированные системы управле­ния, экспертные системы, но и вносит свой вклад в общую теорию мышления.

Распознавание образов. Человеку свойственно классифициро­вать окружающий его материальный мир. Бесчисленное множество различных объектов он объединяет в группы. Два различных ябло­ка, не очень похожих друг на друга, человек называет одним сло­вом — яблоко. А груша, может быть, очень похожая на яблоко, тем не менее — груша.

Предполагается, что в процессе мышления человек создает некие эталонные образы объектов и групп объектов, с которыми имеет дело, и, сравнивая образ рассматриваемого объекта с эталонными образа­ми, относит этот объект к той или иной группе. Такое действие и на­зывается распознаванием образов.

Самое главное для решения проблемы распознавания образов — это найти ответ на два очень сложных вопроса: как создается эта­лонный образ (т.е. как человек членит, классифицирует мир) и ка­кие отличия образа объекта от эталона являются существенными, а какие нет?

Человек имеет различные каналы получения информации об окру­жающей его действительности — зрительный, слуховой, осязатель­ный и др., поэтому у него могут формироваться образы различных ти­пов, и проблема их распознавания распадается на отдельные проблемы: распознавание зрительных образов, распознавание акус­тических образов и т.д.

Не следует думать, что эти исследования так и остались исследовательской абстракцией. Наиболее простой и понятный пример применения данных разработок для широкого использования – это системы оптического распознавания текста (тот же Файнридер).

Общение человека и компьютера. Одна из наиболее важных про­блем искусственного интеллекта определяется необходимостью обес­печить общение человека с машиной на естественном языке. Акту­альность ее состоит не только в том, что любое продвижение вперед в данной области приближает нас к созданию искусственного интел лекта и вносит вклад в развитие общей теории мышления, но и в том, что даже частичное, с существенными ограничениями ее решение мо­жет быть использовано для многочисленных практических примене­ний, таких, как создание естественно-языковой надстройки для ин­формационно-поисковых диалоговых систем, автоматизированных систем управления и других систем, для эксплуатации которых сего­дня требуется изучать специальные языки, пользоваться специальны­ми словарями и т.д.

Таким образом, из широкого спектра задач искусственного ин­теллекта важнейшей для прикладной лингвистики является пробле­ма моделирования речевой деятельности человека, анализа и синте­за речи.

Терминоведение и лексикография.

Лексикография — раздел языкознания, занимающийся практи­кой и теорией составления словарей.

Словарь — справочная книга, которая содержит слова (морфемы, словосочетания, идиомы и т.д.), расположенные в определенном по­рядке, объясняет значения описываемых единиц, дает различную ин­формацию о них или их перевод на другой язык либо сообщает сведе­ния о предметах, обозначаемых ими.

В центре внимания лексикографии находятся методы создания словарей. В отличии от лексикологии – теоретической дисциплины, являющейся частью семантики и занятой разработкой методов описания значения слов (в том числе и методов их толкования), проблематика лексикографических работ лежит в сфере словарной практики. Центр ее интереса – способы организации словарной статьи, устройство словарей и технология их создания. Лингвисты принимают участие как в разработке лингвистических (филологических) словарей, так и в создании энциклопедических изданий. Национальные словарные проекты толковых и орфографических словарей тесно связаны с государственной языковой политикой, также представляющей собой одну из областей прикладной лингвистики.

Современная лексикография существенно расширила и усилила свой инструментарий компьютерными технологиями создания и эксплуатации словарей. Это направление прикладной лингвистики получило название компьютерной лексикографии. Специальные программы – базы данных, компьютерные картотеки, программы обработки текста – позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать ее. Множество различных компьютерных лексикографических программ можно разделить на две большие группы: программы поддержки лексикографических работ и автоматические словари различных типов, включающие лексикографические базы данных.

Создание компьютерных словарей значительно расширило возможности лексикографии в плане информативности словарных статей. Появилась возможность создания перекрёстных ссылок гипертекстового типа (при нажатии на ссылку открывается другая словарная статья или комментарий), подключения дополнительных баз данный профессиональной лексики, стала возможной обратимость переводного словаря (когда, например, англо-русская словарная статья легко превращается в русско-английскую; бумажные словари по определению «необратимы»: англо-русский и русско-английский словари – это два принципиально разных словаря).

Предметом исследования и описания терминографии является терминология, соотносящаяся в широком понимании с областью всех терминов естественного языка, а в узком – с терминами той или иной конкретной научной дисциплины или специальной области практической деятельности человека. В рамках отдельной теории термины образуют терминосистему. Термины можно определить как слова (или словосочетания) метаязыка науки и приложений научных дисциплин, а также слова, обозначающие специфические реалии конкретных областей практической деятельности человека. Обычно понятие термина задается через его свойства, реализуемые в терминосистеме. В отличие от обычной лексики, использование терминов в идеальном случае основывается не на интуиции, а на явным образом задаваемых определениях. Терминологические словари – один из результатов терминографии – сближают это направление прикладной лингвистики с лексикографией.

Прикладная лингвистика и перевод

Наука о переводе (англ. translation studies; нем. Ubersetzungswissenschaft или Translationswissenschaft) включает несколько направлений, среди которых выделяются теория перевода, анализ перевода, методика обучения переводу. Особое место занимает машинный перевод – научная и одновременно технологическая дисциплина, связанная и с наукой о переводе, и с компьютерной лингвистикой. Как и многие другие разделы прикладной лингвистики, наука о переводе по существу междисциплинарна и часто заимствует идеи не только из лингвистики, но и из литературоведения, когнитивных наук и культурной антропологии. По характеру переводческой деятельности традиционно выделяются устный и письменный перевод. Хотя с лингвистической точки зрения между этими видами перевода принципиальной разницы нет, психологически они сильно отличаются друг от друга. Прикладной аспект теории перевода связан, в первую очередь, с выявлением проблем несоответствия между грамматическими и лексическими системами различных языков, а также с различиями в прагматическом аспекте функционирования языковой системы. Сюда относятся сложности в категоризации действительности, обусловленные грамматическими особенностями различных языков (например, несовпадение набора грамматических категорий), спецификой лексического значения и т.п. Важнейшая лингвистическая проблема науки о переводе – адекватная передача так называемых «скрытых категорий» – категории неотчуждаемой принадлежности, определенности-неопределенности и пр. Будучи в одних языках грамматическими, в других языках эти аспекты значения могут выражаться не регулярно, а лишь при определенных условиях, что существенно осложняет работу переводчика.

Машинный перевод

Машинный перевод — выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия.

История машинного перевода (по работам Л.Н. Беляевой и М.Н. От­купщиковой). В истории машинного перевода традиционно выделялись два подхода: первый, связанный с индуктивным построени­ем систем машинного перевода, с использованием в первую очередь доступной информации лингвистического характера, без априор­ных дедуктивных построений, ориентированный на использование переводных соответствий в рамках данной языковой пары; и вто­рой — с декларированным преобразованием входного предложения через использование эксплицитного языка смысла в выходное предложение, передающее тот же смысл, что и входное, но необяза­тельно теми же или эквивалентными (по структуре) языковыми средствами. Первый подход носил в разное время разные наимено­вания: подход «грубой силы», инженерный подход, селективная стратегия, методы воспроизводящего инженерно-лингвистическо­го моделирования, лексический подход, «прямой» метод и пр., ино­гда эти наименования имели негативные или пренебрежительные оттенки (подход ао1 Ьос). Второй подход, появившийся позже пер­вого, также имел разные варианты названий (соответственно и оп­ределенные различия в технике анализа и синтеза), например: глобальные стратегии, подход «смысл—текст», перевод с использо­ванием семантических множителей, глубинного языка смысла и т.д. В настоящее время есть все основания констатировать, что в прак­тическом применении машинного перевода и в перспективах раз­вития его как части информационного обслуживания приходится иметь дело только с первым подходом, поскольку второй не ассоци­ируется более с действующими системами машинного перевода или вообще с машинным переводом — все действующие в мире его сис­темы так или иначе построены по принципу передачи определен­ных переводных соответствий в заданной паре языков, и нет ни од­ной действующей системы в рамках второго подхода. Это не означает, однако, что второй подход не дал позитивных результатов для проблемы машинного перевода в целом.

Рассматривая машинный перевод с точки зрения его реального вклада в развитие науки и техники, следует остановиться прежде все­го на аспекте экономическом. Экономически машинный перевод способствует научно-техническому прогрессу, ускоряя и удешевляя получение иностранной информации на растущем из года в год рын­ке научно-технических переводов. Однако машинный перевод не представляет собой нечто самостоятельное, не зависящее от окружа­ющей среды. У него лишь свои, особые требования ко всей установив­шейся системе научно-технического перевода и научно-технической информации в целом. Широкий спектр информационных услуг, кото­рые может оказать и уже оказывает машинный перевод, — избирательное распределение неотредактированных переводов в целях сиг­нального оповещения, перевод заголовков, рубрик, аннотаций и пр. в оперативном режиме — предполагает формирование новых норм об­ращения с информацией посредством определенного учета информа­ционных потребностей заказчика. При этом главный экономический эффект собственно машинного перевода пропорционален уменьше­нию вложенного в редактирование человеческого труда и, соответст­венно, прямо зависит от повышения качества машинного продукта. Последнее является следствием эффективности лингвистической мо­дели, лежащей в основе алгоритма.

Лингвистические модели машинного перевода. Современные линг­вистические концепции, лежащие в основе алгоритмических моде­лей современных систем машинного перевода, обычно идут не глуб­же так называемого этапа трансфера, т.е. переводных соответствий в рамках конкретной языковой пары. Практика внедрения и использо­вания систем машинного перевода требует совершенствования линг­вистического обеспечения этих систем в части словарей и алгорит­мов анализа и синтеза текстов. По мнению некоторых специалистов, актуальным становится формирование теории машинного перевода, которая позволила бы проверять гипотезы на практике. Как традици­онная теория перевода начинает использовать приемы, методы и ре­зультаты различных лингвистических дисциплин — функциональ­ной и контрастивной лингвистики, социо- и психолингвистики, — так и теория машинного перевода может быть создана только с уче­том содержательного анализа методов и результатов таких дисцип­лин, как лингвистическая теория перевода, теория научно-техничес­кого перевода, прикладная лингвистика, когнитология. Подобный учет в аспекте действия систем машинного перевода в существующих сетях научно-технической информации определил главное направле­ние совершенствования лингвистических моделей, а именно — вы­явление закономерностей перевода с одного естественного языка на другой на уровне собственно переводных соответствий. Стало оче­видным, что перевод принципиально отличается от смыслового тол­кования высказывания, от его представления на языке смысла. Опыт систем, которые базировались на смысловом представлении как це­ли анализа и на движении от глубинного смыслового представления к поверхностной структуре, показывает, что такое движение связано со значительными потерями информации, которая впоследствии должна быть снова восстановлена. В этом отношении наиболее пока­зателен опыт Гренобльской группы во Франции, которая, принципи­ально придерживаясь эксплицитно смыслового подхода, при разра ботке практических систем прибегает к переводу на уровне перевод­ных соответствий. Именно этим обстоятельством — необходимостью возврата к поверхностной структуре от глубинной — и объясняется отсутствие практических систем машинного перевода в рамках вто­рого подхода; подобный возврат связан с необходимостью запоми­нать последовательно все шаги от структуры входного предложения к глубинной и затем от глубинной к поверхностной структуре выход­ного языка.

Издательское дело

Издательское дело — отрасль культуры и производства, связан­ная с подготовкой, выпуском и распространением книг, журналов, га­зет, изобразительных материалов и других видов печатной продукции.

Автоматизация издательского дела. Автоматизация издательского процесса не только позволяет переложить на «плечи» компьютеров вос­произведение текста авторского оригинала в полиграфическом виде, но и разрешает автоматизировать целый ряд процессов его лингвисти­ческой обработки. Рассмотрим эти процессы с позиции В.В. Партыко. Компьютеризированная технология выпуска изданий несколько изменила границы и специфику этапов традиционной технологии. В настоящее время можно выделить следующие этапы в данном тех­нологическом процессе: авторский этап (состоит в записи автором текста своего произведения на машинный носитель информации); ре­дакционный этап, который включает в себя: а) корректуру и редакти­рование текста авторского оригинала; б) редакционно-издательскую деятельность (рецензирование, обработку корреспонденции, поиск информации в базах данных и т.д.); этап конструирования (состоит в задании полиграфических параметров для каждого элемента текста: формата набора и полосы, кегля и гарнитуры шрифтов и т.д., а также меток для выделения элементов текста); этап полиграфического вос­произведения (состоит в отработке полиграфических параметров для каждого элемента текста с помощью компьютера); этап тиражирова­ния, т.е. печатания текста в заданном количестве экземпляров (при­сутствует только при необходимости выпуска издания в традицион­ном «бумажном» виде); этап распространения (состоит в передаче информации из издательств к читателям с помощью носителей ин­формации или через электронные каналы связи, что в целом образует издательскую сеть).

Как видим, лингвистическое обеспечение отсутствует лишь на чи­сто техническом этапе тиражирования, на остальных этапах оно в той или иной мере присутствует обязательно.

Поскольку этапы издания хронологически могут быть совмещены (например, автор, набирая текст, сам осуществляет на первом этапе предварительное редактирование текста), то одни и те же функции лингвистического обеспечения могут реализовываться на разных этапах.

Лингвистическое обеспечение отдельных этапов издательского про­цесса. На авторском этапе авторы для набора текста используют раз­личные текстовые процессоры, т.е. программы, позволяющие наби­рать и модифицировать текст. В такие текстовые процессоры часто встраивают следующие лингвистические функции: поиск синонимов указанного автором слова и — при необходимости — автоматическая замена этого слова на синоним; поиск слов, содержащих ошибки или отсутствующих в эталонном орфографическом словаре; перенос слов при достижении заданного формата. Кроме того, на данном этапе можно автономно использовать толковые и энциклопедические сло­вари, позволяющие осуществлять быстрый доступ к нужной автору словарной статье.

На редакционном этапе реализуются такие функции по обработке текста, как корректура и редактирование. Кроме того, параллельно с обработкой текста осуществляется редакционно-издательская дея­тельность. Перечисленные функции реализуются как в специально предназначенных для этих целей редакционно-издательских систе­мах, так и в других типах используемых в процессе подготовки изда­ния систем, в которые встроены эти функции.

Тексты произведений как объект корректуры и редактирования со­стоят из следующих элементов: простые тексты (графемы-буквы, морфемы, слова, словосочетания, предложения, сверхфразовые единства; блоки — разделы, главы и т.п.; дискурс — текст как целое); специальные тексты, например рубрики, сокращения, наименования единиц измерений и т.д.; сложные тексты, т.е. формулы и таблицы; тексты, образующие аппарат произведений (титульный лист, выход­ные сведения, указатели и т.д.); служебные тексты, т.е. метки элемен­тов текста и команды полиграфического оформления.

Предметом обработки авторских текстов на данном этапе являют­ся два процесса: 1) приведение текстов в соответствие с оригиналом; 2) приведение текстов в соответствие с существующими нормами. Первый принято называть корректурой, а второй — редактировани­ем. В корректуре и редактировании можно выделить два типа опера ций: а) контроля, т.е. нахождения отклонений; б) реконструкции, т.е. исправления отклонений, найденных в процессе контроля. Весь текст, таким образом, является объектом операций контроля, и толь­ко те его сегменты, в которых найдены отклонения, — объектом опе­раций реконструкции. Среди отклонений следует различать: а) иска­жения — отклонения от оригинала; б) ошибки — отклонения от норм; в) погрешности — отклонения от оригинала и норм одновременно.

Лингвистическое обеспечение может быть разделено на автоном­ное и системное. Автономное содержит толковый словарь, энцикло­педические словари. Системное делится на блоки: опорная база дан­ных, массив норм, программы.

Опорная база данных включает в себя: словари антонимов, сино­нимов, орфографический, словарь с морфологической, синтаксиче­ской, семантической и прагматической информацией (общеязыко­вой и отраслевой), словари эталонных переносов (для разных языков), списки морфем, единиц измерений, сокращений, персона­лий, полиграфических команд, меток элементов текста, стандарт­ных элементов библиографических описаний, специализированные информационно-поисковые языки, рубрикаторы. Массив норм со­держит массивы лингвистических норм отдельно по уровням: гра­фем, морфем, слов, словосочетаний, предложений, сверхфразовых единств, блоков, дискурса; психолингвистических норм для читате­лей с высоким уровнем подготовки, с низким уровнем подготовки; правил переноса (для разных языков). Каждый компонент структу­ры можно представить как отдельный объект, хотя некоторые ком­поненты могут быть совмещены (например, словарь с лингвистиче­ской информацией может быть совмещен с орфографическим словарем и словарем синонимов). Для этого есть все необходимые технические предпосылки.

Гипертекст.

Развитие компьютерных технологий и, в частности, такого явления как электронный документы, привело к созданию особого вида текста, который не мог возникнуть в «бумажной» печатной продукции – гипертекст. Его главной отличительной особенностью является возможность создания перекрёстных ссылок и комментариев, открывающихся при нажатии на ссылку, оглавлений, позволяющих переходить по ссылке сразу к нужной странице и т.п. Проблематика гипертекста не стольк сложна в настоящее время, как проблематика систем аннотирования и реферирования, но исключительно широко используется в практической деятельности от Интернет-сайтов, до электронных словарей.

Информационно-поисковые системы

Информационно-поисковые системы (ИПС) возникли в конце 1950-х – начале 1960-х годов как ответ на резкий рост объемов научно-технической информации. По типу хранимой и обрабатываемой информации, а также по особенностям поиска ИПС разделяются на две больших группы – документальные и фактографические. В документальных ИПС хранятся тексты документов или их описания (рефераты, библиографические карточки и т.д.). Фактографические ИПС имеют дело с описанием конкретных фактов, причем не обязательно в текстовой форме. Это могут быть таблицы, формулы и другие виды представления данных. Существуют и смешанные ИПС, включающие как документы, так и фактографическую информацию. В настоящее время фактографические ИПС строятся на основе технологий баз данных (БД). Для обеспечения информационного поиска в ИПС создаются специальные информационно-поисковые языки, в основе которых лежат информационно-поисковые тезаурусы. Развитие современных информационно-поисковых систем связано с разработкой ИПС бестезаурусного типа. Такие ИПС работают с пользователем на ограниченном естественном языке, а поиск осуществляется по текстам рефератов документов, по их библиографическим описаниям, а часто и по самим документам. Для индексирования в ИПС бестезаурусного типа используются слова и словосочетания естественного языка. В качестве информационно-поисковых систем мы можем рассматривать поисковые машины Сети Интернет, такие, как Яндекс, Гугл и другие, а также – электронные каталоги библиотек.

К области компьютерной лингвистики в определенной степени могут быть отнесены работы в области создания гипертекстовых систем, рассматриваемых как особый способ организации текста и даже как принципиально новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской традиции книгопечатания.

Политическая лингвистика

Предмет политической лингвистики – политический дискурс как совокупность дискурсивных практик, идентифицирующих участников политического дискурса как таковых или формирующих конкретную тематику политической коммуникации. Под дискурсивной практикой понимаются тенденции в использовании близких по функции, альтернативных языковых средств выражения определенного смысла. Эти тенденции, естественно, находят отражение в частоте употребления соответствующих феноменов фонетического, морфологического, синтаксического и семантического уровня. Очень близким аналогом в лингвистической поэтике можно считать понятие идиостиля писателя.

Дискурсивные практики с лингвистической точки зрения определяются устойчивыми наборами языковых средств вариативной интерпретации, свойственными данному политическому субъекту или характерными для обсуждения данного предмета. В этом смысле можно говорить о таких предметах политической лингвистики, как «дискурс Рейгана», «дискурс Горбачева», «тоталитарный дискурс», «дискурс безопасности», «дискурс свободы и справедливости», «парламентский дискурс». Иными словами, дискурс Рейгана – это совокупность дискурсивных практик Р.Рейгана, проявляющихся в его политических выступлениях, интервью и т.д. Тоталитарный дискурс – это совокупность дискурсивных практик, характерных для политического языка тоталитарного общества, а дискурс безопасности – совокупность дискурсивных практик, встречающихся в дискуссиях о безопасности государства и формирующих эти дискуссии как часть политического дискурса в целом.

Наиболее известные примеры дискурсов, на которых развивалась политическая лингвистика, – русский политический язык советской эпохи (Lingua Sovietica), дискурс Великой французской революции, политический язык «Третьего Рейха», «вьетнамский английский» в США в период вьетнамской войны..

Изучение политического языка было инициировано по крайней мере тремя факторами. Во-первых, внутренними потребностями лингвистической теории, которая с завидным постоянством в разные периоды истории лингвистики обращалась к реальным сферам функционирования языковой системы. «Примат речи» часто становился главным лозунгом реформаторов учения о языке. Во-вторых, чисто политологическими проблемами изучения политического мышления, его связи с политическим поведением; необходимостью построения предсказывающих моделей в политологии, а также разработки методов анализа политических текстов и текстов средств массовой информации для мониторинга различных тенденций в сфере общественного сознания. И, наконец, социальным заказом – малорезультативными попытками освободить политическую коммуникацию от всякого рода манипуляций. Последний фактор одновременно стимулировал и становление теории речевого воздействия.

Теория речевого воздействия исследует механизмы вариативной интерпретации действительности не только в политическом языке, но и при функционировании языковой системы в любой сфере деятельности человека, будучи, тем самым, шире политической лингвистики и по постановке задачи, и по предмету исследования. Она, однако, не исследует сами дискурсивные практики, и в этом отношении оказывается уже политической лингвистики.

Наиболее значительны различия между теорией воздействия и политической лингвистикой в сфере приложений. Основные области приложения политической лингвистики в политологии связаны с изучением политического мышления политиков по языковым данным, а также реконструкция и мониторинг состояния общественного сознания по текстам средств массовой информации. Для работы с этими феноменами были разработаны специальные инструменты, среди которых наиболее известны методы контент-анализа и когнитивного картирования. Сущность контент-анализа заключается в том, чтобы по внешним – количественным – характеристикам текста на уровне слов и словосочетаний сделать правдоподобные предположения о его плане содержания и, как следствие, сделать выводы об особенностях мышления и сознания автора текста – его намерениях, установках, желаниях, ценностных ориентациях и т.д.

В политологии контент-анализ обычно используется для изучения когнитивных установок автора текста – его отношения к тем или иным событиям, понятиям, ценностным категориям и т.д. Типичный пример – исследование программ республиканской и демократической партии в их динамике по отношению к концепту «СВОЙ – ЧУЖОЙ». Превалирование «ЧУЖОГО» над «СВОИМ» позволяет сделать вывод о большей конфликтности политического дискурса, о наличии существенных проблем в межпартийных отношениях. И действительно, динамика реализации выделенного концепта коррелирует с динамикой политических конфликтов. Более того, пики «ЧУЖОГО» в партийных программах при отсутствии внешнего конфликта часто указывает на наличие внутреннего конфликта.

Когнитивное картирование как методика политологии и социальных наук развивалось в 1970–1980-х годах работах американского социолога и политолога Р.Аксельрода и его коллег в США и Скандинавии. Когнитивное картирование позволяет выявить представленную в политических текстах структуру каузального рассуждения (что чему способствует/препятствует, что из чего следует и т.п.) и на основании этого делать выводы о мышлении автора текста и его видении политической ситуации. Фактически когнитивное картирование позволяет определить факторы, которые учитывают политики при принятии решений. Стратегия выбора факторов и задает возможную типологию политического мышления.

К данному направлению прикладной лингвистики примыкает судебная лингвистика: в её компетенцию входит анализ текстов на наличие оскорблений, экстремистских высказываний, различного рода подстрекательства, мошенничества и т.п. При этом, следует помнить, что судебно-лингвистическая экспертия – не единственный случай применения знаний лингвистов в интересах правосудия.

Прикладное речеведение

Особым направлением а прикладной лингвистике является прикладное речеведение. Области его применения – автоматическое распознавание речи, синтез речи, идентификация говорящего по голосу и речи, диагностика лжи по речи и целый ряд других. Эта область знания охватывает целый ряд дисциплин: фонетику, психологию, физиологию акустику, социолингвистику, коммуникативную и когнитивную лингвистику и др. Принципиальная междисциплинарность области прикладного речеведения обусловлена исключительной сложностью объекта исследования и моделирования, каким является звучащая речь.

Анализ и синтез речи.

Устная речь представляет собой наиболее удобный и ес­тественный способ общения человека с компьютером, не требующий специального обучения. При этом используются не только все преимущества устного общения по сравнению с письменной речью (освобождаются руки, зрение, не нуж­ны специальные инструменты и освещение, применяются стандартные каналы связи, например, телефон), но и появ­ляются широкие возможности для гибкого взаимодействия с компьютером (без применения клавиатуры, "мыши", экрана монитора и т. д.). За последние 10—15 лет произошли замет­ные изменения в компьютерных технологиях синтеза и рас­познавания речи, обусловленные постоянно растущими воз­можностями компьютерной техники, совершенствованием математического аппарата и более глубоким пониманием ре­альных процессов порождения и понимания речи человеком.

К середине 90-х годов ученые перешли от исследований и ла­бораторных испытаний к промышленным разработкам. В ме­ждународной компьютерной сети Интернет собирается ин­формация о последних достижениях в сфере речевых техно­логий. Однако говорить о том, что с компьютером можно об­щаться так же, как мы общаемся друг с другом, пока нельзя. В каких же случаях "говорящие", "слышащие и понимающие человеческую речь" машины могут помочь человеку?

Области применения речевых технологий

В качестве главных стратегических направлений в раз­витии речевых технологий выделяются:

  • создание человеко-машинных интерфейсов с устным вводом/выводом информации;

  • речевое управление компьютером и другими техниче­скими устройствами (особенно в экстремальных, опасных для человека условиях);

  • организация информационно-справочной службы, по­зволяющей получать и выдавать различную информацию из базы данных в условиях, когда вопрос задается голосом (на
    транспорте, в медицине, банковской службе);

  • создание устройств для приема и озвучивания различ­ных сообщений, например, писем электронной почты по те­лефону;

  • многоязычный устный ввод/вывод речевой информа­ции с автоматическим переводом;

  • разработка приспособлений и компьютерных систем для помощи инвалидам (слепым, глухим, немым, парализо­ванным);

  • создание "автоматической машинистки" — машины, которая распознает произвольное речевое сообщение и за­писывает его в обычном текстовом виде;

  • озвучивание корректур и исправление орфографиче­ских ошибок;

  • помощь в обучении иностранному языку (автоматиче­ские фонетические тренажеры).

Речевые технологии используются также в более слож­ных системах искусственного интеллекта, воспроизводящих элементы порождения и понимания речи человеком.

Большое значение речевые технологии имеют и для на­учных исследований. Участвуя в создании систем автомати­ческого синтеза и распознавания речи, ученые имеют воз­можность проверить на практике правильность теоретиче­ских представлений об устройстве звукового механизма ре­чи и его отдельных частей (звуковой системы языка, рече-производящего механизма и механизма звукового воспри­ятия), выявить недостающие знания, слабую определенность используемых понятий и т. д.

Существенно также и то, что развитие речевых техно­логий требует совершенствования методов цифровой обра­ботки речевого сигнала, которые с успехом могут использо­ваться и в собственно научных целях в разных областях зна­ния: лингвистике, фонетике, физиологии слуха и речи. На­пример, высококачественные синтезаторы речи позволяют создавать речеподобные, близкие к естественным сигналы с точно задаваемыми и контролируемыми параметрами. Эта особенность синтезированной речи делает ее удобной и да­же необходимой для экспериментального изучения воспри­ятия речи человеком.

При разработке прикладных систем, работающих с уст­ной речью, возникают сложные и разноплановые проблемы, которые человек легко преодолевает в реальном языковом общении. Всё дело в том, что слуховое восприятие речи человеком является направленным, то есть навыки человека предоставляют возможность легко адаптироваться к любому акустическому фону и выделять из того акустического хаоса, который мы можем увидить при анализе звукового сигнала техническими средствами, полезную информацию в виде языковых знаков. Обучить такому машину оказалось исключительно сложной задачей, решаемой в настоящее время, притом, достаточно успешно, с одной стороны, за счёт большого количества накопленных знаний, с другой – за счёт введение некоторых ограничений на возможности системы автоматического распознанвания речи: ограниченное количество дикторов, либо ограниченная тематика. Задача синтеза речи оказалась несколько проще, но при этом оказалось необходимым учитывать, что тот акустический хаос, который можно увидить при анализе звукового сигнала, не является случайным, он имеет свою внутреннюю организацию, которая обеспечивает разборчивость речи, и нарушение этих законов приводит к снижению разборчивости и негативному восприятиу услышанного пользователем. В настоящее время основной сложностью синтеза речи является обеспечения «естественности» звучания синтезированной речи. В решении этих проблем участвуют ученые из раз­ных областей науки: лингвисты, физиологи, психологи, ма­тематики, инженеры, специалисты в области компьютерной науки.

Речеведение в криминалистике.

Одним их краеугольных вопросов прикладного речеведения является идентификация говорящего по устной речи. Идентификация говорящего — это процесс определения на основе характеристик речевого сигнала и речево­го потока в целом, принадлежит ли данное высказывание конкретному гово­рящему при условии выбора из п-стимулов, принадлежащих п-лицам. Из­вестно, что голоса и речь различных людей обычно отличаются друг от друга. Кроме того, помимо лингвистического сообщения голос и речь несут инфор­мацию о территориальной и социальной принадлежности говорящего, его эмоциональном состоянии, его отношении к собеседнику, высказыванию и ситуации в целом, о его физиологических, психических, психологических и интеллектуальных особенностях.

До середины 80-х гг. работа лингвистов сводилась в основном к идентификации говорящего по аудиозаписи. Однако в последние годы круг задач лингвистов значительно расширился и в настоя­щее время он включает целый ряд направлений:

  • анализ лингвистического материала с целью установления авторства, «портрет» говорящего и пишущего, анализ речи на орфографическом, фонолого-фонетическом, лексическом, синтактико-семантическом уров­нях в рамках высказывания и текста (дискурса);

  • интерпретация смысла слов, фраз, предложений и других спорных фраг­ментов в различного рода документах;

  • использование лингвистических доказательств в суде;

  • проведение исследования в рамках прикладной фонетики: слухового, аку­стического и лингвистического анализа речевого сигнала в целях иденти­фикации говорящего по голосу и речи.

В прикладном речеведении на данном этапе его развития в России и за рубежом можно выделить следующие основные направления в области теоре­тических и практических исследований:

• идентификация и верификация личности говорящего экспертом и автома­тической (полуавтоматической) системой;

  • объективность и субъективность методов идентификации;

  • автоматизация процесса идентификации и верификации;

  • процедура слухового опознания говорящего;

  • исследование факторов, оказывающих влияние на речевой сигнал (эмоциональное состояние, различные степени физического и психиче­ского напряжения, патология и наличие различных заболеваний и т. д.);

  • определение акустических характеристик речи говорящего (звуковой и просодико-интонационный аспекты);

  • установление подлинности (аутентичности) аудиозаписи и повышение качества звучания аудиоматериалов (фонограмм);

  • проблемы оценки показаний фонетистов-экспертов;

  • разработка методик и их практическое применение.

К числу активно разрабатываемых тем, помимо вышеперечисленных, можно отнести также различные виды произносительной маскировки, анализ спорных сегментов речи, идентификацию речевых расстройств, диалекталь­ный анализ речи, речь в состоянии интоксикации (алкогольной, наркотиче­ской, медикаментозной), имитируемую речь, анализ неречевых сегментов, влияние курения на идентифицируемый возраст говорящего, влияние различ­ных заболеваний на модификацию речевого сигнала, обнаружение фактов монтажа фонограммы и записи на различных устройствах звукозаписи (аналоговые способы, оцифровка и др.), возможность идентификации гово­рящего при переключении с одного языка на другой, влияние изменения стиля произношения на идентификацию говорящего, проблемы билингвизма и трилингвизма в криминалистической практике, организацию процесса иден­тификации говорящего, разработку базы фонетических данных, разработку автоматизированных и полуавтоматизированных систем идентификации лич­ности по голосу и речи, систем шумоочистки и т. д.

Сюда же примыкают такие направления исследований, как диагностика лжи, алкогольного и наркотического опьянения, стресса по речи, а также диагностика по речи различных заболеваний, но в отличие от тех направлений, о который шла речь ранее, данные направления пока не могут похвастаться широким практическим применением в сило недостаточной научтной разработанности и исключительной лсложности объекта исследования.



Скачать документ

Похожие документы:

  1. Программа вступительного испытания Магистерская программа «Теория обучения иностранным языкам и культур»

    Программа
    1.Требования ФГОС ВПО, оценка соответствия которым проводится на вступительном экзамене в магистратуру МГОУ по программе «Теория обучения иностранным языкам и межкультурная коммуникация»
  2. Заместитель Министра

    Документ
    Нормативный срок освоения основной образовательной программы подготовки "Лингвиста, преподавателя" "Лингвиста, переводчика" "Лингвиста, специалиста по межкультурному общению", реализуемых в рамках направления
  3. Русская компьютерная и квантитативная лингвистика Способы различения простого и сложного предложения при автоматическом анализе текстов

    Документ
    При автоматическом анализе текстов возможны случаи, когда возникают трудности в определении, является ли то или иное предложение сложным или простым с однородными членами.
  4. Программы и учебный план отделения теоретической и прикладной лингвистики Издательство Московского университета 2009

    Документ
    Отделение теоретической (структурной) и прикладной лингвистики существует на филологическом факультете МГУ с 1960 года. Впервые программы читаемых на этом отделении обязательных курсов были опубликованы в 1996 году1.
  5. Словарь лингвистических терминов

    Документ
    Словарь включает 5270 терминов и понятий лингвистики. Он адресован широкому кругу пользователей: студентам, аспирантам, преподавателям, научным работникам, специалистам разного профиля, изучающим, преподающим, исследующим язык.

Другие похожие документы..