Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Литература'
Я вас любил: любовь еще, быть может, В душе моей угасла не совсем; Но пусть она вас больше не тревожит; Я не хочу печалить вас ничем. Я вас любил безм...полностью>>
'Программа'
Называть даты важнейших событий; локализовать исторические факты на карте, читать и использовать ее информацию в ответах на вопросы, проводить поиск н...полностью>>
'Документ'
Досліджено роль інтелектуального капіталу у формуванні інноваційної економічної системи. Автором уточнено та поглиблено сутність, функції і структуру...полностью>>
'Конкурс'
- выявления и награждения наиболее талантливых спортсменов и специалистов в области физической культуры и спорта, чья профессиональная деятельность п...полностью>>

V. I. Среди текстовых лингвистических процессоров, задачей ко­торых является автоматизированная или полностью автоматиче­ская обработка текстов, различают грамматические, лексические и семантические процессоры. В их задачу входит решение

Главная > Решение
Сохрани ссылку в одной из сетей:

Потапова Р. К. Новые информационные технологии и лингвистика. М., 2002

ГЛАВА V. ГИПЕРТЕКСТ В ПОМОЩЬ ЛИНГВИСТУ

V.I. Среди текстовых лингвистических процессоров, задачей ко­торых является автоматизированная или полностью автоматиче­ская обработка текстов, различают грамматические, лексические и семантические процессоры. В их задачу входит решение различ­ных проблем обработки текста: автоматический перевод; коррек­ция орфографии, грамматики и стиля; автоматическая компрессия текстов для автоматического реферирования, индексирования на­учно-технических и экономических текстов, кодирования и деко­дирования текстовой информации; порождение и понимание тек­ста, анализ связного текста. Помимо этих традиционных тексто­вых процессоров все более актуальными становятся гипертексто­вые системы.

В данной главе рассматриваются история создания и эво­люции гипертекстовых систем, понятие гипертекста и его роль в изменении традиционной письменной коммуникации: изменение понятий «автор» и «читатель», «чтение» и «письмо», проблемы навигации в пространстве гипертекста, виды и области применения гипертекстовых систем, а также конкретные гипертекстовые сис­темы, находящиеся в данный момент на стадии разработки, и пер­спективы развития гипертекстовых технологий. В качестве приме­ра отечественных методов разработки гипертекстовых систем можно назвать метод логико-смыслового моделирования, разработанного Р.С.Гиляревским и М.М.Субботиным. Рассматриваются также отечественные исследования в области анализа текста, которые кажутся на первый взгляд не связанными с проблематикой ги­пертекста, поскольку практически не используются при создании гипертекстовых систем, однако эффективность обработки текста в гипертекстовых системах с различными целями может с их приме­нением возрасти.

В настоящее время гипертекст получил уже достаточно широкое распространение. В учебных заведениях и корпорациях, библиотеках и конторах адвокатов, конструкторских бюро, науч­ных лабораториях и музеях, наконец, в компьютерах индивидуаль­но пишущих и читающих людей.

Проблематика гипертекста включает две резко контрасти­рующие по содержанию части. С одной стороны, речь идет о фор­ме представления текстового материала, о его нелинейной орга­низации, о его элементах, о характере взаимосвязи между ними, о том, как он осваивается (читается) и как формируется содержание в нелинейной форме. В этом аспекте гипертекст рассматривается в соотнесении с традиционным, «линейным» письменным текстом как новая форма письменной коммуникации, меняющая традици­онные понятия «автор и читатель», «чтение и письмо». С другой стороны, проблематика гипертекста включает вопросы технологии, которая обеспечивает, делает возможным представление и освое­ние больших объемов текстового материала в нелинейной форме. В гипертексте технологический процесс играет гораздо более важ­ную роль, чем в традиционной практике чтения и письма. В этом аспекте гипертекст - это новая компьютерная (информационная) технология, рассматриваемая как с точки зрения своих информационных особенностей, так и с точки зрения тех новых возможностей, которые она открывает по сравнению с другими информаци­онными технологиями.

Немного из истории создания гипертекста: бывший советник по науке президента США Ф. Рузвельта В.Буш в статье «As we may think», опубликованной в журнале «The Atlantic Monthly» в 1945 году, описал настольный аппарат, который он назвал Меmех. Это прибор, в котором человек хранит все свои книги, записи, со­общения, быстродействующий и удобный в обращении. Управляе­мый с помощью ручек, кнопок и клавиатуры и основанный на тех­нологии микрофильмирования, этот прибор представляет собой механическую модель компьютера как средства воспроизведения и отображения информации. Более того, пользователь мог делать пометки и комментарии на полях гак, словно перед ним была стра­ница книги или журнала. Идея та же, что и в «виртуальном» тексте. Суть замысла заключалась в возможности Меmех устанавливать ассоциативные связи между текстами. Автор представлял его как систему, которая работает так же, как работает человеческий мозг.

То, что описал В. Буш, сегодня известно как гипертекст - это слово впервые ввел в обращение Т. Нельсон (США) в 60-х гг. Из объяснения, данного Нельсоном в 1981 году, следует, что он имел в виду непоследовательное письмо, то есть текст, который разветвляется как набор отдельных кусков, объединенных связями, позволяющими читателю выбирать различные пути движения. Не­смотря на то, что Т. Нельсон основывался на концепции В. Буша, он предсказал ее актуализацию в новых условиях электронных средств. В гипертексте и гипермедиа (слово, которое он также ввел) он получил основу для нового типа печатных средств, типа, который мог бы изменить способ производства и распространения книг и других текстов.

Понятие гипертекста радикально изменило концептуаль­ный ландшафт, который теперь следует понимать как фундамен­тально определяемый компьютерными и электронными сетями.

Многие полагают, что гипертекст является существенной характеристикой новых средств. Его особенностью является отсут­ствие централизованности и иерархии. В пространстве гипертек­ста все объекты обладают равной значимостью и в равной сте­пени доступны пользователю. Центральным персонажем являет­ся пользователь-читатель.

Итак, гипертекст - это соединение смысловой структуры, структуры внутренних связей некоего содержания и технической среды, технических средств, дающих человеку возможность осваи­вать структуру смысловых связей, осуществлять переходы между взаимосвязанными элементами.

У гипертекста наиболее общие функции те же, что и у тра­диционного письменного текста - быть носителем отделенною от индивида, «экстериоризованного», вынесенного во вне словесно выраженного содержания (мыслей, знаний и т.п.).

Гипертекст может нести представленное в нем кем-то со­держание для сообщения его, передачи другим людям. Это собственно непосредственно коммуникативная функция. Гипертекст в этой функции предназначен для чтения - такого чтения, при котором постоянно совершаются переходы между элементами, состав­ными частями читаемого материала. Такой гипертекст может пред­назначаться для многих читателей, может тиражироваться и в этом смысле подобен книге.

Гипертекст может фиксировать содержание и для того, чтобы предъявлять его самому автору (чтобы автор, вновь обра­тившись к созданному содержанию, мог его изменить, усовершен­ствовать, развить). В этой функции гипертекст подобен черновику, но в отличие от обычного черновика он фиксирует не только сами по себе мысли, но и их взаимосвязи.

Гипертекст может также фиксировать содержание, созда­ваемое многими авторами в ходе совместной работы. Это - адек­ватная форма, адекватное средство для соотнесения, представления во взаимосвязи содержания, создаваемого разными людьми, и для рассмотрения его с точки зрения единства, целостности. В этой функции у гипертекста нет прямого аналога.

Наконец, гипертекст может представлять собой открытую, наращиваемую систему взаимосвязанных по смыслу текстовых элементов, независимо от их происхождения, от принадлежности их тем или иным авторам. В таком гипертексте человек может «странствовать» или, как стало принято говорить, осуществлять «навигацию», открывая для себя новое, нетривиальное, неожидан­ное.

Говоря об отечественных методах анализа связного текста, следует дать краткое изложение метода сетевого моделирования текста. Данный метод исследования основывается на построении семантических сетей, моделирующих смысловую сторону лексики и текста. Сетевое моделирование текста включает три основные операции: выявление семантических связей между элементами тек­ста, их представление в удобной для дальнейших исследований форме и установление (с использованием этого представления) за­кономерностей, характеризующих изучаемый объект.

Элементами системы семантических связей в тексте могут быть различные текстовые единицы: слова, предложения, абзацы. Таким образом, в тексте можно рассматривать три системы, основ­ными элементами которых являются три главнейшие текстовые единицы: слова, предложения и абзацы. Все они образуют план содержания текста с различной степенью детализации. Семантиче­ская связь между единицами текста отражает связь между соответ­ствующими денотатами. Если денотатом слова является предмет, то денотатом предложения - ситуация. Хотя связный текст строит­ся с установкой на описание некоторой картины внешнего мира, законы его построения носят языковой характер. Они определяют­ся спецификой того инструмента, с помощью которого формирует­ся текст, то есть языка. Поэтому и анализ семантических связей в тексте должен опираться, главным образом, на лингвистические категории. Для выявления семантической связи между словами не­обходим простейший синтаксический анализ, устанавливающий наличие предикативных и непредикативных связей между словами текста. Формальный критерий семантической связи между пред­ложениями должен опираться на некоторые содержательные пред­ставления о том, что понимать под семантической связью. Семантически связанными считаются такие предложения, денотаты кото­рых, то есть ситуации, описанные этими предложениями, связаны на предметном уровне, что позволяет рассматривать их как компо­ненты единой более общей обширной ситуации.

Способ представления текстуальных семантических связей должен обеспечивать получение такой модели (приближенного описания) плана содержания текста, на базе которой можно было бы решать следующие теоретические и прикладные задачи: типо­логическое исследование текстов, анализ семантической структуры и семантических связей текстов (он может использоваться и при автоматическом создании и модифицировании гипертекстов), соз­дание методов семантического анализа текстов в связи с автомати­ческим реферированием, индексированием и экстрагированием (извлечением из текста фотографической информации) и т.д. В ка­честве изображения системы семантических связей и семантиче­ской структуры текста принимается граф, вершинами которого яв­ляются единицы текста, а ребрами - семантические отношения ме­жду ними.

Особую роль в исследовании текста играет изучение меха­низма межфразовых связей. Экспериментальные данные позволяют сделать следующие выводы:

1. Зона межфразовых связей предложения в тексте не ограничи­вается его ближайшим окружением. Предложения, непосред­ственно связанные семантически с некоторым случайно вы­бранным предложением, могут находиться практически в лю­бой точке текста.

2. Предложения, семантически связанные с некоторым случайно

выбранным предложением, распределены по тексту сравни­тельно равномерно.

3. В непосредственной окрестности случайно выбранного предложения наблюдается незначительная концентрация его меж­фразовых связей.

Одним из основных параметров, характеризующих план содержания текста, является его семантическая связность. В каче­стве критерия семантической связи между предложениями прини­мается повторение одних и тех же существительных при условии замены личных местоимений их антецедентами. Семантическая связность текста увеличивается по мере его специализации, суже­ния круга читателей, на которых он рассчитан.

Лексическое значение слова - наименьший элемент семан­тической структуры текста. Слово выступает в качестве основного компонента всех более крупных единиц текста: синтагм (предика­тивных и непредикативных), предложений, абзацев, параграфов. Каждая единица представляет собой определенного рода сочетание единиц низшего уровня. Значение каждой из этих единиц может рассматриваться как элемент семантической структуры текста. От­сюда следует, что семантическая структура текста включает не­сколько уровней, соответствующих указанным элементам, и адек­ватное описание этой структуры должно отразить ее многоуровневость. Анализ семантической структуры текста, учитывающей ее многоуровневость, включает несколько этапов. На каждом из них выделяются наиболее крупные элементы - «непосредственные семантические составляющие» - анализируемого уровня, устанавли­ваются связи между этими элементами и определяется тип семан­тической структуры рассматриваемого уровня (текста в целом или абзаца). Рассмотренные принципы классификации семантической структуры текста распространяются также на классификацию лю­бого уровня этой структуры в терминах единиц низшего уровня.

При анализе семантической структуры текста по названным выше трем уровням тип семантической структуры высшего уровня (текста в целом) определяется семантическими связями между аб­зацами, а тип семантической структуры среднего уровня (абзаца) -семантическими связями между предложениями. Для определения типа семантической структуры текста по семантической связи строится поабзацная семантическая сеть. Вершины этой сети соот­ветствуют абзацам (или формальным фрагментам), а ребра - се­мантическим отношениям между абзацами. Критерий семантиче­ской связи между абзацами - наличие семантической связи между предложениями, входящими в эти абзацы. Форма поабзацной се­мантической сети позволяет определить тип семантической струк­туры так же, как форма пофразной сети позволяет определить тип семантической структуры абзаца (или всего короткого текста).

Предложение, абзац и параграф представляют собой отрез­ки текста, то есть последовательности контактирующих единиц низшего уровня соответственно слов, предложений, абзацев. В со­ответствии с этим предложение, абзац и параграф можно считать линейными единицами текста. Результат анализа многоуровневой семантической структуры текста по линейным единицам может быть представлен в форме графа, у которого некоторые вершины в свою очередь являются графами, описывающими единицу низшего уровня. В таком графе каждая вершина соответствует линейной единице того или иного уровня.

К выделению единиц текста, а следовательно, и элементов семантической структуры, можно подойти и с иной точки зрения. Пословная семантическая сеть с некоторыми упрощениями переда­ет содержание текста. Следовательно, она может рассматриваться как своеобразный текст, который в отличие от текста на естествен­ном языке представляет собой нелинейную систему. Пофразную семантическую сеть можно так же рассматривать, как нелинейный текст, записанный на «языке», единицами которого являются не слова, а предложения.

Описанный подход анализа и представления плана содер­жания связного текста может применяться при автоматическом ин­дексировании и реферировании текстов. Он может также приме­няться при автоматическом анализе плана содержания текстов во время создания и модификации гипертекстовых систем и, следова­тельно, для автоматической генерации семантических связей меж­ду текстами - фрагментами гипертекста.

Для гипертекста как ветвящегося (нелинейного) текста ха­рактерны следующие признаки:

1. Нелинейность

Наиболее характерная черта гипертекста состоит в том, что образующий его текстовый материал не выстроен, подобно обычному тексту, в единую линейную последовательность, а организо­ван более сложным образом.

Гипертекст - это нелинейно организованный текст, текст с нелинейной структурой. Элементами этой структуры являются обычные линейные, то есть читаемые подряд тексты (или фрагмен­ты текстов). Нелинейность означает, что после прочтения каждого из них текст как бы ветвится: для дальнейшего чтения читателю предлагаются на выбор несколько возможных продолжений.

2. Переходы в нелинейном тексте

В линейном тексте, читаемом подряд, нет необходимости специально указывать, что после прочитанного фрагмента (раздела и т.п.) надо читать непосредственно примыкающий к нему сле­дующий фрагмент. Другими словами, линейный текст в принципе непрерывен, он не предполагает остановки в чтении для выбора «что читать дальше»? Но если возможны варианты продолжения читаемого материала, то текст становится в принципе дискретным, расчлененным на некоторые «кванты» - фрагменты, внутри кото­рых текст читается подряд. Границей каждого такого фрагмента является место, где читатель делает выбор в отношении дальней­шего маршрута чтения (место ветвления). Здесь прерывается чте­ние текста подряд, и читатель совершает скачкообразный переход к другому фрагменту - в другой элемент гипертекста.

3. Структурные элементы гипертекста

Элементами гипертекста могут быть письменные тексты любого объема: литературные произведения, монографии, статьи (либо их фрагменты). Это могут быть тексты, уже существовавшие в традиционной книжной форме, тексты, специально написанные для гипертекстового представления - наброски, записи отдельных мыслей. Становясь элементами гипертекста, все эти отдельные тек­сты входят в некоторую надструктуру, образуют некоторую еди­ную систему.

В традиционном тексте его отдельные структурные элемен­ты (разделы, абзацы) также образуют некоторую единую систему. Однако в этой системе все элементы жестко упорядочены с точки зрения последовательности их чтения. Элементы, как правило, не существовали до данного текста, вне его. Они возникают как части данного текста и несут на себе отпечаток несамостоятельности, подчиненности единому замыслу, целостности единого текста.

Элементы же гипертекста - достаточно автономные обра­зования, которые существовали или во всяком случае могут суще­ствовать вне его. Благодаря этой автономности они могут вклю­чаться в разные смысловые ряды, читаться в разной последова­тельности.

4. Система переходов между структурными элементами гипер­текста

Система переходов в гипертексте - это, с одной стороны, смысловая структура, система смысловых взаимосвязей соответст­вующих текстов (фрагментов). С другой стороны, это структура, в которой каждой смысловой связи соответствует технически обу­словленная возможность перейти от текста к тексту, то есть непо­средственно вызвать для чтения текст, связанный с читаемым в данный момент. Создание гипертекста состоит, прежде всего, в формировании этой системы переходов. Когда читатель гипертек­ста приступает к чтению, он имеет дело с некоторой наличной структурой гипертекста. В процессе чтения он может совершить переход от какого-либо фрагмента не к любому другому, а лишь к некоторым, для которых эта возможность создана при формирова­нии гипертекста. Возможность перехода создается в тех случаях, когда фрагменты связаны по содержанию.

Характер этой связи может быть различным: переход может быть между текстом и комментарием к нему, между разными ре­дакциями текста, между текстом и его возможными продолжения­ми, между текстами, «отвечающими» или «возражающими» друг другу, между текстами, пересекающимися, перекликающимися или созвучными по содержанию.

A C G J

D K

E L

M

Mapшруты путешествия по гипертексту:

A> С —> G —> М - маршрут, выбранный читателем

A — > Е —>• G —> М - один из многих других возможных маршрутов

5. Визуальное представление структуры гипертекста

Большие и сложные системы переходов между текстами, то есть реальные гипертексты, используемые на практике в различных формах интеллектуальной деятельности, могут быть продемонстрированы только посредством компьютеров. Вместе с тем пред­ставление о системе переходов между элементами гипертекста как смысловой структуре можно получить, изобразив ее в виде сети. Если речь идет о реальных, «рабочих», а не чисто демонстрацион­ных гипертекстах, то полностью изобразить на бумаге их структу­ру невозможно. Однако можно изобразить либо какую-то локаль­ную часть этой структуры, либо выделенные по какому-либо осно­ванию узлы и связи.

Многие гипертекстовые системы дают возможность полу­чать такого рода изображения обобщенной (каркасной) структуры гипертекста или ее локального участка на экране компьютера. При этом часто используют цвет, форму, размеры и другие особенности изображения узлов и соединяющих линий, если существенно раз­личать виды соответствующих текстов и типы их связей. Элемент гипертекстовой системы, обеспечивающий построение таких изо­бражений и дающий возможность ориентироваться в структуре гипертекста, называют «графическим браузером».

В сети, изображающей гипертекст, узлам соответствуют элементы гипертекста, то есть обычные тексты, а соединяющим эти узлы линиям - переходы между текстами. Обычно пет возмож­ности поместить полные тексты рядом с соответствующими узлами сети, поэтому около узлов помещаются либо заголовки текстов, либо их кодовые обозначения (например, порядковый номер текста в каталоге или в списке текстов). Наличие перехода только в одну сторону изображается линией со стрелкой на конце. Если переход возможен в обе стороны, стрелки обычно не используются.

Гипертекстовая коммуникация обладает рядом специфи­ческих черт. С появлением печатной технологии понятие «автор» изменилось. Точно так же оно изменится и в новой среде электрон­ных сетей, где центральной фигурой является не создатель, а пользователь, управляющий содержанием, Используя гипертек­стовые связи, каждый пользователь выбирает нужную именно ему информацию и, таким образом, творит свою «книгу», существую­щую только в кибернетическом пространстве и исчезающую после прочтения.

1. Роль автора гипертекста

При создании гипертекста для потенциального читателя создаются возможности перехода между элементами этого гипер­текста («линейными» текстами). Сама возможность перехода, то есть предъявления читателю по его вызову соответствующего тек­ста, обеспечивается техническими средствами. Однако между ка­кими именно текстами должны быть переходы - это решает новый, прежде не существовавший персонаж процесса письменной ком­муникации - автор гипертекста. Отдельные линейные тексты, между которыми создаются переходы, могут принадлежать разным авторам. Автором всех или некоторых из них может быть и автор гипертекста. Но в общем случае вклад автора гипертекста состоит в указании переходов между текстами, в определении системы этих переходов. Тем самым создается гипертекст как целостное образо­вание.

Конечно, вклад автора гипертекста может проявляться так­же в подборе линейных текстов для включения в гипертекст. Но далеко не всегда практикуется «индивидуальный подход» к подбо­ру текстов. Пожалуй, чаще принимается некий принцип, исходя из которого тексты включаются в гипертекст, например тексты из оп­ределенных изданий, по определенной тематике и т.п.

При установлении переходов автор может опираться на различные основания. Он может исходить из собственного пони­мания содержания текстов и их смысловых связей. Он может также основываться на некотором более или менее общепринятом зна­нии, на сложившихся устойчивых ассоциациях. Наконец, он может принять некоторые критерии, некоторые правила для установления переходов, которые, в свою очередь, могут носить более содержа­тельный или более формальный характер. Например, основанием для перехода между двумя текстами может служить определенная общность их содержания, которая проявляется в некотором коли­честве общих для обоих текстов «ключевых слов».

Автор линейного текста однозначно задает последователь­ность чтения образующих этот текст элементов - разделов, глав, абзацев. Гипертекст всегда содержит различные маршруты чтения, но разнообразие этих маршрутов зависит от автора гипертекста. Хотя связи в гипертексте отражают семантическую близость соот­ветствующих текстовых фрагментов, однако они не носят строгою характера, а в значительной степени свободно устанавливаются автором с учетом особенностей предполагаемого использования гипертекста. Например, чтобы не усложнять процесс чтения гипер­текста, автор может не устанавливать некоторые семантически до­пустимые связи.



Скачать документ

Похожие документы:

  1. Российской Федерации «иноцентр (Информация. Наука. Образование)»

    Документ
    Данное издание осуществлено в рамках программы «Межрегиональные исследования в общественных науках», реализуемой совместно Министерством образования и науки РФ, «ИНОЦЕНТРом (Информация.
  2. А. Н. Баранов Введение в прикладную лингвистику ббк 81я73 Издание осуществлено при поддержке Института «Открытое общество» (Фонд Сороса) в рамках конкурс

    Конкурс
    Издание осуществлено при поддержке Института «Открытое общество» (Фонд Сороса) в рамках конкурса «Новая учебная литература по лингвистике и литературоведению».
  3. Р. С. Гиляревский основы информатики курс лекций

    Курс лекций
    Лекции рассчитаны на студентов высших учебных заведений. Цель курса лекций – дать студентам представление о современной ин­форматике как научной дисциплине и теоретической основе информационной технологии, познакомить их с основными

Другие похожие документы..