Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Лекция'
На прошлой лекции мы рассмотрели методы решения проблемных ситуаций в рамках системного анализа. Одним из таких методов является создание и описание ...полностью>>
'Документ'
Джазовый вокалист. Польша 8 Пт 18-30 БЗ Юбилейный концерт В. Гуляевского Ансамбль «Вольница» 9 Сб 30 Вс 1 -00 БЗ Абонемент «Сказка за сказкой»....полностью>>
'Публичный отчет'
В течение 2009-2010 учебного года в Гуманитарном институте проводились «Большие поэтические переменки» под руководством д.ф.н., профессора Т.Н. Андре...полностью>>
'Программа дисциплины'
Уголовное право России – одна из профилирующих учебных дисциплин, усвоение которой является необходимым условием обучения студентов – юристов, их под...полностью>>

Ипм им. М. В. Келдыша ран

Главная > Документ
Сохрани ссылку в одной из сетей:

ИПМ им. М.В.Келдыша РАНЭлектронная библиотека

Препринт № 2 за 2011 г.

, , ,

О выборе автоматизированной информационной библиотечной системы
для библиотеки ИПМ

Рекомендуемая форма ссылки: Горбунов-Посадов М.М., Ермаков А.В., Луховицкая Э.С., Скорнякова Р.Ю. О выборе автоматизированной информационной библиотечной системы для библиотеки ИПМ // Препринты ИПМ им.М.В.Келдыша. 2011. № 2. 32 с. URL:

Ордена Ленина

Институт прикладной математики

имени М.В.Келдыша

Российской академии наук

М.М.Горбунов-Посадов, А.В.Ермаков,
Э.С.Луховицкая, Р.Ю.Скорнякова

О выборе автоматизированной информационной библиотечной системы для библиотеки ИПМ

Москва — 2011

Горбунов-Посадов М.М., Ермаков А.В., Луховицкая Э.С., Скорнякова Р.Ю.

О выборе автоматизированной информационной библиотечной системы для библиотеки ИПМ

Обосновывается выбор автоматизированной информационной библиотечной системы (АИБС) для библиотеки ИПМ им. М.В. Келдыша. Проведен анализ используемых в представленных на российском рынке АИБС технологий и баз данных, а также принципов хранения данных в этих базах. Выбор учитывает предстоящее в ближайшие годы изменение стандартов представления библиографических описаний.

Ключевые слова: информационная библиотечная система, АБИС, АИБС

Mikhail Mikhailovich Gorbunov-Possadov, Aleksey Viktorovich Ermakov, Engelina Solomonovna Lukhovitskaya, Rimma Yurevna Skornyakova

About the Choice of Automated Library Information System for the KIAM Library

Reasons for the choice of Automated Library Information System for the KIAM Library are given. Technologies and data storage principles used in ALIS’es presented in Russian market are analyzed. The choice takes in account the forthcoming changes in bibliographic standards.

Key words: library information system, LIS, MARC

Оглавление


1. Постановка задачи 6

2. Действующие стандарты каталогизации
и соответствующие им структуры
библиографических данных 8

3. Новые правила каталогизации, допускающие реляционную модель данных 11

4. Российские АИБС и их реализации.
Выбор системы для покупки 16

Введение

Важную роль как в научно-исследовательской работе, так и в преподавательской деятельности сотрудников ИПМ играла и играет научно-техническая библиотека. Ее каталог насчитывает более 100 000 наименований отечественной и зарубежной литературы.

Социально-экономические проблемы последнего двадцатилетия и произошедшая интернет-революция бросают нашей библиотеке целый ряд вызовов, на которые предстоит найти адекватный ответ.

Прежде всего, это доступность как библиотечного каталога, так и самого библиотечного фонда. Если раньше для сотрудников ИПМ при поиске нужной публикации выбор был ограничен поиском в институтской библиотеке и поиском в других библиотеках (БЕН, ГПНТБ и т.д.), то с развитием информационных технологий научные сотрудники все чаще при поиске необходимой информации направляют свои усилия в сферу интернета. Обращение к «бумажному» фонду обычно происходит лишь в случае неудачного поиска в сети (или в силу привычки). Такое бывает, особенно в фундаментальных областях. Но поиск в бумажном каталоге на фоне поиска при помощи электронных средств выглядит просто «каменным веком».

Кстати, существующий стереотип, утверждающий, что читателю не нужно ничего, кроме электронного каталога, не совсем верен. Современные информационные технологии предоставляют массу полезных средств для оперативного информирования читателей и о новых поступлениях, и о заказах по межбиблиотечному абонементу, и о работе библиотеки в целом (например, по организации электронной подписки). Более того, для каждого читателя может быть сформирован индивидуальный профиль его научных предпочтений, по которому он сможет получать актуальную информацию любым современным и удобным ему способом.

Реализация современного электронного каталога научно-технической библиотеки может идти по двум направлениям. Во-первых, большинство современных публикаций научные сотрудники готовят с помощью компьютера и легко могут передать их в библиотеку в электронном виде. Это могут быть статьи, монографии, препринты, авторефераты диссертаций и сами диссертации.

Это направление было поддержано в Институте более десяти лет назад в рамках проекта «Электронная библиотека ИПМ». В соответствии с приказом директора Института электронные версии всех препринтов размещаются на сайте Института в свободном доступе (/preprints/).

Второе направление — это создание и развитие электронного каталога «бумажного фонда» библиотеки ИПМ. Самостоятельная реализация такого проекта потребовала бы изучения «с нуля» библиотечных форматов и технологий, а также последующего отслеживания всех изменений в этой непростой области. Глубокое погружение в совершенно новую для нас предметную область потребовало бы слишком серьезных усилий. В то же время хотелось, чтобы создаваемый электронный каталог и вся электронная библиотека могли бы со временем адаптироваться к пожеланиям сотрудников Института.

1. Постановка задачи

В июне 2010 года перед нами была поставлена задача автоматизации деятельности библиотеки ИПМ. Автоматизация библиотеки может идти в двух направлениях:

1) организация информационной поддержки традиционных видов деятельности библиотеки: комплектования библиотечных фондов, ведения каталога, поиска книг через каталог и выдачи их читателям;

2) создание полнотекстовой электронной библиотеки путем сканирования имеющего библиотечного фонда и предоставления доступа к этому фонду через Интернет.

Первую задачу решают так называемые Автоматизированные Библиотечные Информационные Системы (АБИС), или (с другим порядком слов) Автоматизированные Информационные Библиотечные Системы (АИБС). Требования, предъявляемые к таким системам, изложены в работах [1], [2]. В частности, функциональная структура системы для обеспечения работы современной библиотеки должна включать:

• комплектование своих фондов;

• предметизацию и систематизацию фондов;

• каталогизацию фондов и обмен библиографическими записями с другими библиотеками;

• организацию хранения фондов;

• обслуживание читателей;

• межбиблиотечный абонемент.

Вторую задачу (сканирование всего фонда и предоставление доступа к нему через Интернет) решают системы, называемые Электронными Библиотеками (ЭБ). ЭБ и АИБС могут работать в библиотеке одновременно, при этом ЭБ может быть привязана к электронному каталогу, являющемуся частью АИБС. Задача создания полнотекстовой электронной библиотеки является весьма трудоемкой и финансово затратной. Услуги по созданию и наполнению электронной библиотеки вместе со стоимостью оборудования для сканирования оцениваются в десятки миллионов рублей. Поэтому на первом этапе было решено ограничиться только созданием или приобретением АИБС.

Не имея опыта разработки библиотечных систем, мы решили, что лучше купить готовую библиотечную систему. Рассуждали так. Если задача простая, то должны быть хорошие готовые решения. Если задача сложная и хороших решений нет, то опыт эксплуатации чужой системы будет полезен для создания в будущем собственных разработок.

При выборе системы мы стремились учитывать не только предоставляемый ею набор функциональных возможностей, но и используемые технологии, программное обеспечение, а также имеющуюся информацию о ее реализации. Хотелось, чтобы система была достаточно современной по используемым технологиям и программному обеспечению, чтобы работа ее была надежна и чтобы ее можно было легко расширять и модифицировать.

То, что качество реализации некоторых систем оставляет желать лучшего, можно было заключить из некоторых публикаций и отзывов в интернете, в частности из публикации [3] заведующего отделом автоматизации НТБ МАДИ. В ней был описан опыт эксплуатации системы «Библиотечная компьютерная сеть 5.3», разработанной в научной библиотеке МГУ, и были даны нелестные характеристики этой системе. И хотя эта система относится к предыдущему поколению библиотечных систем и использует морально устаревший DBF-формат для хранения данных, далеко не все недостатки системы, описанные в публикации [3], можно объяснить этими причинами. Очевидно, что имелись явные программистские недоработки, и самое главное из написанного, что произвело впечатление, — это то, что разработчики не пожелали выполнять обязательства по поддержке и обслуживанию программы: больше года их просили исправить ошибку, но они так этого и не сделали. Нам не хотелось бы оказаться в такой ситуации.

Разумеется, не имея исходного кода, невозможно составить полное заключение о качестве разработки. Однако для многих систем оказалось возможным получить информацию о принципах хранения и структуре данных. Некоторые разработчики предоставляли на своих сайтах демонстрационные версии, другие — документацию о структуре базы данных или ссылки на публикации, в которых описывались принципы хранения данных. База данных составляет основу системы. Клиентскую часть приложения можно изменять, не меняя структуры данных, а изменять структуру данных, не делая изменений в клиентской части, можно только при очень грамотно спроектированной работе с БД, например, если обращение к данным из клиентской части происходит только опосредованно через представления, хранимые процедуры и функции. Поэтому по качеству проектирования БД можно в значительной степени судить о качестве системы в целом, надежности ее работы, а также о возможности ее доработки и модификации.

C анализа структур данных предлагаемых АИБС, мы начали поиски системы для покупки. Вначале библиотечная система представлялась нам довольно простой: чем-то вроде складской, только проще, поскольку в библиотеке не может быть таких интенсивных потоков, как в крупной торговой или производственной организации, и нет необходимости отслеживать стоимость товаров в реальном времени. Представляя себе маленькую библиографическую карточку, мы считали, что число атрибутов библиографического описания не может быть очень большим, никак не больше сотни, поэтому нам казалось, что библиотечный каталог вполне мог бы быть реализован в рамках реляционной модели данных. Однако по мере знакомства с имеющимися на рынке АИБС, а также со стандартами, которым должны удовлетворять универсальные АИБС, наши первоначальные представления о том, что такое библиотечный каталог, и о его возможных реализациях претерпели существенные изменения.

2. Действующие стандарты каталогизации
и соответствующие им структуры
библиографических данных

Первые машинные библиотечные каталоги появились в середине прошлого века и хранились на ленточных носителях. В 1960 г. в библиотеке Конгресса США началась разработка первого стандарта для хранения и обмена библиографическими данными, и в 1965-66 гг. такой стандарт, основанный на правилах каталогизации, разработанных Американской ассоциацией библиотек, был создан. Он получил название MARC (MAchine-Readable Cataloging) [4], [5].

В процессе развития и использования формата в 1970-х годах появились более 20 его различных версий, ориентированных на национальные правила каталогизации (в том числе UKMARC, USMARC, AUSMARC, CANMARC, DanMARC, NorMARC, SwaMARC и др.). Для преодоления несовместимости этих форматов в 1977 г. Международной федерацией библиотечных ассоциаций IFLA был выпущен «Универсальный формат MARC» (Universal MARC Format, UNIMARC). Основой для стандарта UNIMARC послужили требования Международного стандарта библиографических описаний (International Standard Bibliographic Description, ISBD). Предполагалось, что этот формат должен стать посредником между любыми национальными версиями форматов MARC и, следовательно, обеспечивать конвертирование данных из национального формата в него, а из него — в другой национальный формат. В 1999 г. в результате согласования и последующего слияния библиографических форматов США и Канады (USMARC и CANMARC) было объявлено об образовании на их основе нового формата («Формата XXI века») — MARC21.

Таким образом, сейчас существует целое семейство форматов MARC и среди них два конкурирующих между собой ответвления UNIMARC и MARC21. UNIMARC поддерживается международной организацией IFLA и используется в основном в Европе и Азии. MARC21 поддерживается библиотекой Конгресса США и используется в основном в США и Канаде.

Одним из принципиальных отличий этих форматов является наличие в UNIMARC и отсутствие в MARC21 возможности делать ссылки из одной библиографической записи на другую и таким образом связывать между собой разноуровневые издания: том многотомника с самим многотомником, выпуск журнала с самим журналом, журнальную статью с выпуском журнала, в котором она опубликована. В MARC21 вся иерархия должна быть представлена в одной библиографической записи.

В 1998 году появился и российский вариант UNIMARC — RUSMARC [6], основанный на российских правилах каталогизации.

Если вначале MARC-форматы служили стандартами и для хранения библиографических записей, и для обмена ими, то в настоящий момент они являются только коммуникативными стандартами — стандартами файлового обмена библиографической информацией. Внутри АИБС данные могут храниться в любом виде, удобном разработчикам системы. Тем не менее, для того чтобы система могла обмениваться данными с другими системами, в ней должна быть предусмотрена возможность преобразования данных из внутренней структуры в MARC-формат и обратно. Поэтому АИБС, претендующая на универсальность, должна иметь структуру данных, логически эквивалентную MARC-формату.

За почти полвека существования и развития MARC-форматы претерпели ряд изменений, но основа, заложенная в 60-х годах прошлого века, когда еще не было ни реляционных баз данных, ни объектно-ориентированного программирования, не изменилась. Логическая структура стандарта описывается в терминах, обозначаемых числами полей, которые могут быть отмечены как периодические, и подполей, имеющих буквенно-цифровые обозначения, тоже единичных или периодических. Некоторые подполя отмечаются как «точки доступа». Они являются поисковыми атрибутами. Всего подполей насчитывается более тысячи, а множественных — несколько сотен.

Группа исследователей Университета северного Техаса под руководством Вильяма Моэна (William Moen) в 2005-2007 гг. проанализировала 56 миллиардов записей в формате MARC21, содержащихся во всемирном каталоге OCLC (Online Computer Library Center) [7], [8]. Оказалось, что 211 полей и 1596 подполей были использованы, по крайней мере, один раз, 7 полей встречались во всех записях, 14 полей встречались более чем в 80% случаев, 66% встречались менее чем в 1% случаев, поле под номером 656 встретилось ровно один раз. Нам неизвестно, проводились ли аналогичные исследования относительно записей в каком-либо из форматов семейства UNIMARC, однако можно предположить, что картина должна быть похожей: почти все поля и подполя используются, хотя значительная часть из них встречается редко.

Таким образом, формальное следование стандарту предполагает использование более тысячи атрибутов, среди которых сотни множественных. Из-за этого разложение структуры библиографического описания на реляционные составляющие должно насчитывать сотни таблиц, что делает использование реляционной модели неэффективным. Запрос на получение одного библиографического описания должен включать сотни операторов LEFT JOIN, а обработка одного библиографического описания (вставка или редактирование) должна осуществляться сотнями SQL-предложений. Тем самым теряется главное преимущество реляционной модели: легко формулируемые и быстро выполняемые запросы.

В конце 60-x годов прошлого столетия была разработана специализированная база данных CDS/ISIS (Computerised Documentation Service / Integrated Set of Information Systems) [9], которая с 1985 года развивается и поддерживается ЮНЕСКО. Основное назначение этой базы данных — ведение каталогов библиотек и музеев. База данных предназначена для хранения и поиска текстовых данных переменной длины. Структура этой базы данных, так же как и структура MARC-формата, описывается в терминах нумеруемых полей и подполей с буквенно-цифровыми обозначениями. Разнообразные методы индексирования, включая создание индексов по ключевым словам, дают возможности для различных вариантов текстового поиска. В настоящее время существует версия этой базы и для Windows — WINISIS. В работе [10] приводятся аргументы в пользу использования этой специализированной СУБД и указываются ее преимущества по сравнению с реляционными СУБД. Работа была написана в 2001г., и в связи с появлением дополнительных возможностей в реляционных СУБД и снятием в них некоторых ограничений часть из этих аргументов отпала. Главным аргументом, на наш взгляд, остается то, что база данных распространяется бесплатно. Но это имеет и оборотную сторону. Поскольку финансовые возможности ЮНЕСКО гораздо слабее возможностей фирм, разрабатывающих коммерческие СУБД, пакеты для создания прикладного программного обеспечения для баз данных из семейства ISIS содержат существенно меньше возможностей, чем пакеты для создания прикладного программного обеспечения для коммерческих СУБД. В настоящее время семейство баз данных ISIS предназначается главным образом для развивающихся стран.

Еще одна возможность для хранения библиографических данных — это использование коммерческих нереляционных СУБД, например, довольно мощной СУБД ADABAS [11], существующей с 1969 года, поддерживаемой и развиваемой немецкой фирмой Software AG. Эта СУБД реализует модель данных NF2 — не первая нормальная форма. Запись в такой модели может содержать множественные поля и периодические группы, что близко к логической структуре MARC-формата. На сегодняшний день, пожалуй, выбор такой СУБД для хранения библиографических данных является оптимальным. Однако тенденции в мире баз данных таковы, что реляционные СУБД, такие как ORACLE, DB2 и Microsoft SQL Server, расширив возможности реляционной модели добавлением поддержки XML-структур, полнотекстового поиска и т.п., постепенно вытесняют с рынка базы данных, основанные на других моделях, и будущее таких баз данных, как ADABAS, находится под вопросом.

Таким образом, на сегодняшний день для MARC-совместимой библиотечной системы имеется три возможности:

1) использовать современную коммерческую реляционную базу данных, но не вполне по назначению — без реляционной модели;

2) использовать довольно слабую по программистским возможностям специализированную СУБД из семейства ISIS;

3) использовать морально устаревшую коммерческую нереляционную СУБД.

Поэтому задача, которую мы поставили перед собой вначале, — найти универсальную АИБС, одновременно и хорошо спроектированную, и использующую современные технологии и ПО — оказалась нереализуемой.



Скачать документ

Похожие документы:

  1. Н. С. Келлин (ипм им. М. В. Келдыша ран) > Г. В. Носовский (мгу им. М. В. Ломоносова) > А. Т. Фоменко (мгу им. М. В. Ломоносова) еще одно применение авторского ин

    Документ
    Для понимания проблемы необходимо вспомнить о некоторых деталях сегодня уже почти забытой борьбы, которая велась в XVIII веке в академических кругах вокруг отечественной истории.
  2. В. К. Смирнов Аппаратная реализация языка Рефал в ипм им. М. В. Келдыша

    Документ
    Описана история создания процессора обработки текстовой информации ЕС-2702, являющегося специализированным процессором, ориентированным на решение задач, требующих обработки больших массивов информации, представленных в символьной форме.
  3. Г. Г. Малинецкий Институт прикладной математики им. М. В. Келдыша ран

    Документ
    Выступление на конференции Нанотехнологического общества России «Развитие нанотехнологического проекта в России: состояние и перспективы», 09.10.2009.
  4. Ордена Ленина институт прикладной математики им. М. В. Келдыша Российской Академии Наук (1)

    Реферат
    В работе обсуждаются пpоблемы разработки и реализации человеко-машинного интерфейса. Описывается интерфейс пользователя, предназначенный для облегчения подготовки и исполнения прикладных программ на параллельных вычислительных системах в среде Интернет.
  5. В. В. Ивашкин Институт прикладной математики имени М. В. Келдыша ран 125047, Москва, Миусская пл., 4 тел. (495)2507826, e-mail: Ivashkin@Keldysh ru Введение. Вдоклад

    Доклад
    Введение. В докладе дан обзор работ по лунным траекториям (ЛТ) космического аппарата (КА) – от пионерских работ 1950-х гг. (Егоров В.А., Охоцимский Д.

Другие похожие документы..