Системы построения электронных библиотек GREENSTONE, DSpace и EPrints: сравнительный анализ.

Обзор подготовила А. В. Черноносова, гл. библиотекарь.

 

Характеристики инструментальных средств

Функциональные возможности

DSpace

EPrints

Greenstone

Источники

 

Характеристики инструментальных средств

 

Greenstone

LibOnline 1.0

ИРБИС

EPrints

АБИС Virtua

ИСХИ-М

Лицензия

Свободная

Платная

Платная

Свободная

Платная

Платная

Платформа

Unix,

Windows

Windows

Windows

Unix, Linux

Windows Linux

Unix, Linux, Windows

Web-сервер

Любой

Microsoft IIS 5.0 или выше

Apache WebSite,

Microsoft IIS

Apache

Любой

Apache

СУБД

Microsoft SQL Server

IR- Explain-1

MySQL

Oracle

MySQL

Сетевая версия

Да

Да

Да

Да

Да

Да

Удаленное администри-рование

Да

Да

Да

Да

Да

Да

Открытый код

Да

Нет

Да

Да

Нет

Да

Стоимость (примерная)

бесплатная

неизвестно

185000

бесплатная

720000

100000

 

Функциональные возможности

 

GreenStone

LibOnline 1.0

ИРБИС

EPrints

АБИС Virtua

ИСХИ-М

Форматы документов

Любые

PDF

PDF, DOC, HTML, TXT

Любые

Любые

Любые

Полнотекс-товый поиск

Да

Да

Да

Да

Да

Да

Поиск по метаданным

Да

Да

Да

Да

Да

Да

Просмотр по метаданным

Да

Нет

Да

Да

Да

Да

Настройка интерфейсов пользователей

Макросы

Нет

Перевод на другие языки

Перевод на другие языки

Нет

Да

Политика безопасности

Авторизация пользователей

Авторизация пользователей

Авторизация пользователей

Авторизация пользователей

Авторизация пользователей

Авторизация пользователей

 

 

DSpace, EPrints, Greenstone - популярные свободно распространяемые системы построения электронных библиотек.

Их можно разделить на два класса следующим образом:

- Для институциональных депозитариев (Dspace, Eprint),

- Для создания ЭБ (Greenstone).

 

EPrints имеет много сходства с DSpace, но оптимизирована так, чтобы обеспечить доступ к самостоятельному депонированию (внесению) автором материалов (статей, отчетов, книг и пр.), в то время как DSpace обеспечивает платформу, для долгосрочного хранения цифровых материалов, используемых в академических исследованиях.

DSpace

DSpace функционирует как централизованный сервис организации. Разные подразделения в пределах учреждения (лаборатории, центры, школы или отделы) могут иметь свои собственные отдельные области в пределах системы. Члены этих подразделений непосредственно вносят контент через веб-интерфейс пользователя, который разработан так, что внесение осуществляется максимально просто. Альтернативно система предусматривает импорт множества элементов для пакетной загрузки контента. В каждом подразделении можно также назначить людей, которые могут просматривать и редактировать внесения перед тем, как они будут включены в основной репозиторий. Затем DSpace индексирует метаданные, поступившие вместе с электронным документом, и делает их доступными согласно привилегиям доступа, определенным в данном подразделении.

Многие функции DSpace, например, просмотр и поиск документов в системе, могут выполняться анонимно, но чтобы выполнить внесение документов пользователю нужно зарегистрироваться.

О каждом пользователе DSpace хранит следующую информацию:

- адрес электронной почты;

- фамилию и имя;

- пароль;

- список коллекций, относительно которых пользователь уведомляется о новых поступлениях;

- признак саморегистрации, т.е. создана ли была учетная запись пользователя автоматически системой, например в результате обращения к администратору.

DSpace обладает более продвинутой системой прав пользователя по сравнению

с аналогичными библиотечными системами (например, EPrints), тесно связанной с применяемой моделью данных. Выделены такие группы пользователей: депоненты, администраторы, участники процесса депонирования, подписчики и пользователи с разрешением просматривать не общедоступные элементы.

Поиск и просмотр. DSpace позволяет конечным пользователям обнаруживать контент множеством способов:

- по внешней ссылке, например, дескриптору (Handle);

- поиск по одному или нескольким ключевым словам в метаданных или извлеченном полном тексте;

- просмотр по индексам названия, автору, дате и предметной теме.

Индексы поиска конфигурируемы, что позволяет организациям настраивать индексируемые поля метаданных. Система предоставляет простой и расширенный поиск.

 

EPrints

Процесс наполнения библиотеки проходит в несколько этапов. Все операции осуществляются через Web-интерфейс. Вносить электронные документы может только зарегистрированный пользователь.

Eprints выделяет 3 группы пользователей: обыкновенные пользователи, редакторы и администраторы. В зависимости от типа зарегистрированного пользователя данная станица будет иметь разный вид, соответственно предоставляя меньше или больше сервисов. Для доступа к странице пользователя нужно ввести имя (username) и пароль (password).

При помощи Web-интерфейса администратор может выполнять следующие действия: подписка на последние введенные записи; установка пароля доступа; ввод записей; изменения адреса электронной почты; просмотр статуса архива; редактирование архива; внутрисистемный поиск; редактирование предметного классификатора; редактирование записей пользователей.

Пользователь, работающий с правами редактора, может просматривать редакционный буфер, при необходимости вносить туда изменения, а также может возвращать запись на доработку, высылая при этом по электронной почте замечания по внесенной записи. Только после одобрения редактором будет возможен доступ к записи широкому кругупользователей библиотеки.

Обычный пользователь может вводить запись в архив Eprints на своей странице. При создании новой записи пользователю нужно указать тип документа. Это необходимо для дальнейшего формирования метаданных. Как только соответствующие метаданные будут заполнены, запись перемещается в редакционный буфер, где он перебывает до того времени, пока его обработает редактор.

После создания нового архива можно задать дополнительные настройки, относящиеся к многоязычной поддержке, метаданным, интерфейсу электронной библиотеки.

Поиск. Сервис поиска Eprints индексирует все имеющиеся файлы во всех архивах, что позволяет реализовать базовый (simple search) и расширенный (advanced search) поиск Базовый поиск дает возможность выполнять запрос по основным группам метаданных таким как «автор/описание/создатель/дата», «текст/название/описание/автор/создатель/дата», и «автор/создатель/редактор» и «дата». Причем вывод результата поиска можно отсортировать по «году издания», «автору» или «названию».

Расширенный поиск в отличие от базового дает возможность выполнить запрос по отдельным данным, например, «полнотекстовый поиск», «название», «автор», «резюме», «ключевые слова», «предметный классификатор», «тип публикации», «место издания», «редактор», «статус публикации» и  «тип публикации». И как в предыдущем случае, вывод результата поиска можно отсортировать по «году издания», «автору» или «названию».

 

EPrints и DSpace являются системами одного и того же класса, предоставляющими полный спектр функциональности для создания электронных репозиториев. Обе системы поддерживают OAI-PMH, но отличаются по структуре модели данных. Идея разделов в DSpace хороша, но и поддержка в EPrints разнообразных классификаций имеет свои преимущества. EPrints поддерживает больше форматов метаданных, но тут недостает поддержки расширенного Дублинского Ядра. EPrints более удобен для локализации, однако обе системы не поддерживают многоязычного представления метаданных.

 

Greenstone

Библиотека, созданная с помощью Greenstone, может содержать множество коллекций. Коллекции - совокупность документов разных форматов, собранных вместе на основе обусловленных пользователем критериев и к которым применяются единые механизмы сохранения, индексации, поиска, просмотра и представления.

Коллекции могут состоять из сотен тысяч и даже миллионов документов. Коллекции могут включать документы разной природы: текстовые документы (статьи, журналы, газеты, отчеты), а также аудио и видео-документы. В коллекции можно создавать подколлекции, и в некоторых случаях, коллекции можно логически объединять.

Каждый текстовый документ может быть иерархически структурирован в виде вложенных разделов (sections) (разделы, подразделы, подподразделы и т.д.). Иерархическая структура разделов отображает содержательную структуру документа. Каждый из разделов, в свою очередь, состоит из одного или нескольких абзацев (paragraphs). Таким образом, структуризация содержания обычных документов на части, главы, разделы и т.д. представляется в документах Greenstone в виде иерархической структуры разделов Greenstone. Структура документа может использоваться при формировании поисковых индексов. Если входные документы не имеют структуры, то в коллекции Greenstone они могут быть представлены в виде последовательности страниц, что позволяет просматривать документы постранично.

Входные информационные ресурсы для построения коллекции могут располагаться: на локальном компьютере, в локальной сети и глобальной сети и доступны с использованием протоколов HTTP и FTP.

Входные документы могут иметь разные форматы, для поддержки импорта которых используются плагины (специальные утилиты импорта документов соответствующих форматов). Все входные документы, внесенные в систему Greenstone, конвертируются в формат архива Greenstone (Greenstone Archive Format). Система Greenstone каждому документу автоматически присваивает уникальный идентификатор OID (Object Identifier).

В Greenstone структура каждой коллекции определяется в процессе ее создания. Она включает определение формата используемых документов, их вывод на экран, источник метаданных, какие предметные показатели должны быть включены, какие следует предоставить полнотекстовые индексы, как должны отображаться результаты поиска. После того, как коллекция создана, в нее легко добавить новые документы при условии, что они того же формата, что и существующие документы, и что они имеют сходные метаданные. Каждая коллекция содержит файл конфигурации, в котором устанавливаются параметры построения и использования коллекции.

При добавлении файла в библиотеку он сначала проходит предварительную подготовку с помощью соответствующего ПО. На этом этапе из документа извлекается различная метаинформация. Например, из документа HTML может быть извлечено название документа, его описание. Эта метаинформация используется для построения дополнительных (за исключением полнотекстового) поисковых индексов.

Если автоматическое извлечение метаинформации невозможно, описание объекта может быть произведено работником библиотеки вручную. Способ хранения метаинформации совместим с распространёнными форматами библиотечных указателей, например Dublin Core.

Пополнение библиотеки возможно не только с локального компьютера: библиотечный интерфейс предоставляет возможность скачивания файлов из сети, а также поддерживает распространённые протоколы обмена данными между библиотеками, например Z 39-50.

Пользователь Greenstone может осуществлять полнотекстовый поиск. Диапазон поиска определяют индексы, которые строятся на разных частях документов. С помощью индексов можно искать по отдельному слову, набору слов или фраз. Коллекции могут иметь индексы полных документов, индексы параграфов, индексы определенных метаданных (например, названий или авторов) по каждому из которых можно осуществлять поиск определенных слов или фраз. Результаты могут быть упорядочены или отсортированы по элементам метаданных. Greenstone предоставляет возможность выполнять поиск по нескольким коллекциям сразу с последующим объединением результатов поиска.

Поисковый язык, помимо булевых операторов НЕ, И и ИЛИ, и операторов группировки (скобки), позволяет искать слова в исходной форме (по крайней мере для английского языка). Возможна регулировка расстояния между искомыми словами; по умолчанию же, пара слов объединённая оператором И ищется на расстоянии не более 20 слов.

В системе используется набор символов UNICODE. В связи с этим и документы, и внешний интерфейс могут представляться на разных языках. В этом смысле система Greenstone является многоязычной. Кроме того, систему легко расширить новым языком

 

http://www.greenstone.org/manuals/gsdl2/

 

Поддержка OAI и плагины переходов. Инициатива «Открытые архивы» (ОАІ, Open Archives Initiative) разработала протокол для сбора метаданных ОАІ-PMH (Open Archives Initiative Protocol for Metadata Harvesting). Это позволило сайтам программно извлекать и собирать метаданные из нескольких источников и предлагать сервисы, используя эти метаданные, например, индексацию или сервисы связи. Такой сервис позволяет пользователям получать доступ к информации от большого числа сайтов, объединенных в центральном каталоге.

 

Научные поисковые машины и системы, совмещенные с протоколом по сбору метаданных инициативы “Открытые архивы” (OAIPMH)

 

 

Название

Объем поиска

Разработчик, владелец

URL-адрес

OAJX

Ajax – powered meta search service

Обеспечивает единый вход во все ОА - репизитарии

University College Dublin, School of Information and Library Studies

http:// ojax.sourceforge.net.

JOAI Overview Java-based OAI Data Provider & Harvester

Обеспечивает доступ к XML метаданным и их сбор, поиск по ОА - репозитариям

University Corporation for Atmospheric Research, Digital Learning Sciences

http:// www.dlese.org

Google Scholar

Наиболее мощная поисковая машина по научной информации, обеспечивающая цитирование документов

Компания

Google

http://scholar.google.com/

 

 

Источники

Шварцман, М. Для более сложных случаев. - http://www.aselibrary.ru/blogs/archives/676/

Федоров, А. Создание электронной библиотеки в Greenstone. - http://ideafor.info/?p=613

Резниченко, В. А. и др. Создание цифровой библиотеки коллекций периодических изданий на основе Greenstone. - http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2005/part6/RPO

Шевнина, Ю. С. и др. Инструментальные средства создания и сопровождения электронных коллекций информационных ресурсов. - http://technomag.edu.ru/doc/125008.html

Кудим, К. А. и др. Сравнение систем электронных библиотек EPrints 3.0 и DSpace 1.4.1