Алешин Л.И.

"ЭЛЕКТРОННЫЙ АРХИВ" – СИСТЕМА СОЗДАНИЯ И ХРАНЕНИЯ МАШИНОЧИТАЕМЫХ ДАННЫХ В ЦНСХБ

Потребность хранения и эффективного использования разнородных машиночитаемых данных решается в различных библиотеках и информационных центрах по-разному. Это собственные разработки программного обеспечения, использование фирменных систем с подключением к ним дополнительных модулей и др. На протяжении предыдущего десятилетия в ЦНСХБ Россельхозакадемии сложилась нетиповая ситуация, когда в библиотеке применяется несколько программ, объединенных собственными доработками в единое целое, в виде единого банка данных выставляемого как на ее собственном сайте, так и зеркально на сайте “Интегрум-Техно”. Дальнейшая работа в подобном режиме затруднительна по многим причинам. В связи с этим библиотека предпринимает различные шаги к интеграции как самих информационных ресурсов, так и необходимого для них программного обеспечения (ПО).

Одним из важных шагов в этом направлении является предложение создания единого электронного архива разнородных данных, имеющихся и предполагаемых генерироваться в ЦНСХБ. В нем можно сосредоточить как все сведения об источниках информации в традиционной и электронной форме, так и коллекции имеющихся документов (в том числе книжные памятники) по актуальным проблемам сельского хозяйства, необходимые для различных пользователей.

В связи с этим в рамках проекта АРИС было разработано ТЗ, на основе которого в течение нескольких предыдущих лет библиотека получила специализированное оборудование и ПО для создания собственного электронного архива (АИС ЭА ЦНСХБ). Данный архив ориентирован на формирование образов текстовых первоисточников и/или их частей, а также их распознавание, организацию электронной картотеки, включение аудио-, видеоинформации и др. Он позволяет организовать хранение и сохранение (архивацию) информации, обеспечивая доступ к документам на основе реквизитного и полнотекстового индексирования и поиска, а также экспорт и импорт электронных данных. При этом в качестве технических средств поддержки используются: книжный, планшетный и листовой протяжный сканеры, CD-библиотека и др. устройства.

Одной из первых задач, решаемых с помощью ЭА, является присоединение к библиографическим описаниям (БО) поступающих в библиотеку журналов их оцифрованных и распознанных содержаний. Данное решение обусловлено тем, что журналы становятся весьма важным и оперативным источником информации для различных категорий пользователей: любителей, специалистов, ученых, студентов и аспирантов, издателей и библиотекарей. Использование ЭА дает возможность значительному количеству пользователей одновременно осуществлять различные формы выбора, доступа и навигации, пользоваться одним и тем же материалом, копировать необходимую информацию на свой ПК и др.

В 2001 г. на основе использования ЭА с целью максимальной автоматизации процесса создания машиночитаемых содержаний журналов, поступающих в библиотеку, в ЦНСХБ приступили к их формированию, присоединению к соответствующим номерам в существующем электронном каталоге (ЭК) журналов, выставляемом на сайте библиотеки. В дальнейшем этот массив будет использоваться для реализации ряда задач (сигнальная информация, ЭДД и др.).

Технологически данный процесс заключается в том, что БО журналов из АИБС “ИРБИС” регулярно в пакетном режиме преобразуются для включения в АИС “Электронный архив”. Сотрудник отдела комплектования присоединяет эти описания в ЭА, затем берет обработанные в отделе журналы и с помощью книжного сканера вводит образы их содержаний в ЭА. Последние в формате TIFF автоматически подсоединяются к документам с соответствующими БО. Объединение БО и содержаний осуществляется по штрих-коду журналов. При этом все документы данного вида, хранящиеся в ЭА, имеют имена, соответствующие их штрих-кодам. В дальнейшем, к любому подобному документу, например журналу, можно подключать любое количество отсканированных образов отдельных статей, что является важной составляющей как собственно ЭА, так службы ЭДД.

Из ЭА в любой момент можно экспортировать имеющиеся в нем данные соответствующему пользователю. Таким образом, в ЭА можно не только накапливать наиболее ценные (редкие, уникальные, раритетные) данные, но и готовить материалы для последующей рассылки заказывающим их абонентам и др.

Образы содержаний журналов автоматически распознаются, а затем вручную редактируются. Полученные текстовые файлы сохраняются в форматах RTF и HTML. Первый из них является копией оригинала и может длительно храниться в архиве, а также, при необходимости, редактироваться. Второй используется для автоматической обработки с целью организации автоматизированного заказа соответствующих статей и гиперссылки на него из номера соответствующего журнала, выставляемого на сайте библиотеки в Интернет. Таким образом достигается не только оперативное оповещение пользователей (задача “Сигнальная информация”) о содержаниях поступающих в ЦНСХБ журналов, но и предоставление им возможности тут же осуществить заказ заинтересовавших их статей.

В результате выполнения подобного заказа, а также ввода отсканированных образов редких и наиболее спрашиваемых документов в ЭА накапливаются коллекция полнотекстовых материалов, которые, при повторной попытке их заказать, могут быть доставлены пользователю моментально. Это возможно при условии, что пользователь предварительно оплатил услуги ЭДД. В данном случае практически весь процесс (поиск, заказ и доставка пользователю заказанной информации) можно полностью автоматизировать. Такая технология разрабатывается и предполагается, что в 2001 году она будет реализована в ЦНСХБ.

Ряд специалистов высказывают мнение, что нецелесообразно сохранять в электронной форме результаты заказов на отдельные журнальные статьи, так как вероятность повторного их заказа весьма мала. Мы исходим из соображений, во-первых, что можем обеспечить достаточные емкости для хранения подобной информации, в том числе на CD и DVD. Во-вторых, данная технология позволяет формировать ресурсы электронной библиотеки (ЭБ), которая также создается в ЦНСХБ. Более того, даже единожды спрашиваемая информация свидетельствует о ее востребованности. Это позволяет считать, что формируемая таким образом ЭБ будет содержать актуальные данные.

Собственно содержания статей и другие полнотекстовые данные первоначально предполагается хранить в графическом формате, что в частности уменьшает время и стоимость их создания, а также обеспечивает права авторов. Те же документы, которые представляют значительную ценность, редко выдаются отдельным пользователям и на них не распространяются права авторов будут постепенно не только оцифровываться, но и переводиться в форму полнотекстовых документов, содержащих, в том числе, и графические объекты, для включения их в ЭБ.

При этом широкий круг пользователей информационных ресурсов библиотеки в интерактивном режиме сможет свободно не только находить в электронном архиве ЦНСХБ необходимые им данные (библиографические, полнотекстовые и иные), но и осуществлять заказ выбранных документов.

Hosted by uCoz