Технология создания электронных коллекций документов

Независимо от вида создаваемых электронных коллекций документов (ЭКД) их разработка предполагает выполнение всех стадий, этапов и видов работ, рассмотренных в параграфе 4.2 данного учебника, которые являются общими при создании электронных информационных ресурсов любого вида. Тем не менее создание электронных коллекций документов различных видов требует учета их специфики, которая и рассмотрена в данном параграфе.

Разработка электронной коллекции документов, как и любого ЭИР, начинается с определения потребности в ее создании. Это может быть необходимость объединения разрозненных по различным архивным фондам документов по какой-либо теме, проблеме и обеспечения к ним удалённого доступа; желание подготовить ЭИР к юбилейной дате персоны либо учреждения/организации; потребность в обеспечении сохранности особо ценных, редких документов и предоставлении доступа к ним широких кругов пользователей (в том числе в режиме удаленного доступа) и т. п. Чёткое представление о целях создания ЭКД позволяет в дальнейшем определить семантические и формальные границы предметной области, что даст возможность сформулировать критерии отбора документов, обосновать принципы структурирования информации, определить состав справочно-поискового аппарата.

Результаты анализа состава категорий потенциальных пользователей электронной коллекции, их образовательного уровня, возможных запросов позволят выбрать источники отбора информации, адекватные формы представления материала в создаваемой ЭКД, определить оптимальный состав атрибутов поиска, принять решение об организации системы навигации по ЭКД. Так, создание электронной коллекции, ориентированной на научных работников, предъявляет требования максимальной полноты отражения документов по рассматриваемой теме или проблеме. Также для данной категории пользователей должен быть определен расширенный состав атрибутов, позволяющих обеспечивать многоаспектный поиск необходимых при проведении ими научного исследования данных.

Далее необходимо установить ее семантические и формальные границы. Специфика, определяемая видом создаваемой коллекции, влияет на выбор источников получения сведений о предметной области. Так, при создании электронных коллекций архивных документов важнейшим средством, дающим обобщенное представление о структуре предметной области, подходах к структурированию архивных документов, является архивная классификация. При создании электронных коллекций краеведческих документов в качестве такого средства может выступать Библиотечно-библиографическая классификация (таблицы для краеведческих каталогов и картотек). Семантические границы предметной области задаются путем перечисления классификационных индексов, предметных рубрик, ключевых слов или дескрипторов, отражающих ее содержание. При установлении формальных границ необходимо определить хронологические, географические, языковые признаки отбора исходных документов, их видовой состав. Выбор источников отбора документов и данных при создании ЭКД определяется ее целевым и пользовательским назначением.

Завершающим видом работ на предпроектной стадии создания ЭКД является разработка ER-моделей предметной области. Требования к построению ER-модели рассмотрены в параграфе 4.3 данного учебника. Поскольку основными компонентами электронной коллекции являются документы, ER-модели должны быть, прежде всего, разработаны для тех видов документов, которые подлежат размещению в коллекции. При этом для описания документов могут быть выделены две группы атрибутов: атрибуты, присущие любому виду документов; атрибуты, характерные для отдельных видов документов (специфические атрибуты). Так, к первой группе относятся атрибуты: Ф. И. О. автора, название, дата создания, объем. Ко второй группе при разработке ER-модели, например, сущности «рукопись» могут быть отнесены атрибуты: жанр, наличие правок, место хранения. При построении ER-модели сущности «учебное пособие» в составе специфических атрибутов должны быть представлены: наименование специальности/ направления подготовки, наименование органа, выдавшего гриф и др.

Разработка концепции электронной коллекции документов и технического задания на создание ЭКД осуществляется в соответствии с требованиями, изложенными в параграфе 4.2 учебника. Вместе с тем при составлении данных документов следует учитывать специфику ЭКД как объекта проектирования.

Формулирование требований к структуре электронной коллекции документов предполагает, прежде всего, определение состава ее модулей. Далее должны быть сформулированы требования к составу материалов и форм их представления в разрезе каждого модуля с учетом его назначения. Выбор форм представления материала зависит, с одной стороны, от вида создаваемой ЭКД, а с другой стороны - от специфики конкретной предметной области. В составе общесистемных требований к электронной коллекции следует также выделить требования к пользовательскому интерфейсу, который должен быть интуитивно понятным пользователю и обеспечивать поддержку пользователя, то есть выполнять функцию справки.

Требования к обеспечивающим подсистемам электронной коллекции документов должны быть рассмотрены в разрезе информационного, лингвистического, программного и технического обеспечения. Формулирование требований к информационному обеспечению должно быть направлено, прежде всего, на создание контента электронной коллекции документов. Они могут распространяться на оценку объема, видового состава и содержания материала с позиций назначения конкретного вида электронной коллекции документов. Для ЭКД в качестве важнейших требований к контенту выступают: полнота и надежность источниковедческой базы, достоверность информации, возможность расширения информационных массивов с учетом развития коллекции, соответствие уровню подготовленности пользователей. Также должны быть сформулированы требования к уровню унификации материала, представленного в составе электронной коллекции документов.

В соответствии с составом видов работ, выполняемых на этапах логического и физического проектирования ЭКД, разработчиком должны быть приняты общесистемные и локальные проектные решения в разрезе обеспечивающих подсистем. Их состав применительно к любому виду ЭИР охарактеризован в параграфе 4.2 учебника. Специфика разработки проектных решений применительно к ЭКД рассмотрена ниже.

В составе общесистемных решений важное значение имеют вопросы организации контента. Одним из важнейших видов работ по проектированию контента электронной коллекции документов является разработка ее структуры. Структура электронной коллекции, принципы отбора и компоновки материалов, способы доступа к ним отражают специфику, обусловленную видом создаваемой коллекции. При структурировании отобранных документов, с одной стороны, следует ориентироваться на подходы к систематизации информации, используемые в заданной предметной области (например, при создании электронных коллекций архивных документов - схемы классификации дел фондов, при создании электронных коллекций краеведческих документов - схемы классификации для краеведческих каталогов и картотек и т. п.). С другой стороны, необходимо учитывать особенности представления документов в составе данного ЭИР, организации их поиска.

Характеристики модулей и входящих в них компонентов, которые являются типичными при разработке любых видов электронных коллекций документов, представлены в таблице 26.

Компоненты структуры электронных коллекций документов

Наименование компонента структуры

Назначение

  • 1. Вводный модуль:
    • • введение;
    • руководство пользователя;
    • сведения о разработчиках
  • Предоставление информации о целях, особенностях ЭКД, разработчиках ЭКД, целевом и пользовательском назначении и др. аспектах;
  • характеристика состава источниковедческой базы, принципов отбора документов при формировании электронной коллекции, объема ЭКД;
  • обеспечение информацией инструктивного характера о правилах работы с данной ЭКД, ее функциональных возможностях
  • 2. Модуль фактографической и/или биографической информации:
    • • исторические справки;
    • • характеристика направлений деятельности;
    • • справки о жизни и деятельности;
    • • персональные документы

• Предоставление сведений, позволяющих получить представление об отражаемой в ЭКД предметной области

  • 3. Модуль библиографической информации:
    • • списки публикаций (персоны, коллектива, по теме, проблеме и т. п.);
    • списки тем докладов на конференциях, семинарах и т. и.;
    • списки выполненных НИР и разработок;
    • списки публикаций о персоне (коллективе)

Предоставление библиографических сведений о документах, размещенных в ЭКД

  • 4. Модуль полнотекстовых документов:
    • тексты опубликованных работ;
    • тексты неопубликованных работ;
    • тексты публикаций о персоне (коллективе)

Обеспечение возможности просмотра текстов опубликованных и неопубликованных работ

  • 5. Справочный модуль:
    • список использованной литературы;
    • полезные ссылки;
    • список сокращений и условных обозначений;
    • вспомогательные указатели (систематический, географический, авторский, хронологический и др.)
  • Расширение поисковых возможностей ЭКД;
  • создание комфортной среды для работы пользователя с ЭКД

Наименование компонента структуры

Назначение

  • 6. Модуль сопроводительного материала:
    • • фотоматериалы;
    • • видеоматериалы;
    • • электронные презентации
  • • Расширение состава размещаемых в электронной коллекции документов;
  • • обеспечение наглядности представления информации
  • 7. Сервисный модуль:
    • • поиск по текущей странице;
    • • полнотекстовый поиск;
    • • контекстные подсказки;
    • • контекстная помощь
  • • Реализация поисковых возможностей ЭКД;
  • • обеспечение комфортной работы с ЭКД

Наполнение данных модулей может быть уточнено в зависимости от вида ЭКД, ее целевого назначения, состава отобранных документов, имеющихся ограничений на виды и объемы размещаемой информации и других факторов. Так, состав модуля фактографической и/или биографической информации определяется видом создаваемой электронной коллекции. В частности, электронная коллекция документов, посвященная персоне, может включать автобиографию, справку о жизни и деятельности персоны (и/или хронику жизни), направлениях ее деятельности, изображения персональных документов. При создании электронной коллекции документов об учреждении, организации (или их структурных подразделений) приводятся исторические справки, характеристика направлений деятельности, справки о жизни и деятельности работавших в них персон и др. В электронной коллекции краеведческих документов данный модуль может быть представлен такими компонентами, как историческая справка (история края, области, города), хроника событий, знаменательные и памятные даты, справки о жизни и деятельности известных в крае персон и др.

Следует отметить, что модули фактографической и/или биографической информации, библиографической информации и полнотекстовых документов взаимосвязаны друг с другом. При их разработке необходимо решить вопросы структурирования отобранных для размещения в коллекции документов. При решении таких вопросов, прежде всего, следует выявить подходы к структурированию информации в заданной предметной области (архивному делу, краеведению и др.). Так, в архивном деле работа по созданию схемы классификации производится с учетом основных и дополнительных классификационных признаков. К числу основных классификационных признаков принято относить: структурный, функциональный, отраслевой, тематический, хронологический. В качестве дополнительных рекомендуется использовать номинальный, корреспондентский, авторский, предметно-вопросный, географический признаки. Выбор и сочетание тех или иных признаков зависят от вида формируемой архивной коллекции. В принципе при создании электронной коллекции данные классификационные признаки могут быть учтены при определении состава поисковых атрибутов и разработке справочного модуля (в частности, определения состава вспомогательных указателей).

Также при разработке структуры электронной коллекции архивных документов можно заимствовать разработанные типовые схемы классификации документов. Так, типовая схема классификации документов для фондов деятелей культуры включает следующие группы: рукописи; записные книжки; письма фондообразователя; дарственные надписи разным лицам; письма фондообразователю; дарственные надписи разных лиц фондообразователю; материалы к биографии; материалы имущественнохозяйственного и бытового характера; материалы, собранные фондообра- зователем для своих работ и по интересующим его темам; материалы о фондообразователе; изобразительные материалы; материалы членов семьи; материалы разных лиц, отложившихся в фонде; коллекции.

При определении состава справочного модуля особое внимание следует обратить на требования к справочному аппарату, обусловленные видом создаваемой коллекции. Так, например, неотъемлемым компонентом любой архивной коллекции является система научно-справочного аппарата к документам архива (подробнее см. параграф 5.4 учебника). Состав сервисного модуля может быть расширен в зависимости от особенностей формируемой коллекции и возможностей используемых при ее реализации программных средств.

Выделение перечисленных выше модулей информации в структуре электронной коллекции позволяет максимально полно отразить различные виды документов в соответствии со спецификой создаваемой ЭКД, а также создать комфортную среду для работы пользователя с данным видом ЭИР. Также использование модульного подхода к проектированию структуры электронной коллекции позволит разработчикам обеспечить условия для повышения технологичности создания электронных коллекций, реализовать предъявляемые к контенту ЭКД требования (целостность, чёткость и логичность представления информации), учесть особенности представления различных видов документов, обеспечить реализацию поисковых функций, а также разработать разветвлённую систему навигации.

Разработка системы гиперссылок между модулями и документами, представленными в составе ЭКД, предполагает установление типов логических связей между аспектами рассмотрения. Поскольку размещенные в электронной коллекции документы могут характеризоваться с использованием различных видов информации (библиографической, фактографической), необходимо разработать логические цепочки, позволяющие установить смысловые связи между компонентами модулей фактографической и/или биографической, библиографической и полнотекстовой информации, а также справочным модулем. Так, например, при характеристике деятельности персоны в модуле биографической информации могут быть названы ее важнейшие научные публикации. От их наименований должны быть сделаны гиперссылки к списку публикаций персоны, который размещен в модуле библиографической информации, а от библиографического описания публикации необходимо обеспечить переход к ее полному тексту в модуле полнотекстовой информации. В целом установление таких логических связей обеспечит создание разветвленной системы навигации по ЭКД и разработку оптимальных стратегий поиска информации в ЭКД.

С учетом разработанной структуры должны быть приняты проектные решения по функционированию и эксплуатации ЭКД, защите прав владельцев информации, размещенной в ЭКД и т. д. При разработке электронной коллекции следует особое внимание уделить вопросам соблюдения законодательства в области авторского права (в частности, 4 части Гражданского кодекса). Эти решения в дальнейшем влияют на отбор документов, размещаемых в электронной коллекции, а также требуют разработки и заключения с правообладателями соответствующих договоров.

Локальные проектные решения должны быть рассмотрены в разрезе информационного, лингвистического, программного и технического обеспечения. Проектные решения в разрезе информационного обеспечения направлены на создание контента ЭКД, в том числе разработку структуры контента в целом, наполнение модулей и установление взаимосвязей между ними. При разработке контента электронных коллекций документов необходимо ориентироваться на национальные и международные стандарты, устанавливающие требования к описанию различных видов документов; учитывать требования, отраженные в отраслевых инструктивно-методических документах (например, в «Правилах организации хранения, комплектования, учета и использования документов Архивного фонда РФ и др. архивных документов в государственных и муниципальных архивах, музеях и библиотеках, организациях РАН», «Инструкции по заполнению паспорта государственного музея, библиотеки», «Методических рекомендациях по подготовке путеводителей по фондам...», «Рекомендациях по созданию архивного сайта в Интернете» и др.).

В ходе логического проектирования для каждого модуля должны быть разработаны аспектные структуры. Основой для создания логической модели электронной коллекции документа являются разработанные на предпроектной стадии ER-модели. Состав аспектов определяется спецификой материалов, представленных в каждом конкретном модуле. Поскольку важнейшим элементом электронной коллекции являются документы, то в ходе логического проектирования необходимо, прежде всего, определить состав поискового образа документа и структуру библиографической записи. Их разработка при создании электронной коллекции осуществляется аналогично видам работ, выполняемым при проектировании документальной базы данных (см. параграф 4.3 учебника). Однако состав полей, описывающих отдельные виды документов, может быть дополнен за счет включения специальных полей, примечаний, комментариев.

Архивные коллекции каталогизируются отдельно. Подробность архивной записи зависит от объема, уникальности коллекции, принятых форматов и правил хранения. На международном уровне вопросы унификации архивного описания решаются путем использования «Основного международного стандарта архивного описания ISAD(G)» (принятого Международным советом архивов в 1999 году). Данным стандартом установлены 26 элементов описания, которые распределены по семи областям: область идентификации, область контекста, область содержания и структуры, область доступа и использования, область взаимосвязанных материалов, область примечаний, область контроля описания.

В составе конкретного модуля электронной коллекции документов для каждого аспекта рассмотрения должен быть определен перечень адекватных форм представления материала с учетом его специфики. Использование того или иного стиля изложения обусловлено видом создаваемой электронной коллекции документов, ее целевым и читательским назначением. Так, для электронной коллекции архивных документов наиболее характерным является использование научного стиля изложения. При разработке ЭКД, направленных на популяризацию знаний в определенной предметной области (например, о городе, крае, известных людях), может применяться публицистический стиль изложения.

Принятые общесистемные и локальные проектные решения по обеспечивающим подсистемам ЭКД фиксируются в комплекте проектной и эксплуатационной документации, необходимой для изготовления опытного образца, последующего его испытания и использования (подробнее см. параграф 5.5 учебника). Изготовление опытного образца электронной коллекции документов в ходе выполнения послепроектной стадии требует, прежде всего, осуществить отбор и подготовку исходных материалов.

Требования к отбору и подготовке материалов определяются видом формируемой коллекции и составом размещаемых в ней документов. Так, например, если формируется электронная коллекция архивных документов, то следует учитывать принятые в теории архивного дела группы критериев экспертизы ценности документов, к числу которых относятся: критерии происхождения документов; критерии содержания документов; критерии внешних особенностей документов. Состав каждой из перечисленных групп критериев имеет специфику в зависимости от вида создаваемой архивной коллекции (персональная, тематическая и т. п.). Так, для определения ценности фондов личного происхождения и входящих в его состав документов рекомендуется учитывать значение творческой и общественной деятельности фондообразователя; историю фонда и его состав; время и место создания документа; значимость содержания документа, его информационную, художественную и научную ценность; внешние признаки документа (сохранность, степень автографичности, наличие помет и т. п.); взаимосвязь фонда с другими комплексами документов.

При создании электронной коллекции учебно-методических документов в качестве критериев отбора могут выступать: новизна, предназначенность для обучающихся по реализуемым в учебном заведении направлениям подготовки и специальностям, наличие грифов учебнометодических объединений, Министерства образования РФ и др.

Источниками отбора материалов для ЭКД могут быть специализированные фонды библиотеки (например, фонд редких книг, рукописей, исторических и современных карт региона, региональных периодических изданий и т. п.), архивы учреждения, организации или их структурных подразделений, личные архивы деятелей науки, культуры и др.

Далее должен быть осуществлен анализ отобранного исходного материала, который предполагает его оценку по содержательным и формальным критериям. Основой содержательного анализа служит состав аспектов рассмотрения в пределах каждого модуля, установленный в техническом задании на создание ЭКД. Также необходимо оценить отобранные исходные документы с точки зрения их физического состояния (которое влияет на выбор способов их оцифровки), легитимности и др. аспектов. Отобранные исходные материалы в дальнейшем подлежат структурированию. Структурирование материала предполагает распределение отобранного исходного материала на модули, а внутри модуля - на отдельные компоненты в соответствии с установленными для каждого конкретного модуля аспектными структурами. Также необходимо установить логические связи как в пределах конкретного модуля, так и между модулями.

Проведение тестирования созданного опытного образца ЭКД предусматривает проверку работы всех модулей электронной коллекции документов в реальном режиме согласно требованиям, рассмотренным в параграфе 4.2 данного учебника.

Осуществляемые в дальнейшем передача в эксплуатацию, эксплуатация, последующие актуализация и модернизация электронных коллекций документов реализуются по единой схеме, характерной для различных видов ЭИР. Периодичность актуализации электронной коллекции документов определяется ее видом и зависит от особенностей предметной области. Для уникальных и длительно формируемых электронных коллекций целесообразно составление планов развития коллекции, которые отражают правила и источники пополнения коллекции, обработки материалов и их использования; предполагаемые закупки родственных материалов для дополнения коллекции и др. аспекты.

Важнейшим видом работ, выполняемым на послепроектной стадии, является оценка качества электронной коллекции документов, которая осуществляется в соответствии с подходами к проведению оценки качества ЭИР, изложенными в параграфе 4.1 данного учебника.

В ходе эксплуатации электронной коллекции документов необходимо осуществлять анализ ее востребованности различными категориями пользователей и оценку эффективности ее использования при их обслуживании. Это позволит в дальнейшем определить направления модернизации электронной коллекции.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >