Использование методов исторической информатики в источниковедении

Еще в эпоху больших ЭВМ в квантитативной истории началось создание и использование машиночитаемых данных, что получило новый импульс в процессе микрокомпьютерной революции 1980-х гг. Коллекции машиночитаемых (переведенных в электронную форму) данных получили название баз данных, которые в широком смысле представляют собой информационный массив, хранящийся в вычислительной системе. Сегодня существует множество различных определений термина "база данных", опирающихся обычно на две характеристики: цель (информационное обеспечение интересов пользователей) и способ хранения (машиночитаемые данные в памяти компьютера). У

У каждого исследователя имеется персональный "архив" информации, которая хранится в виде вырезок, выписок, публикаций. Компьютер предоставляет возможность систематизации этих материалов в базе данных, электронный вариант которой более удобен для хранения и обработки и создает возможности использования другим исследователем, позволяя избежать дублирования части операций. Практически любую коллекцию машиночитаемой информации можно перевести в базу данных, что позволяет эффективно проводить поиск с помощью соответствующей системы управления базами данных (далее – СУБД).

В ходе микрокомпьютерной революции 1980-х гг., когда появились микропроцессоры, а персональные компьютеры стали доступны массовому пользователю, началось формирование нового направления в исторической науке – исторической информатики.

Историческая информатика – научная дисциплина, изучающая закономерности процесса информатизации исторической науки, связанная с источниковедческой оценкой электронных ресурсов, использующая аналитические компьютеризированные средства и проводящая апробацию компьютерных технологий в исторических исследованиях. Ее теоретической основой является теоретическое источниковедение, а прикладной – информационные (компьютерные) технологии.

Историческая информатика изначально развивалась в рамках квантитативной истории. Когда исследователи стали применять компьютерные методы и информационные технологии к текстовым источникам, возникла необходимость в разработке источнико-ориентированного подхода, учитывающего специфику источников с их размытостью данных.

Немецкий ученый Манфред Таллер разработал концепцию о фундаментальном различии между "обычной" обработкой данных и обработкой собственно исторических, порой слабо структурированных, данных. Источнико-ориентированная обработка данных, в его концепции, представляет собой попытку смоделировать на компьютере все многообразие информации источника. Конкретной реализацией этой идеи в 1980-х гг. стала источнико-ориентированная СУБД "Κλεώ" (Kleio, Клио). В системе "Κλεώ" работа с источником осуществлялась путем сопоставления фрагментов его текста с отдельными элементами базы данных. Любой запрос исследователя интерпретировался в соответствии со знаниями об источнике в памяти компьютера.

В середине 1990-х гг. возник термин "компьютерное источниковедение", подразумевающий создание и обработку машиночитаемых источников с помощью компьютерных технологий. Компьютерное источниковедение можно считать составной частью исторической информатики. В рамках источниковедческой эвристики оно ориентировано на технологии создания баз данных, репрезентацию исторических источников, подготовку электронных публикаций, а также на аналитическое источниковедение, в центре внимания которого находится методика изучения и критики исторических источников, направленная на раскрытие их информационного потенциала.

С наступлением эпохи микрокомпьютеров, в 1990-е гг., происходит перенос акцентов с архивов машиночитаемых данных на базы и банки данных, а затем появляется понятие "electronic information resources" (информационные ресурсы). Таким образом, основными предпосылками формирования исторической информатики как нового научного направления явились использование сложных методов анализа числовой и текстовой информации, применение которых невозможно без использования компьютеров, и тенденция к созданию в процессе исследования информационных ресурсов с возможностью их вторичного многоаспектного использования. В конце 1980-х – первой половине 1990-х гг. историческая информатика оформилась как самостоятельное направление в исторических исследованиях.

С самого начала становления исторической информатики в центре ее внимания были технологии, связанные с созданием и анализом баз данных, затем начинается освоение мультимедийных подходов к работе с электронными ресурсами, куда включаются базы данных, тексты, компьютерные карты и другая аудиовизуальная информация. С развитием сетевых технологий происходит определенное сближение подходов в работе с табличными и полнотекстовыми базами данных. В исторической информатике этот подход открывает новые перспективы при создании тематических электронных ресурсов, представляющих собой обширные коллекции данных различных видов. Интересной перспективой развития исторической информатики является расширение и углубление контактов между исторической наукой и наукой информационной в русле концепции e-Humanities (где е означает electronic), в которой ведущую роль играют информационные и вычислительные ресурсы, доступные пользователям через глобальные компьютерные сети.

Первая половина 1990-х гг. связана со становлением исторической информатики в России, освоением базовых информационных технологий, вторая половина – этап заметного расширения методического и технологического инструментария исследований. Первая половина 2000-х гг. прошла под знаком сетевых технологий, с середины первого десятилетия XXI в. происходит поворот к источнико-ориентированным подходам, методам и технологиям.

В 1986 г. была образована международная ассоциация "History and Computing", а затем ее национальные ветви, в том числе в 1992 г. ассоциация "История и компьютер", объединяющая специалистов из России и стран Содружества Независимых Государств. Под эгидой Ассоциации "История и компьютер" издается серия материалов ежегодных конференций ассоциации "Круг идей", а также информационный бюллетень. В настоящее время на постсоветском пространстве существуют более 20 центров исторической информатики.

Справка

Англоязычные варианты названия "историческая информатика", используемые с 1980-х гг. – History and Computing или Historical Computing – в начале 2000-х гг. было предложено заменить на Historical Information Science – наука о процессах сбора, хранения, поиска, обработки и передачи информации с помощью компьютерных технологий. Сегодня наряду с этими привычными терминами (историческая информатика, Historical Information Science) все чаще используется термин "Digital History" (буквально – цифровая история). Обычно он связан с применением цифровых медиа и инструментов в практике исторических исследований и ориентирован на разработку электронных текстов, интерактивных карт, виртуальных реконструкций, оцифровку архивных, музейных и библиотечных фондов и т.п. Таким образом, понятие "Digital History" является более узким, чем Historical Information Science или историческая информатика.

При создании массива машиночитаемых данных необходимо не только адекватно перенести информацию с бумажного носителя, но и сохранить возможность оперирования этой информацией. Фактически база данных должна представлять собой информационную модель либо исторического источника, либо исследовательской проблемы. Большинство исторических баз данных на первом этапе развития исторической информатики создавались в ходе решения конкретных исторических задач и представляли собой проблемно-ориентированные базы данных.

Термин "проблемно-ориентированный" означает, что в соответствии с задачами исследования данные из источников отбираются направленно, для решения конкретной научной проблемы с помощью определенного метода. Этот термин противостоит понятию "источнико-ориентированный", под которым подразумевается сохранение информации источника во всей полноте в его компьютерной модели.

В рамках проблемно-ориентированного подхода исследователь отбирает необходимую информацию из целого комплекса источников, частично или фрагментарно содержащих нужные сведения. В результате создаваемые электронные источники приобретают комплексный характер. Кроме того, исходные данные при переводе источников в электронный вид обычно подвергаются трансформации: кодирование текстовой информации, реструктуризация исходных групп объектов и пр. В итоге проблемно-ориентированный источник нс представляет собой электронной копии традиционного бумажного аналога, являясь лишь авторской электронной версией или новым источником, созданным в процессе исторического исследования. Такой источник можно дополнить, изменить, объединить с другими. Это позволяет историкам выступать в роли не только потребителей, но и создателей информации.

На рубеже XX–XXI вв. обозначился синтез проблемно- и источнико- ориентированого подходов.

Мнение

И. М. Гарскова считает, что правильнее говорить об источнико-ориентированной обработке данных и проблемно-ориентированном подходе к анализу. При подобном подходе эти термины относятся к разным этапам работы историка и друг другу не противоречат.

В 2000-е гг. в Интернете активно используется новый язык гипертекстовой разметки XML (extensible Markup Language), описывающий целый класс данных, называемых XML-документами. XML позволяет осуществлять контроль за корректностью документальных данных и устанавливать единый стандарт на структуру документов, содержимым которых могут быть самые различные данные. В связи с этим его очевидное достоинство – использование в качестве универсального языка запросов к хранилищам информации.

Один из крупнейших представителей исторической информатики в России Леонид Иосифович Бородкин выделяет следующие основные направления применения технологий исторической информатики:

  • – моделирование данных;
  • – электронная публикация источников (с использованием XML- технологий);
  • – компьютеризированный анализ нарративных источников, выявление структур текста;
  • – апробация новых методов статистического анализа;
  • – адаптация информационно-поисковых систем для работы с историческими ресурсами;
  • – мультимедиа, визуальные реконструкции, моделирование (включая Географическую информационную систему, графику, 3D-реконструкции и пр.);
  • – электронные публикации (онлайновые журналы исторического профиля, выставки документов, книг, музейных экспонатов).

Так, одно из крупнейших собраний материалов по Отечественной войне 1812 г. размещено на интернет-портале "1812 год"[1]. В качестве примеров электронных ресурсов можно привести также интегральную базу данных "Жертвы политического террора", расположенную на сайте общества "Мемориал"[2]. На этом же сайте размещены материалы по истории большого террора, истории тюрем и лагерей, депортаций, деятельности органов государственной безопасности, движения инакомыслия[3]. На базе исторического факультета МГУ разработан тематический электронный ресурс "Эволюция трудовых отношений в российской промышленности: от дореволюционной индустриализации к советской"[4]. В рамках проекта "Победители: солдаты Великой войны" создана мультимедийная карта войны[5].

  • [1] См.: URL: museum.ru/1812/index.html
  • [2] См.: URL: lists.memo.ru
  • [3] См.: URL: memo.ru/os/319.html
  • [4] См.: URL: hist.msu.ru/Labour/index.html
  • [5] См.: URL: pobediteli.ru
 
< Пред   СОДЕРЖАНИЕ     След >