Семантическая мера информации

Рассмотрим два подхода к построению семантической меры информации, определяющей ее количество с точки зрения смысла или содержания.

Один из подходов построения такой меры информации базируется на математической (символической) логике и состоит в использовании простого формализованного языка, включающего конечное число имен единичных предметов (индивидов) и логических сказуемых (предикатов). В этом языке выделяются определенные предложения, которые называются описаниями состояния. Каждому такому описанию состояния сопоставляется некоторое положительное число, которое называется мерой. Мера рассматривается как логическая вероятность m(i), определяющая, в какой степени подтверждается истинность выдвинутой гипотезы i. Для этого устанавливается связь содержания h гипотезы с начальным достоверным знанием е (эмпирическими данными). Значение m(i) максимально и равно единице, если гипотеза полностью вытекает из эмпирических данных, и нулю в противном случае. По логической вероятности, или знаниям h, содержащимся в гипотезе i относительно достоверного знания е, можно судить о величине семантической информации Ic (h/e). В качестве семантической меры принимают количество информации, которое определяется следующим выражением [24]:

(1.7)

Из выражения (1.7) следует, что, количество информации / = 0, если логическая вероятность m(i) = 1; с уменьшением логической вероятности m(i), или степени подтверждения гипотезы, количество семантической информации увеличивается.

Недостаток меры (1.7) состоит в том, что достоверные знания не несут информации.

Рассмотрим поход, лишенный указанного недостатка. Согласно ему информацией обладают любые сообщения, которые изменяют запас знаний, сведений, которыми располагает приемник (пользователь) информации. Этот запас знаний, сведений называется тезаурусом. Его можно представить в виде словаря пользователя, в котором отражены все его знания, а количество семантической информации, содержащееся в сообщении, – степенью пополнения словаря. После приема сообщения возможны два исхода, когда пользователь не включает принятую информацию в свой словарь:

  • • пользователь не понимает и не воспринимает поступающую информацию ();
  • • пользователь все знает ().

В тех случаях, когда поступающая информация понятна пользователю и несет ему ранее неизвестные сведения, он включает ее (полностью или частично) в свой словарь. Максимальное количество семантической информациисоответствуют согласованию ее смыслового содержания S со словарем (тезаурусом)пользователя, т.е. [1].

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для некомпетентного. Таким образом, тезаурусная мера связывает семантические свойства информации с индивидуальными способностями пользователя принимать поступившее сообщение. Смысловое содержание S принятого сообщения может быть понятно одному пользователю и непонятно другому.

Для количественной оценки семантической информации также используют коэффициент содержательности С, представляющий собой отношение количества семантической информации к ее объему

Так, школьник, читая учебник, изменяет (увеличивает) свой запас знаний. Изменение запаса знаний можно определенным способом измерить и определить количество семантической информации. Однако студент, прочитав тот же учебник, не приобретет знаний, так как сведения, содержащиеся в учебнике средней школы, ему известны. В этом случае он не получает семантической информации, так как не изменяет запаса своих знаний.

 
< Пред   СОДЕРЖАНИЕ     След >