Подпишитесь на нашу ежедневную рассылку с новыми материалами

Наука


Александр Березин,

После того как муж автора "Овода" в 1912 году случайно нашёл рукопись с непонятными символами, прошли десятилетия, но попытки её дешифровки не дали никаких результатов. В связи с этим многие учёные предполагали, что никакого смысла в тексте нет, что это классическая абракадабра, однако анализ энтропии слов в тексте показал, что текст написан на осмысленном языке, сообщает NewScientist.

Фрагмент рукописи

Более того, несколько лет назад одно исследование постулировало, что европейские криптографические техники XVI века теоретически позволяли создать такой текст из набора бессмысленных символов. Тогда многие посчитали, что проблема снята, ибо именно тем столетием и датировался манускрипт.

Однако радиоуглеродный анализ 2011 года поубавил ясности, ибо оказалось, что пергамент создан в начале XV века, между 1404 и 1438 гг., что на сто лет раньше появления таких методик. Наконец, приписывание текста Джону Ди или его подручным, долгое время бывшее весьма популярным, тоже не оправдало себя. И уж тем более провалилась попытка рассмотрения его как аналога аналитического языка Джона Уилкинса.

Вы когда-нибудь видели такое растение? Вот и учёные затрудняются его идентифицировать. Изображения ниже интерпретируются то как Млечный Путь (правда, в XV веке не было телескопов, без которых спиральную галактику не увидеть), то как рисунок бассейна. Без расшифровки вопрос не прояснить

Чтобы разобраться со всем этим, Марсело Монтемурро (Marcelo Montemurro) из Манчестерского университета (Великобритания) использовал для анализа 240-страничного текста (судя по нумерации, исходно 272-страничного) энтропию распределения "слов" (групп знаков, похожих на слова).

Отчёт об исследовании опубликован в общедоступном интернет-журнале PLoS ONE

Энтропия распределения слов в тексте понималась как равномерность их использования, которую сравнили с равномерностью их распределения в искусственно перемешанном массиве того же текста. Разница между этими двумя энтропиями (естественной и нормализованной) с учётом частоты употребления каждого слова позволяет отследить важность слова для того или иного письменного источника.

Например, в 2009 году, когда этот подход в модельных целях был применён на дарвиновском "Происхождении видов", самыми неравномерными по распределению словами высокой встречаемости были "виды", "разнообразие", "гибриды", "формы" и "роды", а в "Моби Дике" максимальная энтропия была у слова "кит". Как вы догадываетесь, это наиболее нагруженные в смысловом отношении слова названных произведений. Напротив, союзы "и", "а" и сходные с ними лексемы были равномерно "размазаны" по тексту.

Предполагаемая тематика разделов рукописи

Что это дало в случае сверхстранной рукописи в более чем 170 тыс. знаков? Оказалось, что наиболее нагруженные смыслом слова образовывают кластеры. В фармацевтической (предположительно) секции манускрипта доминировал один набор этих значащих слов, а в, возможно, астрологический — другой, и так далее.

Именно такая структура свойственна настоящим книгам на известных языках, и подделать её в начале XV века можно было примерно с той же эффективностью, как фотографии лунной поверхности, ибо техника анализа по энтропии появилась лишь через несколько столетий.

Кроме того, книга представляет собой не разрозненный сборник, а единый текст, так как кластеры, где встречаются связанные слова, в отдельных главах довольно велики, в то время как в "понадёрганных" трудах вроде сборников цитат (или диссертациях плагиаторов) так просто не бывает.

Более того, длина таких кластеров в человеческих языках, на которые переведено то же "Происхождение видов", колеблется в районе 500–700 слов. Для сравнения: код на Фортране имел кластеры в 300 слов, а ДНК-код дрожжей — всего в десять генов.

"Мы хотели понять, совместима ли определяемая нашим анализом структура с реальным языком, — поясняет г-н Монтемурро. — Если бы итог был как у ДНК-кода дрожжей, это определённо заставило бы сомневаться в природе "рукописи Войнича". Но, учитывая полученные результаты, невозможно отрицать — это язык".

Тут, конечно, нельзя не заметить, что оппоненты уверены, что это ещё не доказательство. К примеру, аргументируют они, получить такой же итог можно, взяв набор корней, приставок и суффиксов, записанных другим алфавитом, и пропустив их через решётку Кардано. Само собой, доказать или опровергнуть что-то тут очень сложно, особенно учитывая непонятность алфавита и то, что решётку Кардано изобрели примерно на два века позже времени, которым датируется рукопись.

Кроме того, не очень понятно, как пару сотен страниц удалось написать без единой помарки: писцу надо было иметь экстраординарные качества, чтобы ни разу не ошибиться. Может быть, ему было всё равно, есть ли ошибки, задаются вопросом исследователи, которым не по душе выводы г-на Монтемурро. Другое дело, как знает любой, кто читал рукописные тесты прошлого, можно найти и образцы, превышающие 200 страниц, написанные без единой ошибки...

F — Фортран; C — китайский; V — язык "рукописи Войнича"; E — английский; L — латинский; Y — ДНК дрожжей
 
Так что же в сухом осадке? — Текст, похоже, всё-таки осмыслен и написан на естественном человеческом языке, ибо с помощью решётки Кардано, имея под рукой набор частей слова, кластеры, типичные для реальных книг сложного содержания, всё же не создать.

Но есть нюанс: что именно там написано? Предполагаемые ритуалы катаров? Что-то другое? Видимо, в манускрипте нет артиклей и глаголов-связок, так как статистических аналогов им найти не удалось, и это серьёзно дистанцирует текст от западноевропейских языков.

Растения, изображённые на иллюстрациях, по-прежнему неизвестны, а единственное знакомое пятно — зубец замка типа "ласточкин хвост" (всмотритесь, например, в башни Кремля). Сей элемент итальянской архитектуры в начале XV века существовал только на своей родине, в Северной Италии, и это всё, что мы достоверно можем отождествить с реальным миром в "рукописи Войнича".
Нужные услуги в нужный момент
{banner_819}{banner_825}
-10%
-10%
-15%
-20%
-20%
-20%
-25%
-14%
-50%