egovoru (egovoru) wrote,
egovoru
egovoru

Categories:

Музыку я разъял, как труп

Применение количественных методов к анализу литературных текстов – уже далеко не новость. Но развитие интернета позволило подступиться «с циркулем и линейкой» и к более тонким материям: читательскому восприятию литературы. Статья Дмитрия Манина, на которую обратил мое внимание уважаемый tijd, как раз об этом.


Манин отобрал 34 текста разной степени художественности, надергал из них 3439 коротких фрагментов и предложил участникам сетевого эксперимента такие задания. Первое: самостоятельно угадать пропущенное авторское слово во фрагменте текста. Отрицательный логарифм вероятности успеха – мера «непредсказуемости» заданного слова. «Непредсказуемость» формально похожа на шенноновское количество информации, но не тождественна ему; в статье Манин объясняет, почему. А второе задание – выбрать пропущенное слово из двух предложенных (одно из которых – авторское, а другое почерпнуто из неправильных ответов на первый вопрос). Доля правильных ответов служит мерой «связанности» текста.

Оказалось, большинство рифмованных стихов обладают примерно такой же «непредсказуемостью», как проза (образцы которой были, однако, выбраны всего из трех произведений: «Войны и мира», «Доктора Живаго» и некоего публицистического эссе). А вот «связанность» стихов существенно выше, чем прозы – за исключением творений поэтов-авангардистов (Хармс, Введенский и Хлебников), которые зато обходят прозу по своей «непредсказуемости».

А как же иначе, скажете вы – ведь слова в стихотворении подчиняются закономерностям метра и рифмы, а значит, подобрать подходящее для них слово заведомо легче, чем для прозаического высказывания! Но влияние метра можно оценить отдельно, измеряя вероятность угадывания не самого слова, а только числа его слогов («метрическая непредсказуемость»). То же касается и «метрической связанности», определяемой вероятностью выбора из предложенных вариантов правильного числа слогов в пропущенном слове. Интересно, что «неметрическая непредсказуемость» растет по мере увеличения «метрической связанности»: иначе говоря, формальные ограничения повышают информативность текста и расширяют пределы языка.


График из обсуждаемой статьи Дм. Манина, отражающий связь «метрической связанности» и «неметрической непредсказуемости»

К сожалению, автор не объясняет, а почему вообще задачи на угадывание и выбор пропущенного слова дают разный результат? Он просто считает, что «непредсказуемость» характеризует нарушение опережающего читательского ожидания, а «связанность» – удовлетворение апостериорного ожидания, но мне такая интерпретация не очевидна.

Как бы то ни было, эта разница результатов ясно показывает, что «multiple choice questions», которые так любят составители ЕГЭ и подобных новомодных тестов, проверяют вовсе не то же самое, что старые добрые экзаменационные вопросы с открытым ответом :)

А вот обсуждение статьи Дм. Манина в журнале уважаемого a_shen.

Tags: информация, стихи про меня
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 51 comments