Опубликовано в журнале НЛО, номер 2, 2018
Для отечественной цифровой и квантитативной филологии выход русского перевода книги Франко Моретти «Distant Reading» [Моретти 2016] (ср.: [Moretti 2013b]) — событие значимое и знаковое. Знаковое — потому что и сама книга, и термин, вынесенный в ее заглавие, уже стали символом digital humanities как таковых[1]. Значимое — потому что до сих пор по-русски была опубликована только одна статья Моретти по квантитативной поэтике [Моретти 2014б], а также его монография о фигуре буржуа в европейской литературе Нового времени, не имеющая прямого отношения к обсуждаемым здесь темам [Моретти 2014а]. «Дальнее чтение» стало для многих читателей в России настоящим открытием. Этот ретроспективный сборник, объединивший статьи автора за 1994—2011 годы и «дающий хорошее представление об исследовательском развитии Моретти на протяжении последних двух десятилетий» [Собчук 2014], можно вслед за переводчиками «Дальнего чтения» назвать «сводным манифестом ученого» [Моретти 2016: 4].
Перевод «Distant Reading» на русский язык важен еще в одном отношении: в России книга Моретти находит заинтересованных читателей с совершенно иным научным и культурным бэкграундом, чем тот, что характерен для современного американского или европейского гуманитарного истеблишмента[2]. Методология Моретти имеет три основных источника: итальянский марксизм, британский неодарвинизм и русский формализм. Однако «автохтонное» прочтение русского формализма 1920—1930-х годов отличается от «западного» прежде всего тем, что опирается на более широкий круг формалистских и околоформалистских текстов: большинство их попросту не переведены на иностранные языки и не входят в «западный» канон «русской теории».
Тема «Russian Formalism and the Digital Humanities» довольно свежа (что не удивительно, учитывая молодость самих digital humanities). Конференция с таким названием прошла в Стэнфорде в апреле 2015 года; мне довелось в ней участвовать[3]. Открыл конференцию Моретти; во вступительной речи он отметил, что одним из главных методологических импульсов для него стала антология русского формализма, изданная по-французски Цветаном Тодоровым [Todorov 1965] (итальянское издание: [Todorov 1968]).
В 2011 году (год написания самой поздней работы, вошедшей в книгу о «дальнем», или «дистанцированном», чтении) Моретти с коллегами нашли емкое определение своему исследовательскому методу — «квантитативный формализм». Именно так («Quantitative Formalism: An Experiment») озаглавлен подписанный Мэтью Джокерсом, Франко Моретти и их соавторами манифест Стэнфордской литературной лаборатории, сооснователем которой Моретти стал в 2010-м [Allison et al. 2011]. Это название указывает на главный полюс притяжения и отталкивания стэнфордских digital humanities: авторы встают на позицию квантитативного, количественного формализма, поскольку русский формализм, по их мнению, был формализмом квалитативным, изучавшим качественные, а не количественные различия между литературными структурами.
Тезис о новизне квантитативного формализма верен лишь отчасти — если понимать под «формализмом» формализм ОПОЯЗа, как раннего (ОПОЯЗ Шкловского, Брика и Якубинского), так и позднего (ОПОЯЗ Шкловского, Эйхенбаума и Тынянова), а также генеративный формализм Проппа. Именно опоязовская разновидность формализма и была канонизирована для западного мира антологией Тодорова (см.: [Sini 2007: 49]) и последовавшими за ней подборками формалистических статей (в первую очередь нужно назвать англоязычную [Matejka, Pomorska 1971; 1978]). Даже у Томашевского, ставшего одним из пионеров применения вероятностно-статистических методов в стиховедении, в антологию попали только «опоязовская» «Литература и биография» и фрагменты из учебника «Теория литературы (Поэтика)», а из стиховедческих статей «московского периода», впоследствии собранных в книгу «О стихе» (1929), переведены лишь отдельные фрагменты, не содержащие подсчетов [Todorov 1965: 154—169][4].
Среди членов Московского лингвистического кружка был исследователь, распространивший количественные методы далеко за пределы изучения стиха — на все области языка художественной литературы. Это Борис Ярхо (см.: [Гаспаров 1969: 504]). Наибольшее значение имеет его «Методология точного литературоведения» и примыкающие к ней исследования драматических жанров в диахронном и синхронном аспекте (о комедиях и трагедиях Корнеля и о пятиактной трагедии). Эти работы были написаны в период c конца 1920-х до середины 1930-х годов.
Ученый показал, что если выделить жанровые признаки трагедии, которые формулируются в виде числовых параметров (количество явлений в пьесе как мера подвижности действия, количество действующих лиц и пр.), то можно с цифрами на руках продемонстрировать, как эволюция трагедии делится на периоды (ранняя классика, поздняя классика, ранняя романтика, поздняя романтика и т.д.), и установить границы между этими периодами [Ярхо 1997; 2006: 550—607]. А сопоставляя два разных жанра, сосуществующих в одну эпоху (Ярхо взял для сравнения комедии и трагедии одного автора — Пьера Корнеля), можно эти жанры формально дифференцировать: найти квантитативные признаки, по которым они отличаются друг от друга, вычислить пропорции их сочетаний в разных текстах и определить место промежуточных экземпляров (трагикомедий) на шкале между прототипической трагедией и прототипической комедией [Ярхо 1999/2000; 2006: 403—449]. Ярхо делал все свои подсчеты вручную, результаты были очень интересными, но продолжения не воспоследовало: в официальном рескрипте было сказано, что это слишком трудоемко и не под силу одному человеку или даже небольшому коллективу [Штокмар 1997; Акимова, Шапир 2006: viii—ix]. Между тем в тексте «Методологии точного литературоведения» выводы этих работ выполняют функцию всего лишь нескольких примеров наряду с сотнями других.
Борис Эйхенбаум относил к представителям «формального метода» только опоязовцев [Эйхенбаум 1927: 116, примеч. 1]. Такая точка зрения распространена до сих пор. Тем не менее Ярхо считался «формалистом» и не оспаривал этого. В письме к Виктору Жирмунскому от 8 ноября 1919 года он сам называет себя «сторонником “формального метода” и “формалистом”» [Акимова, Шапир 2006: xviii, xxvi, примеч. 34], а сегодняшнему читателю он может показаться даже «ультраформалистом» [Carpi 2006: 145]. При этом Ярхо противопоставлял свой метод опоязовскому как количественный — качественному. Роман Якобсон называл «одним из важнейших, наиболее разработанных и продуктивных понятий теории русского формализма» понятие доминанты [Jakobson 1971: 82; 2005: 87]. В противоположность опоязовцам, интерпретировавшим это понятие в функциональном и аксиологическом аспекте, Ярхо, по его собственным словам, «перевел вопрос о доминанте на количественную базу (разрядка в источнике. —И.П.)» [Ярхо 2006: 107].
Итак, Ярхо является прямым предшественником digital humanities в смысле Моретти именно потому, что формализм Ярхо — квантитативный. Что касается его методики, то некоторые из предложенных им исследовательских программ (например, анализ прозы) были весьма трудоемки. Ярхо называл такие исследования «“муравьиной” работой», требующей скоординированных усилий множества участников [Ярхо 2006: 554]. Ему возражали: зачем советские люди будут производить такое количество разнообразных подсчетов, если еще неизвестно, какой из них пригодится в народном хозяйстве? Сейчас подобного рода возражения снимаются хотя бы потому, что многое можно сделать с помощью компьютера и работа займет гораздо меньше времени — ее можно выполнить в десятки, а то и в сотни раз быстрее. Здесь на помощь «первому» квантитативному литературоведческому формализму приходит «компьютерно-дигитальный» формализм Моретти.
Методологии Моретти и Ярхо типологически сходны еще по целому ряду характеристик — вспомним, например, о серьезном внимании обоих исследователей к аналогиям между литературой и биологией. Однако до самого недавнего времени «дигитальные гуманисты» не были знакомы с «точным литературоведением» в интерпретации Ярхо. Во-первых, до 2006 года «Методология» была известна только по пересказу в статье М.Л. Гаспарова [Гаспаров 1969], куда вошло лишь несколько примеров конкретных подсчетов. Работы о драме тоже были опубликованы достаточно поздно [Ярхо 1997; 1999/2000]. Во-вторых, из-за отсутствия переводов на другие языки о работах Ярхо до последнего времени вообще мало кто знал. И даже в тех немногих отрывках и пересказах его работ, которые вышли по-английски, в основном представлена его методика «морфологического» (структурного) анализа, а не изложение количественных методов изучения литературы [Yarkho 1977; Margolin 1979; Yarkho 2016]. Между первым и вторым (на сегодняшний день — последним) переводом Ярхо на английский прошло 30 лет. Только в 2016 году на английском языке была напечатана статья Гаспарова о Ярхо [Gasparov 2016] — почти через полвека после ее первой публикации по-русски (1969).
Лишь сейчас для публикации в «JLT: Journal of Literary Theory» начал готовиться перевод работы Ярхо «Распределение речи в пятиактной трагедии»[5]. Другая уже упоминавшаяся его работа — «Комедии и трагедии Корнеля», имеющая подзаголовок «Этюд по теории жанра», — еще ждет своего переводчика. Напомню, что «Квантитативный формализм» Джокерса, Моретти и соавторов тоже посвящен проблеме различения жанров по количественным признакам. Многоязычному сообществу, формирующемуся вокруг Стэнфордской литературной лаборатории, полезно было бы ознакомиться с выкладками предшественника-первопроходца.
Нужны переводы и других работ Ярхо или хотя бы их фрагментов. Особый интерес представляет § 10 «Методологии» [Ярхо 2006: 117—206], в котором показано, как элементарные статистические методы (построение вариационных рядов, вычисление диапазона вариации, кульминации, медианы, моды, среднего арифметического, среднего квадратичного отклонения и др.) могут быть применены к изучению литературы и какую они могут получить содержательную интерпретацию, т.е. как они объясняют те или иные особенности литературной структуры или литературной эволюции.
Так, Ярхо отмечает, что если мы при изучении вариативности «какого-нибудь фонического или стилистического факта получаем кривую, близкую к биноминальной» (т.е. к кривой нормального, или Гауссова, распределения, она же кривая Кетле), «то можно почти с уверенностью сказать, что перед нами — факт языка, а не факт искусства» [Ярхо 2006: 161][6]. И, напротив, «когда строится кривая какой-нибудь действительно художественной формы, то она не совпадает с кривою Кетле, даже не приближается к ней, а бывает либо асим[м]етричной, либо эксцес[с]ивной» [Ярхо 2006: 161]. Многовершинная кривая нередко означает, что в изучаемом материале выделяется несколько гетерогенных групп явлений, несколько разных форм, подчиняющихся разным закономерностям [Ярхо 2006: 178—183][7].
Ярхо наглядно показывает, как построение эксцессивной кривой помогает установить и истолковать тот или иной факт поэтики. Например, раннесиллабические поэты еще не очень хорошо чувствуют слоговое равенство строк. Если посчитать частотность стиховых отрезков в их произведениях с точностью до одного слога, то выстраивается двухвершинная и изломанная кривая. Все встает на свои места (получается одновершинная, эксцессивная кривая), если увеличить интервал до трех слогов: оказывается, стихотворцы не ощущали разницы в 1—2 слога, такие строки воспринимались ими как равные. Аналогичным образом Ярхо анализирует колоны рифмованной прозы [Ярхо 2006: 174—177].
Едва ли не главное значение обсуждаемых здесь работ Моретти — это реабилитация квантитативных литературоведческих исследований, возвращение интереса к ним и демонстрация их современных возможностей. В связи с этим, я полагаю, возникает необходимость обращения к научному наследию русского «квантитативного формализма». Ярхо, Томашевский и их последователи предложили массу ценных идей относительно того, какие аспекты литературного произведения и литературной эволюции можно квантифицировать, что и как можно считать и какие содержательные выводы можно сделать из полученных цифр. В 1960-е годы новые перспективы применения статистики к стиховедческому материалу открыл великий математик Андрей Колмогоров. Его работы по вероятностно-статистическому анализу стиха были собраны под одной обложкой лишь недавно [Колмогоров 2015] и на иностранные языки — при мировой известности Колмогорова — не переведены.
Ярхо считал, что исследование любой области формы идет от анализа (т.е. от выделения существенных признаков данного «литературного комплекса») к синтезу (т.е. к статистическим операциям над сводными цифровыми показателями) и далее, через сравнение с другими литературными комплексами, к выводам о закономерностях в развитии и функционировании изучаемого явления. Условие успешного применения статистики — филологически корректный анализ структуры текста. С одной стороны, литературоведческому толкованию подлежат только те данные, которые получены путем объективного статистического исследования. С другой стороны, «принцип применения статистики таков: ни одна статистическая величина не вводится без морфологического анализа, т.е. без проверки того, какие реальные литературные явления она отражает» [Ярхо 2006: 7]; ср.: [Пильщиков 2015: 327—328]. Этой процедурной фундированности нередко не хватает современным digital humanities, чьи построения иногда вызывают впечатление методологически наивных.
Основных «претензий» к методологии Моретти у меня две.
С одной из них Моретти так или иначе знаком и даже отчасти согласен, поскольку ранее ее выдвигал критик «дальнего чтения» Кристофер Прендергаст (см. статью «Конец начала: ответ Кристоферу Прендергасту» [Моретти 2016: 193—221]). Речь идет о произвольной интерпретации взаимоотношений между коррелирующими рядами: один объявляется каузальным по отношению к другому, причем на роль каузатора всегда претендует социоэкономический ряд. Так, в «Style, Inc.» много интересных догадок, которые напрямую не следуют из выявленной корреляции. На мой взгляд, весьма гадательный характер имеет предлагаемая Моретти интерпретация дисбаланса между числом романных заглавий, начинающихся с определенного и с неопределенного артикля, или его интерпретация повышенной частотности формулы «The X of Y» в заглавиях готических романов. Возьмем и более убедительную гипотезу, выдвинутую в той же статье, — о том, что предпочтение коротких заглавий длинным стало следствием увеличения числа романов: список заглавий в «книжных обозрениях» многократно увеличивается, на каждое заглавие остается меньше места, и, чтобы быть замеченным, роман должен с первого взгляда отличаться по заглавию от продукции конкурентов. Строго говоря, здесь наблюдается подтверждаемая цифрами корреляция («романов стало больше» || «заглавия стали короче»), а установление причинной связи — чистая догадка, которая никак не обосновывается приведенными цифрами. Из корреляции вообще нельзя вывести причинно-следственную связь (ср.: [Собчук 2015]). Установленный факт корреляции помогает обнаружить проблему, поставить вопрос, но не дать на него ответ. Моретти или не понимает этого, или скрывает из риторических соображений, эффектно утверждая, что наличие причинно-следственной связи доказываетсяподсчетами.
Второй момент, на котором я хотел бы остановиться, также обсуждался ранее — это представление о том, что «дистанцированное» чтение (distant reading) исключает «медленное» (close reading), что объектом науки о литературе может быть только «литература в целом» (как у Веселовского), а не отдельное произведение[8]. Однако то, что «эти две стратегии должны не противопоставляться, а дополнять друг друга, ясно и эксплицировано давно: “…чтобы делать что-то в области отвлеченного чтения, нужно хорошо освоить медленное чтение”» [Орехов 2017: 36] (процитирована статья Гаятри Чакраворти Спивак о мир-системном анализе: [Spivak 2006])[9]. Я тоже убежден, что понимание отдельного произведения углубляется и уточняется при знакомстве с более широким и тем более со «сверхшироким» контекстом.
С помощью компьютеров Моретти намеревается прочесть «великое непрочтенное» — «the great unread» (выражение Маргарет Коэн). Действительно, когда мы просто интерпретируем тексты, то сколько текстов мы можем изучить? Один, десять, пусть сто, в крайнем случае тысячу — а их гораздо больше. Существует несколько тысяч английских романов XVIII—XIX веков, которые никто никогда не прочтет, говорит Моретти. Раньше их читали, теперь нет. Но мы до сих пор любим Филдинга, Стерна, Джейн Остин, Теккерея или Диккенса и хотим знать, в чем их специфика. Чтобы понять специфику шедевров, надо знать культурный фон, на котором они создавались. Что делать? Изучать эти тысячи романов дистантно, выявив некоторые формализуемые признаки, по которым уже сейчас компьютер может анализировать большие текстовые объемы. В этом преимущество быстрого, отстраненного, «дистанцированного» чтения («distant reading») перед медленным, пристальным чтением («close reading»).
Возрождение и переосмысление интеллектуального наследия русского формализма в последние десятилетия позволяет выделить важнейшие «постформалистические» оппозиции. Один полюс каждой такой дихотомии ассоциируется с «квалитативным», а другой — с «квантитативным» подходом к литературе:
текст vs. контекст / интертекст
отдельные тексты vs. текстовые массивы / литература в целом
close reading vs. distant reading
квалитативный vs. квантитативный подход
Полагаю, что эти антиномии могут быть разрешены на практике. Квантитативному синтезу (т.е. математическим и статистическим операциям) предшествует структурный анализ (т.е. определение релевантных параметров), а за синтезом следует качественное истолкование математических результатов: необходимо проинтерпретировать ту или иную количественную характеристику в терминах литературной структуры, функции и эволюции. Конкретизация представлений о литературной структуре позволяет точнее определить параметры, релевантные для ее синхронического и диахронического описания. Такое круговое движение в изучении формы может быть сопоставлено с «герменевтическим кругом», неизбежно возникающим при любой интерпретации: мы движемся от части к целому, затем от целого к части, затем снова от части к целому и т.д., все больше приближаясь к окончательно не достижимой цели. Но это и есть наука.
[1] В том же, 2013 году, что и «Distant Reading», вышла в свет еще одна «знаковая» книга digital humanities — «Макроанализ» Мэтью Джокерса [Jockers 2013].
[2] Моретти принадлежит им обоим и одновременно им обоим бросает интеллектуальный вызов.
[3] См. веб-страницу конференции: digitalhumanities.stanford.edu/russian-formalism-digital-humanities (дата обращения: 05.11.2017); резюме докладов: digitalhumanities.stanford.edu/russian-formalism-digital-humanities-abstracts (дата обращения: 05.11.2017); аналитическую хронику: [Ustinov 2016].
[4] Напомню, что в 1918—1921 годах Томашевский жил в Москве и активно участвовал в заседаниях Московского лингвистического кружка.
[5] Сообщено Мариной Акимовой.
[6] Разрядку источника здесь не воспроизвожу.
[7] В современной России Гауссово распределение и многовершинные кривые получили широкую известность, будучи использованы для описания «нормальной» и «аномальной» избирательной активности населения [Шпилькин 2009; 2011; Сонин и др. 2012]. Как известно, после обнаружения фальсификаций на выборах в декабре 2011 года протестующие выходили на митинги с плакатами «Чурову (председателю ЦИК. — И.П.) не верим! Верим Гауссу!» [Штерн 2011].
[8] Точнее, объектом исследования у Моретти становятся «единицы, намного бóльшие или намного меньшие, чем текст: приемы, темы, тропы или же жанры и системы», а «сам текст» «в промежутке между очень маленьким и очень большим» попросту исчезает [Моретти 2016: 83]. См. об этом: [Steiner 2017].
[9] См. также компетентный аналитический обзор дигитальных проектов, ориентированных на «дистанцированное» и «медленное» чтение: [Jänicke et al. 2015].
Работа выполнена при финансовой поддержке Российского научного фонда (проект № 17-18-01701; Институт мировой культуры МГУ).