Опубликовано в журнале Дружба Народов, номер 6, 2020
Рубрика «Блог-пост» продолжает расширять свои границы и обращаться не только к теме литературного блогинга, но и к более общим вопросам о функционировании литературы в цифровом пространстве, взаимодействии литературы и новейших технологий. В июньском номере специальный гость рубрики — Кирилл Штольц (прикладной математик, Санта-Барбара, США) рассказывает о «слабом» и «сильном» искусственном интеллекте и о том, как определить критерий «литературности» в технических терминах.
Из недавнего разговора с приятелем:
— Ну ладно, старик, ну что вот нового может сказать искусственный интеллект в литературе?
— А ты что можешь?
Иногда споры заканчиваются неловко, особенно если ты — исследователь в области искусственного интеллекта, а твой оппонент — писатель, которого, как и художника, каждый может обидеть. Обида — гуманитарное, общечеловеческое понятие, один из признаков человеческого интеллекта. Другие признаки — аналитические способности и возможность учитывать сотни факторов при решении разнообразных проблем (так называемая «комбинаторность» мозга). В английском языке для описания человеческого интеллекта есть два слова: intellectual и smart. Первое — это способность удерживать в голове сотни комбинаций и крутить их там же, в голове, как химик очередную рогатую молекулу в трехмерном пространстве: шахматисты, аналитики, любые «люди книги», заучивающие наизусть сотни комбинаций, обладают этим умением. Smart же на русский переводится приблизительно как «смекалка» и предполагает способность проводить параллели между разными предметными областями.
Заставить машину имитировать первый тип ума довольно легко. Машины по природе комбинаторны. Так и родился искусственный интеллект — точнее, «слабый» искусственный интеллект. Он знает все комбинации и обыграет вас в шахматы или «Старкрафт». Но при этом слабый искусственный интеллект не способен понять, что такое шашки или «Вархаммер», если его предварительно не обучить решению этих конкретных задач. Теоретически существует также и сильный искусственный интеллект — тот самый, который smart, и которым нас пугают алармисты. На деле, несмотря на все чаще возникающие в общественном дискурсе мифы об опасности искусственного интеллекта, до «умного» ИИ нам еще очень и очень далеко.
«Натаскивание» на решение определенного типа задач — далеко не новая и весьма распространенная методика.Как один из примеров — именно это сейчас практикуется, например, со школьниками и ЕГЭ.1 Готовя школьников к ЕГЭ, учителя выдают им списки летнего чтения и экзаменуют путем опросов самых разных типов, от контрольной до сочинения. В результате одиннадцатиклассник способен написать текст «от себя» с изложением основных моментов литературного произведения. У него есть собственный жизненный опыт, он мыслит и может производить что-то свое. Отсюда возникает ряд вопросов: возможно ли, что этот процесс математически формализуем? представляет ли он собой перебор комбинаций уже виденного? что такое литературный синтез?
Разберем, как с задачей генерации текста справляется машина. Пойдем от простого к сложному. Кажется, Карнеги советовал: если вы хотите, чтобы текст (или речь) выглядели связными, начинайте каждое новое предложение с последнего слова старого: «На нашем острове водятся дикие собаки. Собаки — это животные, требующие регулярного выгула. Регулярный выгул является неотъемлемой частью режима пенитенциарных учреждений». Таким образом можно получить связный текст или бесконечно вести монолог (при условии, что тема и регламент не заданы). По сути, этот пример иллюстрирует основную идею автоматического создания текста — так называемой «цепи Маркова»: любой язык имеет грамматику и устоявшиеся словосочетания. То есть зная два или три слова, мы можем сгенерировать следующее, четвертое. Безусловно, литературные качества такого текста вызывают много вопросов, но мы идем от простого к сложному.
Вообще все простые (а следовательно в основном, ранние) решения задачи генерации текста основаны на, казалось бы, логичном подходе, ориентированном на правила. На проанализированную заранее грамматику или на набор подобранных по ходу пьесы жестких эвристик. Например, так работают деревья решений: на вход подается предобработанный текст, а на выходе получается дерево уточняющих вопросов, ответы на которые либо «да», либо «нет». Так получаются «если-то-иначе» правила. Довольно жестко заданные, но часто не поддающиеся здравому смыслу. Например, «если в предложении есть слово собака, то перейти к следующему вопросу в дереве про блохи, иначе, перейти к вопросу про сколько слов в предложении».
Следующий по сложности концепт называется «TransformerNetwork». Описать его можно формулой «убираем одно слово из предложения и попробуем это слово угадать». Этот принцип лежит в основе работы большинства современных языковых моделей в машинном обучении. А сама парадигма машинного обучения состоит в том, чтобы статистически генерировать такие догадки путем анализа больших корпусов текстов из реального мира.
Резюмируя, можно сделать следующий вывод. На сегодняшний день машина может запоминать, воспроизводить, выбирать наиболее подходящее решение поставленной задачи — и не может выйти за рамки поставленных ей задач. Что же касается «литературности», то, на мой взгляд, в качестве некой интегральной метрики она может быть определена как степень выхода за рамки конкретной задачи. Этот процесс может быть определен как «литературный синтез».
Когда меня спрашивают: «Когда машины станут писать литературу, как люди?» — я обычно говорю, что вопрос изначально сформулирован неточно. Во-первых, предположение, что разумная машина должна быть похожа в своем поведении на человека, в целом неверно. Во-вторых, не существует единой системы координат «ума». Кто умнее — англичанин, который изобрел паровой двигатель, или австралийский абориген, делающий великолепные бумеранги? Или пересмешник, который может запомнить до двухсот звуковых последовательностей и воспроизводить их безошибочно? Существуют разные виды интеллекта, основанные на разных наборах навыков.
Всю свою жизнь человек расширял и «дополнял» свои органы. У Ильина в «Рассказе о великом плане» постоянно говорится о расширении и дополнении рук и ног машинами. В двадцатом веке мы расширили и дополнили сначала память (все меньше и меньше интересных собеседников без гугла под рукой), а потом и некоторые другие отделы мозга. Устный счет проиграл калькулятору как инструменту. Следующие на очереди — расширение и дополнение эмоций, чувственности за счет искусственного разума, не наделенного сознанием, но наделенного причудливыми эмоциями.
Я придерживаюсь мнения, что возможно существование целого пласта литературы, которая будет иметь мало общего с созданной человеком, но тем не менее будет иметь право называться литературой. И самый интересный вопрос: а кому же будет принадлежать авторское право, если ИИ сможет создать нечто значимое?
1 Разница заключается в том, что при «натаскивании» машин можно заглянуть под капот и посмотреть: а какие закономерности образовались в процессе такого обучения? Как мыслит алгоритм в процессе решения проблемы, под которую он был заточен? Скажем, фирменной чертой шахматной программы «Каисса», созданной в 1971 году в СССР, была возможность просмотреть промежуточные этапы анализа следующего хода.