Вопрос об исторической фальсификации и использовании искусственного интеллекта в научных целях стал критически важным в цифровом мире. Заведующий научно-исследовательской археологической лабораторией ВятГУ, старший научный сотрудник Института истории и археологии Уральского отделения РАН Алексей Кайсин рассказал об ИИ-подделках исторических документов.
– Алексей Олегович, что такое историческая фальсификация и почему она актуальна в эпоху искусственного интеллекта?
– Фальсификация источников существовала всегда: подделывали текстовые, фотографические источники. Искусственный интеллект позволяет подделывать исторические документы массово и в ускоренном режиме.
Искусственный интеллект может написать письмо или дневник какого-то известного человека, используя стилистику времени, идиоматические изображения и слова. Он может создать вариации искажений фотографий, спроектировать голос исторической личности с учетом тембра, характеристик голоса. ИИ под силу подделка видео исторических событий.
Причём с ИИ переписать историю может почти каждый. Весь XXI век научное сообщество оцифровывало источники информации с бумажных носителей, переводя их в цифру. Огромное количество архивных сведений, которые раньше были закрыты для широкого круга, сейчас стали доступны: подшивки периодических печатей, документы актового характера, законы. Почти любой желающий может скачать эту подшивку, загрузить искусственному интеллекту, и, например, в годовой подшивке газет появится 10–15 не существовавших ранее – сфальсифицированных – статей.
– Почему именно развитие машинной обработки данных создает угрозу искажения исторических фактов?
– Главная проблема искусственного интеллекта заключается в следующем: он не понимает, что такое фальсификация источника, и использует любые данные, которые ему дают и к которым у него есть доступ.
ИИ, обрабатывая большой массив данных, поддельные источники тоже учитывает. В результате появляются исторические искажения, которые не отражают действительность.
– В чём заключается опасность инкорпорации фальсифицированных библиографических ссылок и поддельных научных статей в базы данных вроде РИНЦ или Web of Science?
– Эти базы данных позволяют оценивать значимость того или иного научного труда, уровень цитируемости и прочие наукометрические показатели. Журналы ВАК или Scopus, Web of Science следят за качеством текстов – его фактологией.
Но есть опасность возникновения следующей проблемы: кто-то, работая над научным вопросом, может использовать интернет-ресурсы и данные, которые могли быть созданы искусственным интеллектом. Возможно, появится случайный неправильный вывод, основанный на фальсификате. Подобная статья, опубликованная даже в небольшом сборнике РИНЦ, попадёт в базу данных, и на нее в дальнейшем будут ссылаться другие исследователи, производя далёкие от исторической правды сущности.
– Как инструменты искусственного интеллекта могут использоваться для создания подложных научных работ?
– Работа с текстами: все, что связано с этим, искусственный интеллект будет генерировать, искажая историю.
Например, возьмём дневник военного, опубликованный в 50-е годы в печатном виде, оцифрованный и лежащий в настоящее время в какой-нибудь из библиотек. Человек, намеревающийся сфальсифицировать этот источник, может дать искусственному интеллекту промт: «Изменить отношение к тому или иному событию у автора». При сохранении фабулы будут изъяты незаметные глазу вещи: исчезнет плохое отношение к мирному населению, хорошее – к врагу и так далее. Таких изменений будет немного, но они в совершенно другом варианте покажут прошлое.
Если такой дневник оцифровать и выложить в Сеть, то к нему у многих будет доверительное отношение, ведь мы часто лояльны к печатному слову.
– Что можно считать главным вызовом для современного исследователя, работающего в условиях «больших данных»?
– Раньше ученый брал источник и смотрел его содержание, контекст создания: кто, когда и в каких условиях его написал. Сейчас нужно понимать, на каких основах работает искусственный интеллект технически, знать источник тех исторических данных, с которыми он работает. Важно знать место хранения источника; обращать внимание на огромный пласт литературы, на основе которой могут создаваться выводы, которых не существовало в реальности.
Рано или поздно законодательство в сфере искусственного интеллекта появится, будут водные знаки или нечто подобное, чтобы маркировать то, что им создано.
– Какую пользу искусственный интеллект приносит исторической науке?
– Несмотря на то, что ИИ может стать источником искажения исторического прошлого, он, безусловно, преимущество для учёного-историка. Я – цифровой позитивист, поддерживаю использование цифровых методов. Например, ИИ помогает в контент-анализе: когда загружается большое количество информации и находятся какие-то микро- или макропаттерны.
То, что раньше занимало много времени, сейчас с помощью машинной обработки искусственный интеллект делает за несколько минут. Мы находим ответы на те вопросы, которые до этого даже не задавали. Например, как менялся стиль изложения исторических событий на протяжении 20–30 лет. Когда-то на это уходило большое количество времени, сейчас – меньше.
– Алексей Олегович, благодарим Вас за подробный рассказ об исторической фальсификации и влиянии искусственного интеллекта на исторические источники.
Материал подготовлен при поддержке Минобрнауки России в рамках Десятилетия науки и технологий




