Учёные предлагают ограничить доступ к опасным биологическим данным, чтобы ИИ не использовали для создания вирусов

Более ста исследователей из университетов Джонса Хопкинса, Оксфорда, Стэнфорда, Колумбии и Нью-Йоркского университета призвали ввести ограничения на распространение отдельных наборов данных по инфекционным заболеваниям. По их мнению, такие данные при обучении ИИ могут снизить барьер для разработки опасных вирусов.

Учёные предлагают ограничить доступ к опасным биологическим данным, чтобы ИИ не использовали для создания вирусов

Авторы инициативы предлагают выработать правила обращения с определённой категорией биологической информации по аналогии с режимом защиты медицинских данных. Речь не идёт о закрытии науки или ограничении доступа к большинству исследований. Напротив, исследователи подчёркивают, что подавляющая часть биологических данных должна оставаться открытой. Ограничения, по их замыслу, должны касаться лишь узкого сегмента информации, которая существенно повышает риск злоупотребления.

Причина обеспокоенности связана с тем, как работают современные модели искусственного интеллекта. Их возможности определяются данными, на которых они обучены. Если система получает доступ к массивам, связывающим генетические характеристики вирусов с такими свойствами, как заразность или способность обходить иммунный ответ, она может научиться выявлять закономерности, которые упрощают проектирование новых патогенов. Чем точнее и полнее такие датасеты, тем ниже становится технический порог для потенциального злоумышленника.

Ассистент-профессор Центра безопасности здравоохранения Университета Джонса Хопкинса Джасси Панну, одна из авторов предложенного подхода, подчёркивает, что речь не идёт о публичных версиях ChatGPT или Claude. Опасения вызывают специализированные модели для биологических исследований. Некоторые из них используют архитектуры, сходные с крупными языковыми моделями, но обучаются не на тексте, а на последовательностях ДНК. Исследования последних лет показали, что методы, применяемые для анализа человеческого языка, позволяют моделям осваивать и «язык» генетики.

Часть разработчиков уже добровольно отказалась обучать свои системы на данных по вирусологии, опасаясь последствий. Однако если соответствующие массивы информации остаются в открытом доступе, сторонние группы могут использовать их для дообучения собственных моделей без аналогичных ограничений. По словам Панну, легитимные исследователи должны иметь доступ к таким материалам, но их распространение не должно происходить анонимно и бесконтрольно.

Авторы документа также обращают внимание на то, что новые биологические ИИ-модели нередко публикуются без базовой оценки рисков, которая в других областях наук о жизни считается стандартной практикой. Они предлагают, чтобы правительства регулярно пересматривали перечень ограничиваемых данных и корректировали его по мере развития технологий. Такой подход предполагает гибкое регулирование, а не постоянный запрет.

Дискуссия разворачивается в момент, когда администрация Дональда Трампа продвигает ускоренную повестку развития ИИ и запустила миссию Genesis, предполагающую обучение систем на масштабных научных массивах для ускорения открытий. В этой логике максимальная открытость данных рассматривается как условие технологического лидерства. Авторы инициативы не спорят с необходимостью ускорения науки, но утверждают, что скорость не должна исключать элементарные механизмы предотвращения злоупотреблений.

Обозреватели в области биобезопасности и ИИ отмечают, что окно для превентивных мер постепенно сужается. По мере роста вычислительных мощностей и распространения специализированных моделей сама комбинация открытых данных и доступных инструментов становится источником системного риска. Аналитики подчёркивают, что в отличие от физического оборудования или редких реагентов цифровые данные невозможно «изъять» после публикации: если чувствительные сведения однажды оказались в свободном доступе, контроль над их дальнейшим использованием практически утрачивается.

Начать дискуссию