Израильский стартап будет защищать крупнейшие ИИ-модели от взлома

время публикации: 18 Сентября 2025 г., 16:40 | последнее обновление: 18 Сентября 2025 г., 16:40

Израильский стартап будет защищать крупнейшие ИИ-модели от взлома

Стартап Irregular разрабатывает методы стресс-тестирования ИИ-моделей компаний OpenAI (разработчик ChatGPT) и Anthropic (разработчик Claude). Стартап уже привлек $80 миллионов.

ИИ-модели, особенно крупные LLM (большие языковые модели), такие как ChаtGPT компании OpenAI или Claude компании Anthropic, знают и умеют гораздо больше, чем можно от них получить с помощью легальных запросов.

Модели обучаются на огромных массивах данных и далеко не все эти данные безопасны. Обучение крайне трудно ограничить только безопасными данными, потому что сама безопасность сильно зависит от контекста использования. Умение моделей писать код можно использовать и для помощи в легальном программировании, и для создания вирусов и проведения атак. Само по себе умение кодировать – нейтрально и запретить его нельзя, если мы хотим, чтобы модели реально помогали. Поэтому разрабатываются фильтры, которые не позволяют создавать вредоносный код.

В то же время злоумышленники создают системы (часто с применением самих же ИИ-моделей), которые обходят фильтры и провоцируют модели создавать вредоносный код и раскрывать запрещенные данные, например, технологии создания взрывчатки. Борьба с такого рода взломом – одна из приоритетных задач всех крупных разработчиков ИИ-моделей. Во многом будущее развитие ИИ зависит от того, насколько он будет безопасным.

Irregular интегрируется с ИИ-моделью, например с ChatGPT или Claude, и имитирует атаки взломщиков при строго контролируемых симуляциях. Компания тестирует потенциал злоупотребления системами при кибератаках и устойчивость моделей под воздействием угроз.

Irregular работает как "честный взломщик". Система анализирует ИИ-модель изнутри, пытаясь понять ее поведение в реальных условиях. Цель компании – заблаговременно выявить уязвимости и разработать защитные механизмы для безопасного внедрения ИИ-технологий.

Используя конфиденциальный вывод и аппаратную верификацию, компания позволяет ведущим ИИ-лабораториям оценивать риски и обеспечивать безопасное развертывание моделей еще до их публичного запуска или широкого внедрения.

Клиентами Irregular являются не только крупнейшие разработчики ИИ-моделей, но и правительственные структуры, включая правительство Великобритании. Компания уже привлекла за два раунда инвестиций $80 миллионов.

Telegram NEWSru.co.il: самое важное за день

Ссылки по теме

// https://admin.newsru.site/ // Экономика // 17 Сентября 2025
Glilot Capital привлекла $500 млн на фонды для инвестиций в ИИ и кибербезопасность в Израиле

// https://admin.newsru.site/ // Наука и Хайтек // 10 Сентября 2025
Израильский стартап разработал ИИ-модель для создания решений кибербезопасности "своими руками"

Израильский стартап будет защищать крупнейшие ИИ-модели от взлома

ВАЖНЫЕ НОВОСТИ