Стартап Гая Айзенкота занял первое место в мировом рейтинге тестирования ИИ-кода
Израильская стартап-компания "Баз" заняла первое место по показателю точности в тестах проверки кода, написанного с помощью ИИ, в рамках недавно запущенного рейтинга Code Review Bench.
Кроме того, компания заняла второе место в сводном рейтинге, учитывающем как точность, так и охват.
Рейтинг Code Review Bench – первый в мире бенчмарк такого рода, сосредоточенный на проверке качества кода, созданного искусственным интеллектом.
"Баз" основан в конце 2023 года предпринимателем Гаем Айзенкотом (сыном бывшего начальника генштаба ЦАХАЛа Гади Айзенкота) и Нимродом Кором, которые вместе служили в подразделении 8200.
Гай был одним из основателей Bridgecrew, проданной в 2021 году компании Palo Alto Networks за 200 миллионов долларов. После сделки он занимал должность вице-президента по управлению продуктом и отвечал за безопасность приложений в Palo Alto.
Стартап разрабатывает ИИ-инструменты для автоматической проверки кода, которые помогают командам разработки выявлять проблемы и предлагать исправления в соответствии с заданными правилами и настройками.
Новый индекс Code-Review Bench был разработан исследователями, ранее работавшими над продвинутыми моделями в Google DeepMind, Anthropic и Meta, в рамках исследовательской лаборатории в Сан-Франциско. Команда лаборатории изучала, как модели по-настоящему и полноценно понимают механический интеллект, исходя из того, что построение моделей методом проб и ошибок не равнозначно их научному пониманию. По этой причине она разрабатывает метрики для оценки реального интеллекта, лежащего в основе использования технологий написания кода с помощью ИИ.


