🈲 Стоит ли использовать AI для код-ревью
Меня зовут Александр Скворцов, я ведущий разработчик в команде Браузера и Поискового приложения iOS.
Мы продолжаем экспериментировать с нейросетями в ревью. мой коллега Александр Денисов прокомментировал работу, которую проделал искусственный интеллект. А сегодня я хочу сравнить анализ AI и взгляд человека на приложение Financify. Это трекер расходов на SwiftUI, на код которого мы уже смотрели в спецпроекте:
🟠
https://www.youtube.com/watch?v=rMdYZk0PfT0&
🟠
https://www.youtube.com/watch?v=TeQ5xMbaWcM
🟰 Теперь посмотрим на нейровью!
Я прогнал код через Claude Opus 4.6 Max. Модель выдала мне отчёт в 46 файлах, которые охватили практически весь проект — от доменных моделей до UI-компонентов, утилит и тестов:
🟠 Нашла баги, которые человек легко пропустит
🟠 Выявила много мёртвого кода
🟠 Детально разобрала concurrency
🟰 Где есть ограничения
Замечания по SwiftUI требуют не чтения документации, а реального опыта. AI знает теорию, но не чувствует, где на практике могут возникнуть проблемы. Также он пока слаб в архитектурных советах: указывает на проблему, но не предлагает, как её решить, часто ограничивается формальными шаблонными замечаниями и не пытается пересматривать сложные концепции. А ещё AI только критикует, хотя для баланса в ревью должны быть и положительные замечания, чтобы мотивировать автора.
🟰 Кстати, пару месяцев назад я делал этот же разбор, но с более старой моделью
Тогда я использовал ChatGPT 5.2 с высоким уровнем рассуждений. Она тоже за несколько минут сделала довольно подробное ревью, на которое человеку потребуется несколько часов:
🟠 Обнаружила проблему с потокобезопасностью
🟠 Нашла часть неиспользуемого кода
🟠 Выявила много багов и несогласованностей
🟠 Провела системный анализ и составила карту проекта
🟰 Но минусов было больше, чем у свежей модели
Нейросеть не заметила некоторых архитектурных изъянов и не уделила внимания API-дизайну и типизации. А также сгенерировала много замечаний, но не отделила критичные баги от общих рекомендаций, из-за чего объём комментариев получился избыточным. К тому же ChatGPT 5.2 проигнорировала инструкцию из промпта, а Opus — нет.
Прогресс налицо: за несколько месяцев AI стал лучше следовать инструкциям, нашёл больше реальных багов, перестал давать нерелевантные комментарии и системно прошёлся по проекту. Но проблемы с глубиной анализа фреймворка и архитектурными рекомендациями остались. Комментарии нейросети не анализируют сложные концепции, а носят скорее механический характер.
🟰 Какой вывод можно сделать
Сейчас AI-ревью для меня выглядит как хорошее дополнение, но не замена человеческому анализу. Нейросеть умеет находить повторяющиеся паттерны ошибок, тривиальные семантические несоответствия и системные риски. Но живой разработчик лучше понимает контекст продукта и анализирует качество API и архитектуру, а также приоритизирует фокус внимания 🧐
Поэтому наилучший результат ревью даст комбинация искусственного и естественного интеллекта.
🎲 Полный разбор нейроревью с комментариями: https://github.com/DeeSee/Financify-Review/pull/3 и https://github.com/DeeSee/Financify-Review/pull/2.
🎲 А посмотреть все выпуски нашего спецпроекта «Разбор кода»
https://www.youtube.com/playlist?list=PLvUkJ7nHZygfzQbBtLxx5adM-beJsAg4t.
Подписывайтесь:
💬
📹
https://www.youtube.com/@YandexforMobile