Google представил «самую умную» рассуждающую модель ИИ

26-03-2025, 16:54
Новости / Наука и технологии главная

3 559

Изображение от freepik

Google представила новое поколение своего искусственного интеллекта — модель Gemini 2.5 Pro, которая умеет «размышлять» перед тем, как дать ответ. Компания называет модель самой умной на сегодняшний день, пишет «Хайтек».

Gemini 2.5 Pro — мультимодальная модель, способная работать с текстом, изображениями, видео, аудио и программным кодом. Её ключевая особенность — пошаговое логическое мышление. Модель анализирует задачи поэтапно, прежде чем сформулировать ответ, что позволяет достигать большей точности и глубины в решениях.

По словам генерального директора Google DeepMind Демиса Хассабиса, Gemini 2.5 Pro значительно превосходит конкурентов в области кодирования, точных наук и мультимодального анализа. «Это потрясающая современная модель», — отметил он. Gemini 2.5 Pro показал впечатляющие результаты в ряде бенчмарков, особенно в задачах, требующих логики, памяти и работы с длинными контекстами.

Сравнение моделей в разных бенчмарках. Изображение: Google

В математических тестах модель набрала 92% на AIME 2024 и 86,7% на AIME 2025, уступив только Grok 3 Beta от xAI. В задачах по программированию у Gemini 70,4% на LiveCodeBench v5 (одиночный проход) и 74% в тесте Aider Polyglot по редактированию кода — результат, который превосходит GPT-4.5 и Claude 3.7 (64,9%).

В бенчмарке MRCR, предназначенном для проверки способности ИИ анализировать тексты объемом до 128 тыс. токенов, модель показала 91,5% точности. Даже при работе с контекстом в миллион токенов Gemini сохранила высокий результат — 83,1%, превзойдя всех конкурентов.

Также Gemini 2.5 Pro уверенно выступила в одном из самых сложных тестов на рассуждение — Humanity’s Last Exam или «Последний экзамен человечества». Результат в тесте без использования вспомогательных инструментов — 8,8%. Для сравнения: GPT-4.5 справилась с ним на 6,4%, а Claude 3.7 — на 8,9%. Этот бенчмарк считается одним из самых требовательных и приближенных к реальным задачам, требующим глубинного понимания и логики.

Технические характеристики впечатляют: модель работает с контекстным окном объёмом в 1 млн токенов, а в будущем Google обещает увеличить его до 2 млн. Модель уже доступна разработчикам через Google AI Studio и подписчикам тарифа Gemini Advanced ($20 в месяц). Цены на доступ к API пока не раскрыты — компания обещает сообщить подробности в ближайшее время.