» » » Google представил «самую умную» рассуждающую модель ИИ

Google представил «самую умную» рассуждающую модель ИИ

Изображение от freepik

Google представила новое поколение своего искусственного интеллекта — модель Gemini 2.5 Pro, которая умеет «размышлять» перед тем, как дать ответ. Компания называет модель самой умной на сегодняшний день, пишет «Хайтек».

Gemini 2.5 Pro — мультимодальная модель, способная работать с текстом, изображениями, видео, аудио и программным кодом. Её ключевая особенность — пошаговое логическое мышление. Модель анализирует задачи поэтапно, прежде чем сформулировать ответ, что позволяет достигать большей точности и глубины в решениях.

По словам генерального директора Google DeepMind Демиса Хассабиса, Gemini 2.5 Pro значительно превосходит конкурентов в области кодирования, точных наук и мультимодального анализа. «Это потрясающая современная модель», — отметил он. Gemini 2.5 Pro показал впечатляющие результаты в ряде бенчмарков, особенно в задачах, требующих логики, памяти и работы с длинными контекстами.

  Сравнение моделей в разных бенчмарках. Изображение: Google

В математических тестах модель набрала 92% на AIME 2024 и 86,7% на AIME 2025, уступив только Grok 3 Beta от xAI. В задачах по программированию у Gemini 70,4% на LiveCodeBench v5 (одиночный проход) и 74% в тесте Aider Polyglot по редактированию кода — результат, который превосходит GPT-4.5 и Claude 3.7 (64,9%).

В бенчмарке MRCR, предназначенном для проверки способности ИИ анализировать тексты объемом до 128 тыс. токенов, модель показала 91,5% точности. Даже при работе с контекстом в миллион токенов Gemini сохранила высокий результат — 83,1%, превзойдя всех конкурентов.

Также Gemini 2.5 Pro уверенно выступила в одном из самых сложных тестов на рассуждение — Humanity’s Last Exam или «Последний экзамен человечества». Результат в тесте без использования вспомогательных инструментов — 8,8%. Для сравнения: GPT-4.5 справилась с ним на 6,4%, а Claude 3.7 — на 8,9%. Этот бенчмарк считается одним из самых требовательных и приближенных к реальным задачам, требующим глубинного понимания и логики.

Технические характеристики впечатляют: модель работает с контекстным окном объёмом в 1 млн токенов, а в будущем Google обещает увеличить его до 2 млн. Модель уже доступна разработчикам через Google AI Studio и подписчикам тарифа Gemini Advanced ($20 в месяц). Цены на доступ к API пока не раскрыты — компания обещает сообщить подробности в ближайшее время.



ДРУГИЕ НОВОСТИ

Комментарии

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.
САМОЕ ЧИТАЕМОЕ / КОММЕНТИРУЕМОЕ
  1. Переезды по Минску и Беларуси
  2. Прорыв в квантовой физике: создан уникальный квазикристалл времени
  3. Представлен первый принтер с защитой от хакеров
  4. Mercedes-Benz A-Class отправится в отставку
  5. Новый автомобильный бренд Jeland появится в России
  6. Женщины выбрали лучший автомобиль года
  7. Обработка металлических деталей на станках ЧПУ: качество и точность от компании Numerik Part
  8. Тротуарная плитка от компании "Фабрика-плитки": качество и стиль в каждой детали
  9. Свет впервые превратили в твердое тело, которое течет как жидкость
  10. Представлен смартфон на солнечной энергии
Галерея