Gemini 2.5 Pro: новое поколение нейросетевых моделей от Google

Компания Google представила новое поколение нейросетевых моделей под названием Gemini 2.5, которые специализируются на аналитических способностях.
Топовая версия семейства, Gemini 2.5 Pro, представляет собой универсальную модель с продвинутыми когнитивными функциями. Она способна обрабатывать различные типы информации, делать выводы и находить решения сложных проблем с учётом контекста. По заявлению разработчиков, эти возможности станут характерными для всех будущих представителей линейки Gemini 2.5.
В сравнении с предшественницей Gemini 2.0 Flash Thinking, новая модель показывает впечатляющий рост производительности. Она занимает лидирующие позиции в нескольких независимых тестированиях: LMArena (пользовательские предпочтения), AIME 2025 (математические способности) и GPQA diamond (научные знания). Особенно примечателен результат в 18,8% в сложном тесте Humanity’s Last Exam, который оценивает интеллектуальные способности на пределе человеческих возможностей.
В сфере программирования Gemini 2.5 Pro демонстрирует значительный прогресс относительно предыдущей версии. В тестировании SWE-Bench Verified модель достигла показателя 63,8%, опередив конкурентов от OpenAI и DeepSeek, хотя и уступив лидеру в лице Claude 3.7 Sonnet от Anthropic (70,3%). В испытаниях по редактированию кода (Aider Polyglot) модель показала результат 68,6%, обойдя большинство существующих решений.
Одно из ключевых преимуществ Gemini 2.5 Pro — способность работать с массивами данных объёмом до миллиона токенов, с перспективой увеличения до двух миллионов. Такая функциональность даёт возможность обрабатывать масштабные наборы информации, включая текстовые документы, аудиофайлы, изображения, видеоматериалы и программные репозитории.
Google позиционирует своё новое творение как конкурентоспособное решение в противовес моделям типа o1 от OpenAI. Особое внимание уделяется потенциалу Gemini 2.5 в создании автономных ИИ-ассистентов, способных самостоятельно решать поставленные задачи.