Сегодня Google выпустила свою быструю и недорогую модель Gemini 3 Flash, основанную на Gemini 3, представленной в прошлом месяце, стремясь перехватить инициативу у OpenAI. Компания также делает эту модель по умолчанию в приложении Gemini и в режиме искусственного интеллекта в поиске.
Новая модель Flash появилась через шесть месяцев после анонса Google модели Gemini 2.5 Flash и предлагает значительные улучшения. В тестах производительности модель Gemini 3 Flash значительно превосходит свою предшественницу и по ряду показателей сопоставима с другими передовыми моделями, такими как Gemini 3 Pro и GPT 5.2.
Например, она набрала 33,7% без использования инструментов на бенчмарке Humanity’s Last Exam, который предназначен для проверки экспертизы в различных областях. Для сравнения: Gemini 3 Pro набрала 37,5%, Gemini 2.5 Flash — 11%, а недавно выпущенная GPT-5.2 — 34,5%.
На мультимодальном и логическом бенчмарке MMMU-Pro новая модель превзошла всех конкурентов с результатом 81,2%.
Внедрение для потребителей
Google делает Gemini 3 Flash моделью по умолчанию в приложении Gemini по всему миру, заменяя Gemini 2.5 Flash. Пользователи по-прежнему могут выбрать модель Pro через селектор моделей для математических и программных вопросов.
Компания утверждает, что новая модель хорошо определяет мультимедийный контент и может давать ответы на его основе. Например, вы можете загрузить короткое видео по pickleball и попросить советы; попробовать нарисовать эскиз и попросить модель угадать, что вы рисуете; или загрузить аудиозапись для анализа или создания викторины.
Компания также отметила, что модель лучше понимает намерения запросов пользователей и может генерировать более визуальные ответы с такими элементами, как изображения и таблицы.
Присоединяйтесь к листу ожидания Disrupt 2026
Добавьте себя в лист ожидания Disrupt 2026, чтобы быть первым в очереди, когда появятся билеты Early Bird. На прошлых Disrupt выступали Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil и Vinod Khosla — часть более чем 250 лидеров отрасли, проводящих более 200 сессий для вашего роста и развития. Кроме того, познакомьтесь с сотнями стартапов, внедряющих инновации во всех секторах.
Присоединяйтесь к листу ожидания Disrupt 2026
Добавьте себя в лист ожидания Disrupt 2026, чтобы быть первым в очереди, когда появятся билеты Early Bird. На прошлых Disrupt выступали Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil и Vinod Khosla — часть более чем 250 лидеров отрасли, проводящих более 200 сессий для вашего роста и развития. Кроме того, познакомьтесь с сотнями стартапов, внедряющих инновации во всех секторах.
Вы также можете использовать новую модель для создания прототипов приложений в приложении Gemini с помощью подсказок.
Gemini 3 Pro теперь доступна всем в США для поиска, а также больше людей в США могут получить доступ к модели изображений Nano Banana Pro в поиске.
Доступность для предприятий и разработчиков
Google отметила, что такие компании, как JetBrains, Figma, Cursor, Harvey и Latitude уже используют модель Gemini 3 Flash, которая доступна через Vertex AI и Gemini Enterprise.
Для разработчиков компания предоставляет модель в предварительном доступе через API и в Antigravity, новом инструменте программирования Google, выпущенном в прошлом месяце.
Компания заявила, что Gemini 3 Pro набирает 78% на проверочном бенчмарке SWE-bench для программирования, уступая только GPT-5.2. Также отмечается, что модель идеально подходит для видеоанализа, извлечения данных и визуального Q&A, а благодаря своей скорости — для быстрых и повторяющихся рабочих процессов.
Image Credits: Google Стоимость модели составляет $0,50 за 1 миллион входных токенов и $3,00 за 1 миллион выходных токенов. Это немного дороже, чем $0,30 за 1 миллион входных токенов и $2,50 за 1 миллион выходных токенов у Gemini Flash 2.5. Но Google утверждает, что новая модель превосходит Gemini 2.5 Pro, при этом работает в три раза быстрее. Кроме того, для мыслительных задач она использует в среднем на 30% меньше токенов, чем 2.5 Pro. Это значит, что в целом вы можете сэкономить на количестве токенов для определённых задач.
Image Credits: Google «Мы действительно позиционируем Flash как рабочую лошадку. Если посмотреть, например, на цены за ввод и вывод в верхней части этой таблицы, Flash — это гораздо более дешёвое предложение с точки зрения стоимости ввода и вывода. И это действительно позволяет многим компаниям выполнять массовые задачи», — сказала Тулси Доши, старший директор и руководитель продукта Gemini Models, в брифинге для TechCrunch.
С момента выпуска Gemini 3 Google обрабатывает более 1 триллиона токенов в день через свой API, на фоне ожесточённой гонки релизов и производительности с OpenAI.
В начале этого месяца, по сообщениям, Сэм Альтман отправил внутреннюю записку «Code Red» команде OpenAI после того, как трафик ChatGPT снизился, а доля Google на рынке потребителей выросла. После этого OpenAI выпустила GPT-5.2 и новую модель генерации изображений. OpenAI также похвасталась ростом корпоративного использования и заявила, что объём сообщений ChatGPT увеличился в 8 раз с ноября 2024 года.
Хотя Google напрямую не прокомментировала конкуренцию с OpenAI, компания отметила, что выпуск новых моделей стимулирует все компании к активности.
«То, что происходит в отрасли, — это то, что все эти модели продолжают быть потрясающими, бросают вызов друг другу, двигают границы. И я думаю, что также здорово, что компании выпускают эти модели», — сказала Доши.
«Мы также внедряем новые бенчмарки и новые способы оценки этих моделей. И это тоже нас мотивирует».
