Multimodalny model językowy Google DeepMind z rodziny Gemini 3, zaprojektowany pod kątem szybkości wnioskowania i niskich kosztów przy zachowaniu możliwości na poziomie zbliżonym do Gemini 3 Pro.
Okno kontekstowe
1M
tokenów
Max output
65 536
tokenów
Data premiery
17 grudnia 2025
Dostęp:APIHostedWdrożenie:☁ Cloud
Przegląd
Zastosowania
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 1M
✓ Narzędzia
📥 Wejście: tekst, obraz, audio, wideo…
Platformy
Specyfikacja techniczna
Okno kontekstowe
1M
tokenów
Max output tokens
65 536
tokenów na odpowiedź
Knowledge cutoff
1 sty 2025
Data graniczna wiedzy
Licencja
proprietary
Wymagania sprzętowe
Dostępny wyłącznie przez infrastrukturę chmurową Google (Gemini API, Vertex AI, Google AI Studio).
Funkcje:✓ Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimageaudiovideodocuments
⬆ Wyjście (Output)
textcode
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Rozumienie audio
Zdolność modelu do interpretowania dźwięku, mowy, tonów i sygnałów audio.
Kategoria: audio
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie wideo
Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.
Kategoria: video
Rozumienie wykresów
Zdolność modelu do rozumienia wykresów, trendów, osi, legend i danych wizualnych.
Kategoria: vision
Rozumowanie po diagramach
Zdolność modelu do analizowania diagramów, schematów i relacji przedstawionych wizualnie.
Kategoria: reasoning
OCR
Zdolność modelu do odczytywania i interpretowania tekstu znajdującego się na obrazach lub skanach.
Kategoria: vision
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning
Przeplatane wejście multimodalne
Zdolność do dowolnego łączenia tekstu i obrazu w dowolnej kolejności w ramach jednego polecenia.
Kategoria: reasoning
Wyniki benchmarków
15 benchmarków
Humanity's Last Exam
accuracy · Bez narzędzi, Gemini 3 Flash Thinking
33.7%%
📄 https://deepmind.google/models/gemini/flash/
Pełny zestaw (text + MM). Bez narzędzi.
Humanity's Last Exam
accuracy · Z wyszukiwaniem i wykonaniem kodu, Gemini 3 Flash Thinking
43.5%%
📄 https://deepmind.google/models/gemini/flash/
Pełny zestaw (text + MM). Z wyszukiwaniem i wykonaniem kodu.
GPQA Diamond
accuracy · Bez narzędzi, Gemini 3 Flash Thinking
90.4%%
📄 https://deepmind.google/models/gemini/flash/
Wiedza naukowa, bez narzędzi.
ARC-AGI-2
accuracy · ARC Prize Verified, Gemini 3 Flash Thinking
33.6%%
📄 https://deepmind.google/models/gemini/flash/
Abstrakcyjne puzzle rozumowania, zweryfikowane przez ARC Prize.
AIME 2025
accuracy · Bez narzędzi, Gemini 3 Flash Thinking
95.2%%
📄 https://deepmind.google/models/gemini/flash/
Matematyka, bez narzędzi.
AIME 2025
accuracy · Z wykonaniem kodu, Gemini 3 Flash Thinking
99.7%%
📄 https://deepmind.google/models/gemini/flash/
Matematyka, z wykonaniem kodu.
MMMU-Pro
accuracy · Bez narzędzi, Gemini 3 Flash Thinking
81.2%%
📄 https://deepmind.google/models/gemini/flash/
Multimodalne rozumienie i wnioskowanie, bez narzędzi.
SWE-Bench Verified
accuracy · Jedna próba, Gemini 3 Flash Thinking
78.0%%
📄 https://deepmind.google/models/gemini/flash/
Agentyczne kodowanie, jedna próba.
MMMLU
accuracy · Gemini 3 Flash Thinking
91.8%%
📄 https://deepmind.google/models/gemini/flash/
Wielojęzyczne pytania i odpowiedzi.
Video-MMMU
accuracy · Gemini 3 Flash Thinking
86.9%%
📄 https://deepmind.google/models/gemini/flash/
Zdobywanie wiedzy z filmów wideo.
FACTS Benchmark Suite
accuracy · Gemini 3 Flash Thinking
61.9%%
📄 https://deepmind.google/models/gemini/flash/
Benchmark faktyczności: grounding, wiedza parametryczna, wyszukiwanie i MM.
SimpleQA Verified
accuracy · Gemini 3 Flash Thinking
68.7%%
📄 https://deepmind.google/models/gemini/flash/
Wiedza parametryczna.
τ2-bench
accuracy · Gemini 3 Flash Thinking
90.2%%
📄 https://deepmind.google/models/gemini/flash/
Agentyczne użycie narzędzi.
Toolathlon
accuracy · Gemini 3 Flash Thinking
49.4%%
📄 https://deepmind.google/models/gemini/flash/
Długoterminowe rzeczywiste zadania programistyczne.
MCP Atlas
accuracy · Gemini 3 Flash Thinking
57.4%%
📄 https://deepmind.google/models/gemini/flash/
Wieloetapowe przepływy pracy z użyciem MCP.
Cennik
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)
Wdrożenie i bezpieczeństwo
☁ Dostępny na platformach
🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise
Gemini 3 Flash dostępny w Vertex AI i Gemini Enterprise. Model przeszedł ewaluacje bezpieczeństwa zgodne z Frontier Safety Framework Google DeepMind. Model card dostępny publicznie.
Aktualizacja: 1 maj 2026↗ Dokumentacja security
