Robocikowo>ROBOCIKOWO
Gemini 3 Flash

Gemini 3 Flash

3 Flash · Rodzina: Gemini
Multimodalny model językowy Google DeepMind z rodziny Gemini 3, zaprojektowany pod kątem szybkości wnioskowania i niskich kosztów przy zachowaniu możliwości na poziomie zbliżonym do Gemini 3 Pro.
⏳ Preview⏳ Ograniczony dostępLLMModel multimodalnyModel rozumowaniaModel używający narzędzi📁 Gemini
Okno kontekstowe
1M
tokenów
Max output
65 536
tokenów
Data premiery
17 grudnia 2025
Dostęp:APIHostedWdrożenie:☁ Cloud

Przegląd

Gemini 3 Flash to model AI opracowany przez Google DeepMind, ogłoszony 17 grudnia 2025 roku jako rozszerzenie rodziny Gemini 3. Jest to model multimodalny obsługujący wejście tekstowe, obrazy, wideo, audio oraz dokumenty PDF, a na wyjściu generujący tekst i kod.

Model dysponuje oknem kontekstowym do 1 miliona tokenów i maksymalnym wyjściem 64 000 tokenów. Obsługuje narzędzia takie jak wywoływanie funkcji, strukturyzowane wyjście, wyszukiwanie jako narzędzie oraz wykonywanie kodu. Dostępny jest przez Gemini API, Google AI Studio, Vertex AI, Gemini CLI, Android Studio, Google Antigravity oraz aplikację Gemini.

Granica wiedzy modelu (knowledge cutoff) to styczeń 2025. Model udostępniony jest w fazie preview. Parametry modelu nie zostały publicznie ujawnione przez producenta.

Klasyfikacja
LLMModel multimodalnyModel rozumowaniaModel używający narzędzi
Rodzina: Gemini
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 1M
Narzędzia
📥 Wejście: tekst, obraz, audio, wideo
Platformy

Specyfikacja techniczna

Okno kontekstowe
1M
tokenów
Max output tokens
65 536
tokenów na odpowiedź
Knowledge cutoff
1 sty 2025
Data graniczna wiedzy
Licencja
proprietary
Wymagania sprzętowe
Dostępny wyłącznie przez infrastrukturę chmurową Google (Gemini API, Vertex AI, Google AI Studio).
Funkcje:Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimageaudiovideodocuments
⬆ Wyjście (Output)
textcode

Możliwości i zastosowania

Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Rozumienie audio
Zdolność modelu do interpretowania dźwięku, mowy, tonów i sygnałów audio.
Kategoria: audio
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie wideo
Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.
Kategoria: video
Rozumienie wykresów
Zdolność modelu do rozumienia wykresów, trendów, osi, legend i danych wizualnych.
Kategoria: vision
Rozumowanie po diagramach
Zdolność modelu do analizowania diagramów, schematów i relacji przedstawionych wizualnie.
Kategoria: reasoning
OCR
Zdolność modelu do odczytywania i interpretowania tekstu znajdującego się na obrazach lub skanach.
Kategoria: vision
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning
Przeplatane wejście multimodalne
Zdolność do dowolnego łączenia tekstu i obrazu w dowolnej kolejności w ramach jednego polecenia.
Kategoria: reasoning

Wyniki benchmarków

15 benchmarków
Humanity's Last Exam
accuracy · Bez narzędzi, Gemini 3 Flash Thinking
33.7%%
📄 https://deepmind.google/models/gemini/flash/
Pełny zestaw (text + MM). Bez narzędzi.
Humanity's Last Exam
accuracy · Z wyszukiwaniem i wykonaniem kodu, Gemini 3 Flash Thinking
43.5%%
📄 https://deepmind.google/models/gemini/flash/
Pełny zestaw (text + MM). Z wyszukiwaniem i wykonaniem kodu.
GPQA Diamond
accuracy · Bez narzędzi, Gemini 3 Flash Thinking
90.4%%
📄 https://deepmind.google/models/gemini/flash/
Wiedza naukowa, bez narzędzi.
ARC-AGI-2
accuracy · ARC Prize Verified, Gemini 3 Flash Thinking
33.6%%
📄 https://deepmind.google/models/gemini/flash/
Abstrakcyjne puzzle rozumowania, zweryfikowane przez ARC Prize.
AIME 2025
accuracy · Bez narzędzi, Gemini 3 Flash Thinking
95.2%%
📄 https://deepmind.google/models/gemini/flash/
Matematyka, bez narzędzi.
AIME 2025
accuracy · Z wykonaniem kodu, Gemini 3 Flash Thinking
99.7%%
📄 https://deepmind.google/models/gemini/flash/
Matematyka, z wykonaniem kodu.
MMMU-Pro
accuracy · Bez narzędzi, Gemini 3 Flash Thinking
81.2%%
📄 https://deepmind.google/models/gemini/flash/
Multimodalne rozumienie i wnioskowanie, bez narzędzi.
SWE-Bench Verified
accuracy · Jedna próba, Gemini 3 Flash Thinking
78.0%%
📄 https://deepmind.google/models/gemini/flash/
Agentyczne kodowanie, jedna próba.
MMMLU
accuracy · Gemini 3 Flash Thinking
91.8%%
📄 https://deepmind.google/models/gemini/flash/
Wielojęzyczne pytania i odpowiedzi.
Video-MMMU
accuracy · Gemini 3 Flash Thinking
86.9%%
📄 https://deepmind.google/models/gemini/flash/
Zdobywanie wiedzy z filmów wideo.
FACTS Benchmark Suite
accuracy · Gemini 3 Flash Thinking
61.9%%
📄 https://deepmind.google/models/gemini/flash/
Benchmark faktyczności: grounding, wiedza parametryczna, wyszukiwanie i MM.
SimpleQA Verified
accuracy · Gemini 3 Flash Thinking
68.7%%
📄 https://deepmind.google/models/gemini/flash/
Wiedza parametryczna.
τ2-bench
accuracy · Gemini 3 Flash Thinking
90.2%%
📄 https://deepmind.google/models/gemini/flash/
Agentyczne użycie narzędzi.
Toolathlon
accuracy · Gemini 3 Flash Thinking
49.4%%
📄 https://deepmind.google/models/gemini/flash/
Długoterminowe rzeczywiste zadania programistyczne.
MCP Atlas
accuracy · Gemini 3 Flash Thinking
57.4%%
📄 https://deepmind.google/models/gemini/flash/
Wieloetapowe przepływy pracy z użyciem MCP.

Cennik

Architektura techniczna

Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)

Wdrożenie i bezpieczeństwo

☁ Dostępny na platformach
🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise

Gemini 3 Flash dostępny w Vertex AI i Gemini Enterprise. Model przeszedł ewaluacje bezpieczeństwa zgodne z Frontier Safety Framework Google DeepMind. Model card dostępny publicznie.

Aktualizacja: 1 maj 2026↗ Dokumentacja security