Gemini 3 to trzecia generacja modeli Gemini od Google DeepMind, multimodalna rodzina modeli o zaawansowanych możliwościach rozumowania, kodowania i planowania.
Okno kontekstowe
1M tokenów
tokenów
Parametry
nieujawnione
parametrów
Max output
65 536
tokenów
Data premiery
18 listopada 2025
Dostęp:APIHostedWdrożenie:☁ Cloud
Przegląd
Zastosowania
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 1M tokenów
🧩 Parametry: nieujawnione
✓ Narzędzia
📥 Wejście: tekst, obraz, audio, wideo…
Platformy
Specyfikacja techniczna
Okno kontekstowe
1M tokenów
tokenów
Parametry
nieujawnione
parametrów
Max output tokens
65 536
tokenów na odpowiedź
Knowledge cutoff
1 sty 2025
Data graniczna wiedzy
Licencja
proprietary
Wymagania sprzętowe
Dostęp przez infrastrukturę Google Cloud (Vertex AI / Gemini API) lub aplikację Gemini.
Funkcje:✓ Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimageaudiovideodocuments
⬆ Wyjście (Output)
textcode
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Rozumienie audio
Zdolność modelu do interpretowania dźwięku, mowy, tonów i sygnałów audio.
Kategoria: audio
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie wideo
Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.
Kategoria: video
Rozumienie wykresów
Zdolność modelu do rozumienia wykresów, trendów, osi, legend i danych wizualnych.
Kategoria: vision
Rozumowanie po diagramach
Zdolność modelu do analizowania diagramów, schematów i relacji przedstawionych wizualnie.
Kategoria: reasoning
OCR
Zdolność modelu do odczytywania i interpretowania tekstu znajdującego się na obrazach lub skanach.
Kategoria: vision
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning
Przeplatane wejście multimodalne
Zdolność do dowolnego łączenia tekstu i obrazu w dowolnej kolejności w ramach jednego polecenia.
Kategoria: reasoning
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Wyniki benchmarków
14 benchmarków
Humanity's Last Exam
accuracy · Bez narzędzi, Gemini 3 Pro Thinking (High)
37.5%%
📄 https://deepmind.google/models/gemini/flash/
Wynik dla wariantu Gemini 3 Pro Thinking (High), bez użycia narzędzi. Pełny zestaw (text + MM).
GPQA Diamond
accuracy · Bez narzędzi, Gemini 3 Pro Thinking (High)
91.9%%
📄 https://deepmind.google/models/gemini/flash/
Wynik dla wariantu Gemini 3 Pro Thinking (High), bez użycia narzędzi.
SWE-Bench Verified
accuracy · Jedna próba, Gemini 3 Pro Thinking (High)
76.2%%
📄 https://deepmind.google/models/gemini/flash/
Agentic coding benchmark, jedna próba.
MMMU-Pro
accuracy · Bez narzędzi, Gemini 3 Pro Thinking (High)
81.0%%
📄 https://deepmind.google/models/gemini/flash/
Multimodal understanding and reasoning benchmark.
MMMLU
accuracy · Gemini 3 Pro Thinking (High) / Gemini 3 Flash Thinking
91.8%%
📄 https://deepmind.google/models/gemini/flash/
Multilingual Q&A benchmark. Flash: 91.8%, Pro: 91.8%.
ARC-AGI-2
accuracy · ARC Prize Verified, Gemini 3 Pro Thinking (High)
31.1%%
📄 https://deepmind.google/models/gemini/flash/
Abstract reasoning puzzles, ARC Prize Verified.
Humanity's Last Exam
accuracy · Bez narzędzi, Gemini 3.1 Pro Thinking (High)
44.4%%
📄 https://deepmind.google/models/gemini/pro/
Wynik dla wariantu Gemini 3.1 Pro Thinking (High), bez użycia narzędzi. Pełny zestaw (text + MM).
GPQA Diamond
accuracy · Bez narzędzi, Gemini 3.1 Pro Thinking (High)
94.3%%
📄 https://deepmind.google/models/gemini/pro/
Wynik dla wariantu Gemini 3.1 Pro Thinking (High).
SWE-Bench Verified
accuracy · Jedna próba, Gemini 3.1 Pro Thinking (High)
80.6%%
📄 https://deepmind.google/models/gemini/pro/
Agentic coding benchmark, jedna próba.
ARC-AGI-2
accuracy · ARC Prize Verified, Gemini 3.1 Pro Thinking (High)
77.1%%
📄 https://deepmind.google/models/gemini/pro/
Abstract reasoning puzzles, ARC Prize Verified.
ARC-AGI-2
accuracy · ARC Prize Verified, Gemini 3.1 Deep Think Feb 2026
84.6%%
📄 https://deepmind.google/models/gemini/deep-think/
Abstract reasoning puzzles, ARC Prize Verified. Najlepszy wynik w rodzinie Gemini 3.
Humanity's Last Exam
accuracy · Bez narzędzi, Gemini 3.1 Deep Think Feb 2026
48.4%%
📄 https://deepmind.google/models/gemini/deep-think/
Pełny zestaw (text + MM).
GPQA Diamond
accuracy · Bez narzędzi, Gemini 3.1 Flash-Lite High
86.9%%
📄 https://deepmind.google/models/gemini/flash-lite/
Scientific knowledge benchmark.
MMMU-Pro
accuracy · Bez narzędzi, Gemini 3.1 Flash-Lite High
76.8%%
📄 https://deepmind.google/models/gemini/flash-lite/
Multimodal understanding and reasoning benchmark.
Cennik
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)
Wdrożenie i bezpieczeństwo
☁ Dostępny na platformach
🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise
Gemini 3 przeszedł kompleksowe ewaluacje bezpieczeństwa zgodnie z Frontier Safety Framework Google DeepMind. Model card dostępny publicznie pod adresem deepmind.google/models/model-cards/gemini-3-pro.
Aktualizacja: 1 maj 2026↗ Dokumentacja security
