Google po cichu udostępniło w App Store aplikację Google AI Edge: Eloquent, która pozwala na zaawansowane dyktowanie tekstów offline. Dzięki wykorzystaniu modeli Gemma, narzędzie nie tylko zamienia mowę na tekst bez wysyłania danych do chmury, ale też automatycznie redaguje notatki do profesjonalnej formy.
Najważniejsze w skrócie:
- Prywatność przede wszystkim: Cały proces rozpoznawania mowy i edycji tekstu odbywa się lokalnie na urządzeniu.
- Modele Gemma pod maską: Aplikacja wykorzystuje lekkie modele Google z rodziny Gemma do zaawansowanej obróbki języka naturalnego.
- Inteligentna redakcja: Eloquent automatycznie usuwa wypełniacze (np. „eee”, „yyy”) i formatuje tekst w wybranym stylu.
- Dostępność: Narzędzie zadebiutowało na iOS, ale oficjalna dokumentacja sugeruje rychłą premierę wersji na Androida.
Nowa era dyktowania: Google AI Edge wchodzi do gry
W świecie zdominowanym przez chmurowe rozwiązania AI, Google wykonuje niespodziewany ruch w stronę krawędziowego przetwarzania danych (edge computing). Nowa aplikacja Google AI Edge: Eloquent, która pojawiła się w sklepie Apple bez hucznych zapowiedzi, stanowi istotny krok w rozwoju mobilnych asystentów. W przeciwieństwie do standardowych narzędzi speech-to-text, które często wymagają stabilnego połączenia z internetem, Eloquent stawia na pełną autonomię.
Aplikacja po pobraniu niezbędnych pakietów językowych pozwala na rejestrację mowy w trybie offline. Największą innowacją nie jest jednak sama transkrypcja, a to, co dzieje się z tekstem po zakończeniu nagrania. Dzięki integracji z modelami Gemma, Eloquent oferuje funkcje transformacji tekstu. Użytkownik może wybrać tryby takie jak „Key points” (najważniejsze punkty), „Format” czy „Smart”, które zamieniają surowy, często chaotyczny zapis głosowy w uporządkowaną notatkę lub profesjonalny e-mail.
Gemma na iPhonie, czyli moc modeli lokalnych
Sercem aplikacji jest rodzina otwartych modeli Gemma, które Google zoptymalizowało pod kątem wydajności na urządzeniach mobilnych. To kluczowy element strategii firmy, która stara się udowodnić, że potężne możliwości generatywnej AI nie muszą wiązać się z wysokimi opóźnieniami przesyłu danych ani ryzykiem naruszenia prywatności.
Działanie lokalne ma dwie fundamentalne zalety:
- Brak opóźnień (Latency): System nie musi czekać na odpowiedź serwera, co sprawia, że edycja tekstu po dyktowaniu jest niemal natychmiastowa.
- Bezpieczeństwo: Wrażliwe dane, takie jak treść spotkań biznesowych czy prywatne przemyślenia, nigdy nie opuszczają pamięci smartfona.
Aplikacja oferuje również funkcję „Cloud mode”, która pozwala na wykorzystanie mocniejszych modeli Gemini w chmurze do bardziej złożonych zadań redakcyjnych, jednak domyślnym i promowanym trybem pozostaje przetwarzanie lokalne.
Rywalizacja z Wispr Flow i Apple Intelligence
Ruch Google jest bezpośrednim uderzeniem w rosnący segment specjalistycznych aplikacji do dyktowania, takich jak popularny wśród profesjonalistów Wispr Flow. Dotychczas to mniejsze startupy przodowały w oferowaniu „inteligentnego” dyktowania, które rozumie kontekst i usuwa pauzy w mowie. Eloquent oferuje podobną funkcjonalność, ale z zapleczem technologicznym jednego z największych graczy na rynku AI.
Warto zauważyć, że premiera ta zbiega się w czasie z intensywnymi pracami Apple nad Apple Intelligence. Google, wydając Eloquent najpierw na iOS, wykonuje ciekawy unik marketingowy – dostarcza użytkownikom iPhone'ów zaawansowane funkcje AI, zanim samo Apple w pełni wdroży swoje natywne rozwiązania oparte na modelach on-device.
Integracja i przyszłość na Androidzie
Choć obecnie aplikacja jest dostępna wyłącznie dla użytkowników systemów Apple, znaleziska w kodzie i opisy w App Store jednoznacznie wskazują na wersję dla systemu Android. Według dostępnych informacji, na systemie Google aplikacja ma oferować jeszcze głębszą integrację, w tym funkcję „floating button” (pływającego przycisku), umożliwiającego wywołanie dyktowania w dowolnym polu tekstowym innej aplikacji.
W wersji na iOS Eloquent pozwala już teraz na personalizację słownika (dodawanie własnych nazwisk czy żargonu branżowego) oraz przeszukiwanie historii transkrypcji, co czyni z niej kompletne narzędzie do zarządzania wiedzą i komunikacją.
Dlaczego to ważne?
Pojawienie się Google AI Edge: Eloquent to czytelny sygnał, że walka o dominację w AI przenosi się z gigantycznych centrów danych bezpośrednio do naszych kieszeni. Dla Google jest to test bojowy dla modeli Gemma w środowisku konsumenckim. Jeśli technologia sprawdzi się na iPhone'ach, możemy spodziewać się, że stanie się ona integralną częścią Gboard oraz systemu Android, redefiniując to, jak piszemy wiadomości.
Z perspektywy rynkowej, Google rzuca wyzwanie nie tylko Apple, ale i płatnym usługom transkrypcyjnym. Oferując darmowe (przynajmniej na razie), zaawansowane narzędzie działające offline, gigant z Mountain View podnosi poprzeczkę dla całego sektora aplikacji produktywnych. To także ważny precedens w kwestii prywatności – gigant reklamowy, kojarzony z gromadzeniem danych, promuje rozwiązanie, którego fundamentem jest to, że dane pozostają u użytkownika.
Co dalej?
- Ekspansja na Androida: Należy spodziewać się oficjalnej zapowiedzi wersji na system Google, prawdopodobnie z głębszą integracją na poziomie systemowym.
- Aktualizacja modeli: Google prawdopodobnie będzie regularnie odświeżać lokalne wagi modeli Gemma, zwiększając ich precyzję redakcyjną przy zachowaniu niskiego zapotrzebowania na energię.
- Odpowiedź konkurencji: Apple będzie musiało wykazać, że ich natywne Siri i narzędzia do pisania w iOS 18 (i nowszych) są równie elastyczne, co zewnętrzna aplikacja konkurenta.
Źródła
- Apple App Store – Google AI Edge Eloquent – https://apps.apple.com/ca/app/google-ai-edge-eloquent/id6756505519
- Google Developers Blog – Bring state-of-the-art agentic skills to the edge with Gemma 4 – https://developers.googleblog.com/bring-state-of-the-art-agentic-skills-to-the-edge-with-gemma-4/
- Google Blog / DeepMind – Gemma 4: Our most capable open models to date – https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
- 9to5Google – Google AI Edge Eloquent is an offline voice dictation app – https://9to5google.com/2026/04/06/google-ai-edge-eloquent-app/
- Wispr Flow – Pricing – https://wisprflow.ai/pricing
- Wispr Docs – Setup Wispr Flow on Android – https://docs.wisprflow.ai/articles/8858845757-setup-wispr-flow-on-android-android-settings





