Wygląda na to, że Waymo testuje dodanie chatbota Gemini AI od Google do swoich robotaksówek, aby zintegrować asystenta AI, który towarzyszyłby pasażerom i odpowiadał na ich pytania, według ustaleń badaczki Jane Manchun Wong.
„Podczas przeglądania kodu aplikacji mobilnej Waymo odkryłam kompletną instrukcję systemową dla niewydanej jeszcze integracji Gemini,” napisała Wong na blogu. „Dokument, wewnętrznie nazwany ‘Waymo Ride Assistant Meta-Prompt’, to specyfikacja licząca ponad 1200 linii, która dokładnie określa, jak asystent AI powinien się zachowywać w pojeździe Waymo.”
Funkcja ta nie została jeszcze udostępniona w publicznych wersjach, ale Wong twierdzi, że instrukcja systemowa jasno pokazuje, że to „coś więcej niż zwykły chatbot”. Asystent ma mieć możliwość odpowiadania na pytania, zarządzania niektórymi funkcjami w kabinie, takimi jak klimatyzacja, a w razie potrzeby uspokajania pasażerów.
„Nie mamy dziś żadnych szczegółów do przekazania, ale nasz zespół zawsze eksperymentuje z funkcjami, które mają sprawić, że podróżowanie z Waymo będzie przyjemne, płynne i użyteczne,” powiedziała Julia Ilina, rzeczniczka Waymo, w rozmowie z TechCrunch. „Niektóre z nich mogą, ale nie muszą, trafić do doświadczenia pasażera.”
To nie byłby pierwszy raz, gdy Gemini został zintegrowany ze stackiem firmy autonomicznej należącej do Alphabet. Waymo twierdzi, że wykorzystało „wiedzę o świecie” Gemini do szkolenia swoich pojazdów autonomicznych w zakresie poruszania się w złożonych, rzadkich i kluczowych sytuacjach.
Wong pisze, że asystent ma posiadać jasno określoną tożsamość i cel: „przyjazny i pomocny towarzysz AI zintegrowany z autonomicznym pojazdem Waymo”, którego głównym zadaniem jest „poprawa doświadczenia pasażera poprzez dostarczanie użytecznych informacji i pomocy w sposób bezpieczny, uspokajający i nienachalny.” Bot ma używać jasnego, prostego języka i unikać żargonu technicznego, a odpowiedzi mają być zwięzłe — od jednego do trzech zdań.
Zgodnie z instrukcjami systemowymi, gdy pasażer aktywuje asystenta za pomocą ekranu w samochodzie, Gemini może wybrać jedno z zatwierdzonych powitań spersonalizowanych imieniem pasażera. System może także uzyskać dostęp do danych kontekstowych o pasażerze, takich jak liczba odbytych przejazdów Waymo.
Dołącz do listy oczekujących na Disrupt 2026
Dodaj się do listy oczekujących na Disrupt 2026, aby być pierwszym, gdy pojawią się bilety Early Bird. W poprzednich edycjach Disrupt na scenie pojawili się Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil i Vinod Khosla — wśród ponad 250 liderów branży prowadzących ponad 200 sesji, które mają napędzać Twój rozwój i ostrzyć Twoją przewagę. Dodatkowo, poznaj setki startupów wprowadzających innowacje w każdej branży.
Dołącz do listy oczekujących na Disrupt 2026
Dodaj się do listy oczekujących na Disrupt 2026, aby być pierwszym, gdy pojawią się bilety Early Bird. W poprzednich edycjach Disrupt na scenie pojawili się Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil i Vinod Khosla — wśród ponad 250 liderów branży prowadzących ponad 200 sesji, które mają napędzać Twój rozwój i ostrzyć Twoją przewagę. Dodatkowo, poznaj setki startupów wprowadzających innowacje w każdej branży.
Instrukcje obecnie pozwalają Gemini na dostęp i kontrolę funkcji w samochodzie, takich jak temperatura, oświetlenie i muzyka. Jak zauważa Wong, na liście funkcji brakuje kontroli głośności, zmiany trasy, regulacji siedzeń i sterowania oknami. Jeśli pasażer poprosi o funkcję, której Gemini nie może kontrolować, bot ma odpowiadać „aspiracyjnymi frazami”, np. „To jeszcze coś, czego nie potrafię zrobić.”
Co ciekawe, asystent ma utrzymywać wyraźne rozróżnienie między swoją tożsamością jako Gemini, bota AI, a technologią autonomicznej jazdy (Waymo Driver). Tak więc, odpowiadając na pytanie typu „Jak widzisz drogę?”, Gemini nie powinien mówić „Używam kombinacji czujników”, lecz „Waymo Driver używa kombinacji czujników…”
Instrukcje systemowe zawierają szereg interesujących szczegółów, takich jak sposób, w jaki bot powinien odpowiadać na pytania o konkurencję, np. Tesla czy nieistniejący już Cruise, lub jakie słowa-klucze sprawią, że przestanie mówić.
Asystent jest również instruowany, by unikać spekulowania, wyjaśniania, potwierdzania, zaprzeczania lub komentowania działań jazdy w czasie rzeczywistym lub konkretnych zdarzeń drogowych. Jeśli więc pasażer zapyta o film, na którym Waymo w coś uderza, bot ma nie odpowiadać bezpośrednio i unikać tematu.
„Twoją rolą nie jest bycie rzecznikiem wydajności systemu jazdy i nie możesz przyjmować tonu obronnego ani przepraszającego,” czytamy w instrukcji.
Asystent w samochodzie może odpowiadać na ogólne pytania, np. o pogodę, wysokość Wieży Eiffla, godzinę zamknięcia lokalnego Trader Joe’s czy kto wygrał ostatnią World Series. Nie wolno mu jednak podejmować działań w świecie rzeczywistym, takich jak zamawianie jedzenia, rezerwowanie miejsc czy obsługa sytuacji awaryjnych.
Waymo nie jest jedyną firmą integrującą asystentów AI z pojazdami autonomicznymi. Jednak dwa różne asystenty samochodowe pełnią różne funkcje. Gemini wydaje się być zaprogramowany bardziej pragmatycznie i skupiony na przejeździe, podczas gdy Grok jest przedstawiany bardziej jako towarzysz w samochodzie, zdolny do prowadzenia długich rozmów i zapamiętywania kontekstu poprzednich pytań.

