Prihod chatGPT v izteku leta 2022 je pri Googlu prižgal rdeče alarme. Podjetje je pohitelo in februarja 2023 predstavilo svojo različico pogovornega bota. Googlov bard je imel zanimivo predstavitev zmogljivosti, a so strokovnjaki po koncu opozorili na nekaj napak oziroma laži, ki si jih je med predstavitvijo privoščila umetna inteligenca. Tako imenovano »haluciniranje« je stalni spremljevalec trenutne umetne inteligence, dejstvo, da je pri Googlu niso opazili med pripravo predstavitve, pa je bila za mnoge velika blamaža. Google se kljub neuspehu ni predal. Ta teden je predstavil nov model umetne inteligence, ki se imenuje gemini (dvojček).

OpenAI se je razvoja orodij z umetno inteligenco lotil na široko, a tudi zelo ciljno naravnano in osredotočeno. Razvili so model dall-e, ki je sposoben iz besedila ustvariti slike. ChatGPT je sposoben iz besedila ustvariti nova besedila. Wisper zna prepisati govor v besedilo. Omenjeni modeli so bili razviti ločeno in so samostojni izdelki. Možno jih je sicer povezati, a se to dogaja na drugi ravni, ko posamezni modeli komunicirajo med seboj. Google se je z razvojem geminija zadeve lotil celostno in že v izhodišču razvil model umetne inteligence, ki je sposoben interakcije v mediju pisane besede, zvoka, podob in videa. Google se je v predstavitvi pohvalil, da najbolj napredna različica njihovega geminija, gemini ultra, prekaša zmogljivosti chatGPT-4 v 30 od 32 kategorijah. Med drugim naj bi gemini ultra na vprašanja s posameznih področij odgovarjal celo bolje od strokovnjakov za to področje.

Google svojega modela gemini ultra še ni ponudil v testiranje splošni javnosti. To naj bi se zgodilo enkrat v letu 2024. Poleg ultre je Google razvil še dva bolj racionalizirana in manj zmogljiva modela. Nekoliko manj zmogljiv gemini pro je po predstavitvi že vgrajen v posodobljeno različico Googlovega barda. Trenutno deluje zgolj v angleščini, a naj bi se s časom to spremenilo. Dostopen pa je v 170 državah po svetu. Zaradi nerešenih vprašanj z varnostjo osebnih podatkov novi bard ni dostopen znotraj EU. Varstvo podatkov v tem primeru ni trivialno vprašanje. Ker je gemini sposoben prepoznavati besedilo, zvok, podobe in video, bard pa je povezan z vsemi Googlovimi storitvami uporabnika, je možnosti za analiziranje osebnih podatkov ogromno. Predstavljajte si umetno inteligenco, ki ima vpogled v vašo elektronsko pošto, vaše najljubše videe na youtubu, vaše pri Googlu shranjene fotografije in videoposnetke, ima dostop do vnosov v Googlove koledarje in podatke, ki jih zbirajo Googlovi zemljevidi … Tako bogastvo podatkov bi pametnemu osebnemu asistentu sicer ponujalo izredno bogat kontekst, kaj vas pri vašem vprašanju zares zanima. Hkrati pa gre za nočno moro varovanja osebnih podatkov. Prvi testi so sicer pokazali, da je prenovljeni bard v praksi dokaj blizu tega, kar ponuja brezplačna različica chatGPT 3.5. Bolje se odreže pri nekaterih nalogah. Pri drugih še vedno slabše.

Gemini obstaja še v tretji obliki, ki je najbolj racionalizirana in dovolj kompaktna, da jo bo mogoče naložiti na telefon in bi lahko delovala brez spletne povezave s podatkovnimi centri v oblaku. Ta različica se imenuje gemini nano je že prišla na Googlov mobilnik pixel 8 pro.

Je pa Google tudi tokrat pripravil impresivno demonstracijo zmogljivosti gemini ultre. V videu, ki so ga objavili na youtubu, prikazujejo, kako gemini ultra v živo prepoznava podobe, ki jih demonstrator riše na list papirja, si izmišljuje nove zabavne igre na podlagi fizičnih in virtualnih orodij, ki so mu dana na razpolago, in še mnogo več. Vtis je, da bo gemini ultra revolucionarna umetna inteligenca, s katero bo mogoče v živo komunicirati o praktično vsem, a resnica je verjetno dosti manj impresivna. Pozorni spletni uporabniki so namreč opazili, da je Google med predstavitvijo geminija goljufal in objavil močno urejeno obliko interakcije. Podjetje je kasneje priznalo, da so izrezali odzivni čas geminija, prav tako so bila navodila geminiju podana v pisani obliki. Poteza ne pomeni, da gemini ultra ob izidu ne bo predstavljal pomembnega koraka naprej za umetno inteligenco. Pomeni pa, da je Google leto sklenil podobno, kot ga je začel. Z blamažo zaradi demonstracije.