• C Novo mesto
  • 12:51
  • Čet, 22.02.2024

Google Gemini: Najbolj zmogljiva UI v tem trenutku

Google je pred kratkim razkril svojo konkurenco slavnemu ChatGPT, ki spada pod znamko OpenAI. Google Gemini je nov program umetne inteligence, ki se uči vzorcev za ustvarjanje novih, kot so slike, besede in drugi mediji. Google je že predstavil tudi Barda, ki je slonel oziroma sloni zgolj na tekstovni izmenjavi. Zdaj Google to izboljšuje z modelom Gemini, pri katerem gre za multi-modalni model umetne inteligence. Kaj vse vemo o Google Gemini? Kako se Google Gemini primerja z GPT-4 in GPT-3.5?

Google Gemini je naš ponos, pravijo pri podjetju

»Vsak tehnološki premik je priložnost za napredek znanstvenih odkritij, pospešitev človeškega napredka in izboljšanje življenj. Verjamem, da bo prehod, ki smo mu trenutno priča z umetno inteligenco, najgloblji v naših življenjih, veliko večji od prehoda na mobilne naprave ali splet pred tem. UI ima potencial za ustvarjanje priložnosti – od vsakodnevnih do izjemnih – za ljudi širom sveta. Prinesel bo nove valove inovacij in gospodarskega napredka ter spodbudil znanje, učenje, ustvarjalnost in produktivnost v obsegu, kot ga še nismo videli. To je tisto, kar me navdušuje: priložnost, da UI pomaga vsem, povsod po svetu,« je o Googlu Geminiju povedal direktor Googla, Sundar Pichai. Dodal je, da je šlo za osemletno pot od nastanka njihovega prvega UI oddelka, a da procesa še niti približno ni konec.

V imenu ekipe Gemini je spregovoril tudi direktor in soustanovitelj Google DeepMind, Demis Hassabis. »Umetna inteligenca je bila v središču mojega življenjskega dela, tako kot za mnoge moje raziskovalne kolege. Odkar sem kot najstnik programiral umetno inteligenco za računalniške igre in skozi leta kot nevroznanstveni raziskovalec, ki sem poskušal razumeti delovanje možganov, sem vedno verjel, da če bi lahko izdelali pametnejše stroje, bi jih lahko izkoristili v korist človeštva na neverjeten način,« je pojasnil. Pri tem je posebej poudaril pomen obljube o svetu, ki ga odgovorno podpira umetna inteligenca, in jo še naprej vodi delo Google DeepMind. »Dolgo časa smo želeli zgraditi novo generacijo modelov umetne inteligence, ki jih je navdihnil način, kako ljudje razumejo svet in komunicirajo z njim. UI, ki se zdi manj kot pameten kos programske opreme in bolj kot nekaj uporabnega in intuitivnega – strokovni pomočnik ali pomočnik,« je povedal.

Google je predstavil umetno inteligenco Google Gemini

Google je predstavil umetno inteligenco Google Gemini

Google Gemini od A do Ž

Gemini je najbolj prilagodljiv model UI pri Googlu doslej – učinkovito naj bi deloval na vsem, od podatkovnih centrov do mobilnih naprav. Njegove najsodobnejše zmogljivosti naj bi znatno izboljšale način, kako razvijalci in poslovne stranke gradijo in širijo z UI.

Gemini 1.0, prvo različico, so optimizirali za tri različne velikosti:

  • Gemini Ultra — največji in najzmogljivejši model za zelo zapletene naloge.
  • Gemini Pro — najboljši model za prilagajanje širokemu spektru nalog.
  • Gemini Nano — najučinkovitejši model za opravila v napravi.

Kot so pojasnili pri Googlu so modele Gemini strogo preizkušali in ocenjevali njihovo delovanje pri najrazličnejših nalogah. Od razumevanja naravne slike, zvoka in videa do matematičnega razmišljanja. Zmogljivost Gemini Ultra naj bi presegla trenutne najsodobnejše rezultate na 30 od 32 široko uporabljenih akademskih meril uspešnosti, ki se uporabljajo v raziskavah in razvoju velikih jezikovnih modelov (LLM).

Z rezultatom 90,0 % je Gemini Ultra prvi model, ki je prekašal človeške strokovnjake na področju MMLU (razumevanje množičnega večopravilnega jezika), ki uporablja kombinacijo 57 predmetov, kot so matematika, fizika, zgodovina, pravo, medicina in etika za testiranje obeh svetov. znanja in sposobnosti reševanja problemov.

Ta novi primerjalni pristop k MMLU omogoča Geminiju, da uporabi svoje zmožnosti razmišljanja za natančnejši premislek, preden odgovori na težka vprašanja, kar vodi do znatnih izboljšav v primerjavi s samo uporabo prvega vtisa.

Do tega trenutka je standardni pristop k ustvarjanju multimodalnih modelov vključeval usposabljanje ločenih komponent za različne modalitete in njihovo sestavljanje, da bi približno posnemali nekatere od teh funkcij. Ti modeli so lahko včasih dobri pri izvajanju določenih nalog, kot je opisovanje slik, vendar imajo težave z bolj konceptualnim in zapletenim sklepanjem.

Dobrodošli v obdobje Google Gemini, sporočajo razvijalci UI

Dobrodošli v obdobje Google Gemini, sporočajo razvijalci UI

Google Gemini je bil zasnovan tako, da je izvorno multimodalen, že od samega začetka so ga usposabljali za različne modalitete. Natančno je bil prilagojen z dodatnimi multimodalnimi podatki, da bi še izboljšali njegovo učinkovitost. To pomaga Geminiju brezhibno razumeti in razmišljati o vseh vrstah vnosov od začetka, veliko bolje kot obstoječi multimodalni modeli — in njegove zmogljivosti so najsodobnejše na skoraj vseh področjih.

Sofisticirane multimodalne zmožnosti razmišljanja Gemini 1.0 lahko pomagajo razumeti kompleksne pisne in vizualne informacije. Zaradi tega je edinstveno usposobljen za odkrivanje znanja, ki ga je težko razločiti med ogromnimi količinami podatkov.

Njegova izjemna sposobnost pridobivanja vpogledov iz več sto tisoč dokumentov z branjem, filtriranjem in razumevanjem informacij bi lahko pripomogla k novim prebojem z digitalno hitrostjo na številnih področjih od znanosti do financ.

Gemini 1.0 je bil usposobljen za prepoznavanje in razumevanje besedila, slik, zvoka in drugega hkrati, tako da bolje razume niansirane informacije in lahko odgovarja na vprašanja v zvezi z zapletenimi temami. Zaradi tega je še posebej dober pri razlagi sklepanja pri zapletenih predmetih, kot sta matematika in fizika.

Kako se Google Gemini primerja s ChatGPT?

Nekakšen splošni zaključek, ki ga lahko sprejmemo s pomočjo Googlovega tehničnega poročila in drugih dosedanjih kvalitativnih testov je, da trenutna javno dostopna različica Gemini, imenovana Gemini 1.0 Pro, ni na nivoju GPT-4. Je pa po svojih zmogljivostih bolj podobna ChatGPT 3.5.

Kot smo omenili je Google napovedal tudi zmogljivejšo različico Geminija, imenovano Gemini 1.0 Ultra, in predstavil nekaj rezultatov, ki kažejo, da je zmogljivejša od GPT-4. Ali je to res, še ni jasno, saj Ultra še ni na voljo, podatke pa se da v trenutkih pred izdajo tudi optimizirati za lasten uspeh.

Najbolj zanimivi pa sta še dve reči, poleg jasnega napredka v Googlovi umetni inteligenci. To je napoved Google Gemini Nano, ki bo zmožen delovanja neposredno na mobilnih telefonih.

Na koncu koncev pa Google Gemini nakazuje nastanek velikega konkurenta, ki bo pomagal pognati področje UI naprej. Ker OpenAI skoraj zagotovo dela na GPT-5 lahko pričakujemo, da bo tudi ta multimodalen in bo pokazal izjemne nove zmogljivosti. Začela se je bitka, pri kateri bodo morali biti vsi vpleteni zelo pozorni in previdni.

Avtor: Žiga Kastelic, FOTO: google.com, medium.com