Login to your account

Username *
Password *

„ChatGPT“ baigiant įsitvirtinti generatyvinio dirbtinio (DI) intelekto sinonimu, „Google“ į pažangiųjų asistentų lenktynes netikėtai grįžo su naujomis jėgomis. Vasarį paieškos milžinė savo įrankio pavadinimą pakeitė iš „Bard“ į „Gemini“ ir jį dar giliau integravo savo paslaugose. „Telia“ ekspertai atskleidžia, kokios naujovės slepiasi po pasikeitusia DI padėjėjo tapatybe ir kuo jis bus pranašesnis už savo konkurentus. 

Bendrovės požiūris į „Gemini“ rodo, kad jai jis nėra tik vienas iš kelių dešimčių jos produktų. DI asistentu kiekvieną mėnesį jau naudojasi daugiau nei 300 milijonų vartotojų, o jų skaičių iki 2024 m. pabaigos tikimasi išauginti iki vieno milijardo. „Google“ vadovas yra ne kartą užsiminęs, kad DI robotai yra internetinės paieškos ateitis ir galiausiai pakeis populiariąją „Google“ paieškos eilutę.

„Akivaizdu, kad „Google“ į DI „baseiną“ įlipo ne ta koja. „Bard“ jau pristatymo metu elementarių klausimų atsakymuose privėlė faktinių klaidų ir kompanijos akcijų vertę kone akimirksniu pasiuntė 100 milijardų dolerių žemyn. Per visus praėjusius metus nesėkmingai bandžiusi nusikratyti antrarūšio DI asistento etiketės, „Google“ nusprendė braukti storą brūkšnį ir savo robotą atnaujinti iš esmės. Naujai atgimęs „Gemini“ „Android“ išmaniuosiuose pakeis „Google Assistant“ balso asistentą bei padės rašyti „Gmail“ laiškus ir rengti dokumentus „Google Docs“, – teigia „Telia“ Skaitmenizavimo ir analitikos vadovė Diana Gold. 

„Google“ DI = „Gemini“

Dar prieš kelis mėnesius „Google“ DI produktų pavadinimai priminė šiokią tokią „mišrainę“. Tiesioginis „ChatGPT“ konkurentas buvo pakrikštytas „Bard“, kai verslui skirta jo versija vadinosi „Duet AI“, o abiejų šių įrankių veikimą įgalinantis didysis kalbos modelis (LLM) buvo žinomas kaip „PaLM 2“. Norint vartotojams aiškiau iškomunikuoti, jog minėtose paslaugose veikia DI, kompanijai buvo būtina visas jas „pakišti“ po bendro pavadinimo skėčiu.

Šis procesas prasidėjo dar praėjusių metų gruodį, kai „PaLM 2“ pakeitė trys skirtingų pajėgumų „Gemini“ LLM: „Gemini Nano“, skirtas efektyviau vykdyti įvairias išmaniųjų prietaisų funkcijas, DI asistentams pritaikytas „Gemini Pro“ ir pačioms sudėtingiausioms užduotims subalansuotas „Gemini Ultra“. Prieš porą savaičių vardų keitimo operacija buvo pratęsta, „Bard“ ir „Duet“ atitinkamai pervadinant į „Gemini“ ir „Gemini for Workplace“.

Pokyčių neišvengė net aštuonerius metus milijonams vartotojų kasdien talkinęs „Google Assistant“ virtualus asistentas, kurį „Android“ išmaniuosiuose pakeitė atskira „Gemini“ programėlė, o „iOS“ platformoje – „Google“ aplikacijoje esanti „Gemini“ skiltis.

„Kartu su pasikeitusia išvaizda pristatytas ir naujas prenumeratos modelis, skirtas tiesiogiai konkuruoti su „ChatGPT Plus“. Pasirinkę 20 JAV dolerių per mėnesį kainuojantį „Google One AI Advanced“ planą, vartotojai gaus pajėgesniu „Gemini Ultra“ „varikliu“ paremtą „Gemini“ DI asistentą ir jo integraciją kitose „Google“ paslaugose, tokiose kaip „Gmail“, „Docs“, „Slides“ ir „Meet“. Tiesa, skirtingai nei „ChatGPT Plus“ atveju, paieškos milžinė už tą pačią kainą prenumeratoriams su planu papildomai suteiks du terabaitus atminties savo debesijos talpykloje“, – skirtumą detalizuoja D. Gold. 

DI, sujungtas su „Google“ paslaugomis

Trumpas atsakymas į klausimą, ką gali „Gemini“, būtų „Labai daug“. Kaip ir „ChatGPT“, jis geba apdoroti bei generuoti pačių įvairiausių tipų duomenis, įskaitant tekstą, kompiuterinio kodo eilutes, garsą, paveikslėlius ir net vaizdo įrašus. Tačiau pagrindiniu „Gemini“ pranašumu prieš konkurentus „Google“ įvardina integraciją su kitais jos vystomais produktais. 

„Nemokama „Gemini“ versija gali tiek atsakyti į tokius paprastus klausimus, kaip „Kiek kalorijų turi sauja migdolų“, tiek per kelias sekundes sugeneruoti trumpą keliasdešimties minučių ilgio trukmės „YouTube“ vaizdo įrašo santrauką. Tuo metu paklausus lankytinų vietų rekomendacijų tam tikroje šalyje ar mieste, „Google“ DI asistentas jas ne tik bukai išvardins, bet ir pažymės „Google Maps“, kur jas galėsite patogiai išsisaugoti artėjančiai kelionei“, – asistento unikalumą pabrėžia pašnekovė. 

Įsigijusiems mokamą „AI Advanced“ prenumeratą bendrovė žada dar didesnį savo universaliojo roboto pajėgumą. Dar tikslesniu „Gemini Ultra“ LLM paremtas „Gemini“ turėtų atsirasti „Gmail“, kur nepaliekant paslaugos lango, bus galima pasisemti įkvėpimo rašant kvietimą pietų verslo partneriui, gauti pagalbos tvarkant šeimos biudžetą per „Sheets“, ar pavesti „Gemini“ sudaryti artėjančios kelionės planą „Docs“ dokumente. Gausų integracijų krepšelį taip pat papildys „Gemini“ susiejimas su „Slides“, kur jis gebės padailinti skaidrių dizainą arba sukurti ištisą prezentaciją pagal pateiktą temą ar šaltinius. 

Geros žinios lietuviams

Nepaisant „naujo rūbo“, „Google“ DI asistentui ir vėl nepavyko apsieiti be kuriozų. Prieš keletą dienų žiniasklaidą pasiekė oficialus „Google“ laiškas, kuriame bendrovė paskelbė laikinai stabdanti „Gemini“ vaizdų generavimo funkciją ir pasižadanti ją patobulinti iš esmės. Tokią drastišką paieškos milžinės reakciją paskatino reikšmingo skaičiaus vartotojų ir net paties ekscentriškojo Elono Musko skundai, kad kūrybingasis padėjėjas į užklausas reaguoja ne tik klaidingai, bet dar ir nepadoriai. Pavyzdžiui, jo paprašius parodyti kitų, nei baltaodžių, rasių asmenų nuotraukas, jis atvaizduodavo nacių Vokietijos kareivius, bei kitaip nepaisydavo rasių ir lyčių lygybės normų.

„Tokie incidentai neabejotinai trukdo „Google“ rimčiau užsiimti pozicijas kovoje su „ChatGPT“, bet nenubraukia kitų „Gemini“ privalumų. Vienas jų – net 40 kalbų palaikymas. DI asistentas kalba ne tik angliškai, ispaniškai, ukrainietiškai, bet ir lietuviškai. Tai leidžia dirbtinio intelekto galimybes išbandyti neturintiems gerų užsienio kalbų žinių ar tiesiog po ranka turėti labai pajėgią pagalbą, virtualiai bendraujant su kitų tautybių žmonėmis “, – mano „Telia“ atstovė. 

Tiesa, kol kas lietuviams prieinama tik nemokama „Gemini“ versija. „Gemini Ultra“ šiuo metu veikia tik anglų kalba ir tik JAV gyventojams, todėl kol kas „AI Advanced“ prenumeratos mūsų šalyje nėra galimybės įsigyti. Išbandyti „Gemini“ jau dabar galima apsilankius gemini.google.com/app

Įsivaizduokite, kad gyvybingus, itin tikroviškus vaizdo įrašus galite sukurti tiesiog aprašydami juos žodžiais. Šis viliojantis pažadas jau tampa realybe – plačiai naudojamo dirbtinio intelekto (DI) įrankio „ChatGPT“ kūrėjai „OpenAI“ ką tik pristatė naują vaizdo kūrimo įrankį „Sora“. Pasak Luko Keraičio, „Tele2“ Inovacijų eksperto, nors įrankis kol kas testuojamas, tikėtina, ateityje bus prieinamas visiems ir suteiks galimybę pagal kelias žodines užklausas kurti net ištisus filmus. 

Prieinamas ne visiems

„Praėjusiais metais stebėjomės paveikslėlių generavimo įrankiais. Jie tobulėjo itin greitai – tapo įmanoma pasiekti didelę kokybę ir gauti tai, ko nori, nors tam vis tiek reikės specifinių žinių. Buvo tikimasi, kad greitai tobulės ir vaizdo įrašų generavimo įrankiai, o metų pradžia kol kas pranoksta visus lūkesčius. Galima sakyti, kad „OpenAI“ vėl tai padarė – privertė technologijų entuziastų žandikaulius kaboti iš nuostabos“, – sako L. Keraitis.

„Stilinga moteris pasitikėdama savimi eina Tokijo gatve, aplink ją – šiltos neonų šviesos, miesto ženklai, praeiviai. Ji vilki juodą odinę striukę, ilgą raudoną suknelę, akinius nuo saulės, juodus batus, raudoną lūpdažį ir nešasi juodą rankinę“, – tokią užklausą naujajam įrankiui davę jo kūrėjai iškart pateikia ir gautą rezultatą. Įrašas – neįtikėtinai realistiškas, o tai, kad jis sukurtas DI išduoda tik ne iki galo ryškios aplinkos detalės.

Skelbiama, kad kol kas „Sora“ leis generuoti iki minutės trukmės vaizdo įrašus. Tiesa, kol kas įrankis prieinamas tik saujelei žmonių. Jo testavimo metu bus siekiama išsiaiškinti, kokios galimos šio įrankio naudojimo grėsmės – ar jis negali būti naudojamas misinformacijai, neapykantos turiniui, pateikti šališkų rezultatų.

„Puikiai prisimenu 2022-ųjų rugsėjį, kai „Meta“ pademonstravo tai, apie ką technologijų pasaulyje jau kurį laiką sklandė gandai – vieną pirmųjų kokybiškesnių vaizdo generavimo modelių „Make-a-video”. Tris sekundes ore skrendantis šuo supermeno kostiumu ir kiti į „GIF“ formatą panašūs vaizdo įrašai buvo pilni artefaktų, labai netobuli. Bet jau tuomet supratau, kiek daug tai keičia, kad ateityje, pavyzdžiui, Holivudo filmo gimimui tereiks scenarijaus“, – sako L. Keraitis.

Progreso greitis

Pasak L. Keraičio, įrankio „Sora“ pristatymą galima laikyti vienu retų atvejų, kai per vieną naktį pamatomas stiprus technologinis šuolis. Vos prieš mėnesį „Google“ pristatė savo vaizdo įrašų kūrimo modelį „Lumiere“, kuris jau atrodė pažangesnis už konkurentus, nors jo generuojami vaizdo įrašai primena pirmųjų išmanių telefonų vaizdo kokybę ir, kaip ir konkurentai, generuoja tik iki 5-10 sekundžių trukmės įrašus. 

„Sora“ kokybė atrodo išties geriau, daug mažiau artefaktų, daugiau nuoseklumo vaizde. Žiūrint kai kuriuos kadrus galima patikėti, kad tai yra filmuoti vaizdai. Galima įtarti, kad „Sora“ modelis buvo apmokomas sintetiniais duomenimis iš kompiuterinių žaidimų. Tai spėjama dėl jo kuriamų vaizdų panašumo į „Unreal Engine 5“ žaidimų grafikos variklio panašumą“, – pastebi „Tele2“ Inovacijų ekspertas.

Anot jo, galima tikėtis, kad anksčiau ar vėliau „Sora“ modelio principu sukurtas vaizdo įrašų generavimo įrankis taps viešas ir prieinamas visuomenei. Tiesa, kol kas niekas nežino kada tai galėtų nutikti – galbūt jį technologijų entuziastai galės išbandyti jau šiemet.

„Tai „OpenAI“ suteiktų svarbų konkurencinį pranašumą. Vis dėlto, nesunku įsivaizduoti, kaip toks įrankis galėtų būti panaudotas plačioms melagystėms ir propagandai – „OpenAI“ teks atsakomybė ieškoti išeičių iš šių klausimų. Tikėtina, kad įmonė šį galingą įrankį norės paleisti tik po lapkritį vyksiančių JAV prezidento rinkimų. O galbūt jų nelauks ir paviešins įrankį anksčiau? Nekantrauju išbandyti“, – sako L. Keraitis.

Ekspertas priduria, kad jau laukiama ir kito svarbaus žingsnio, susijusio su DI galimybėmis suprasti vaizdą – įrašų redagavimo įrankio.

Išmaniųjų telefonų technologijos tobulėja kiekvienais metais, ne išimtis – ir jų kameros bei fotografavimo funkcijos. Prie nuolatinio tobulėjimo neišvengiamai prisideda ir dirbtinis intelektas – dažnai net nepastebime, kaip jis padeda fotografuoti išmaniuoju telefonu, o ir DI sugeneruotas turinys socialinės medijos platformose jau spėjo įgyti didelį populiarumą. Fotografas Dainius Ščiuka pataria, kaip išnaudoti įvairias dirbtinio intelekto funkcijas fotografuojant išmaniuoju telefonu.

Dirbtinis intelektas padeda mums fotografuoti, net jei to nepastebime

Automatinis scenos atpažinimas yra funkcija, esanti daugelyje šiuolaikinių išmaniųjų telefonų ir fotoaparatų, naudojanti dirbtinio intelekto algoritmus aplinkos analizei ir automatiškam fotoaparato nustatymų koregavimui. Ši naujoviška technologija leidžia net pradedantiesiems fotografams be vargo užfiksuoti vizualiai patrauklias nuotraukas.

Fotografas bei „Samsung“ ambasadorius Lietuvoje Dainius Ščiuka teigia, kad dirbtinis intelektas užfiksuotą kadrą optimizuoja ir automatiškai patobulina, pavyzdžiui, tamsias scenas – pašviesina, maistą parodo skanesnį, o peizažus spalvingesnius. „Tai ypač patogu, jei skubate ir nenorite pats užsiimti nustatymų korekcijomis“, – sako jis. 

Atpažinus sceną, fotoaparato nustatymai, tokie kaip ekspozicija, baltos spalvos balansas, fokusavimas ir užrakto greitis, atitinkamai koreguojami, kad būtų optimizuota vaizdo kokybė ir užtikrintas geriausias įmanomas rezultatas.

Pavyzdžiui, kraštovaizdžio aplinkoje fotoaparatas gali koreguoti nustatymus, kad būtų užfiksuotos ryškios spalvos ir įmantrios detalės, o naudojant naktinį režimą DI technologija leidžia išgauti ypač ryškius kadrus tamsoje. 

„Naktinis režimas naujuose telefonuose stebina neįtikėtinai, nes kuo ilgiau fotografuojame ir renkame šviesą iš aplinkos, tuo ryškiau viską matome nuotraukoje. Svarbiausias dalykas naktinėje fotografijoje yra telefono stabilumas – suraskite kur telefoną galite tvirtai įstatyti arba atremti, kad galėtumėte ilgiau fotografuoti“, – patarimais dalijasi D. Ščiuka.

Portreto režimas: kaip ir kada jį naudoti?

Portreto režimas iš esmės pakeitė išmaniųjų telefonų fotografiją. Pasitelkus dirbtinio intelekto technologiją imituojamas fono suliejimas, tradiciškai siejamas su aukščiausios klasės fotoaparatais ir objektyvais. 

Šios funkcijos veikia naudodamos dirbtinio intelekto algoritmus, kurie analizuoja sceną ir atskiria objektą (paprastai žmogų) nuo fono. „Portreto režimas sulieja foną ir sukuria efektą lyg fotografuotume fotoaparatu su objektyvu, taip suteikiant portretui gylio ir iškeliant jį į pirmąjį planą“, – sako fotografas.

Pasak D. Ščiukos, naujoji portreto režimo versija „Samsung“ telefonuose turi didelį privalumą – portreto režimą pritaikyti galite ir ant nufotografuotų nuotraukų. Tai reiškia, kad jį galite pritaikyti bet kuriam užfiksuotam kadrui, jei to nespėjote padaryti fotografavimo momentu. O šį režimą geriausia naudoti fotografuojant žmogų iki pusės, jis puikiai veikia ir filmavimo metu. 

Su dirbtiniu intelektu kūrybiškumui ribų nėra

D. Ščiuka teigia: „Nuotraukų redagavimas žmonėms skamba sudėtingai ir dažnai tam laiko skiriama nėra, tačiau prie nuotraukų redagavimo priskirčiau ir nuotraukų atranką. Tai yra labai svarbu greitame mūsų gyvenimo ritme, gebėjimas filtruoti užfiksuotus kadrus tikrai praverčia, ypač jeigu norime jais pasidalinti socialinėje medijoje ar su draugais.“

„Tiesa, kadangi šiuo metu galime naudotis DI funkcijomis, kurios optimizuoja mūsų nuotraukas, redagavimas nėra toks būtinas. Tačiau jeigu pastebite kompozicinius trūkumus, nelygų horizontą ar maišančias detales, jūs labai greitai galite tai sutvarkyti“, – pasakoja fotografas.

„Generatyvinio redagavimo“ funkcija naujausios „Galaxy S24” serijos telefonuose leidžia su DI pagalba pasirinkti norimus objektus ir keisti jų dydį, padėtį nuotraukoje, ar panaikinti objektus iš nuotraukos. Taip pat esant poreikiui DI gali papildyti esamą nuotrauką sugeneruodamas visiškai naujus vaizdus ar praplėsdamas esantį nuotraukos foną. 

D. Ščiuka dalijasi trimis esminiais patarimais, kurie padės išgauti nepriekaištingas nuotraukas:

1. Atkreipkite dėmesį į kameros programėlėje esantį linijų tinklelį – jis padės užfiksuoti lygius ir centruotus kadrus.

2. Fotografuodami – neskubėkite, stenkitės įrenginį išlaikyti kuo stabilesnį.

3. Drąsiai išbandykite DI funkcijas ir eksperimentuokite su nuotraukų redagavimu.

„Apgailestauju, kad taip jautiesi“ – tai viena iš frazių, kurias naudojo prieš beveik 60 metų atsiradęs pirmasis dirbtinio intelekto (DI) robotas „ELIZA“. Didžiule mokslo sensacija anuomet tapęs išradimas imitavo psichoterapeutą ir galėjo pateikti tik labai ribotus atsakymus. Tuo tarpu dabar tokių DI įrankių, kaip „ChatGPT“ galime paprašyti bet ko – ir sukurti šmaikštų eilėraštį apie cepelinus, ir išspręsti aukštosios matematikos uždavinį. Lukas Keraitis, „Tele2“ Inovacijų ekspertas, sako, kad kad nors apie DI daugelis išgirdo neseniai, tai yra lėto ir nuoseklaus daugybės mokslininkų darbo rezultatas. 

„Dirbtinio intelekto pradžia galima laikyti 1943 m. matematikos ir neurologijos mokslininkų bendrą tyrimą apie žmogaus smegenis kaip informaciją apdorojančią mašiną. Jau 1966 m. buvo sukurtas pirmasis pokalbių robotas „ELIZA“. Tačiau tik tūkstantmečių sandūroje susidarė sąlygos tirti tokį DI, kaip jį matome dabar – tobulėjantys procesoriai leido atlikti daug resursų reikalaujantį DI apmokymą, o internete atsirado pakankamai apmokymui reikalingų duomenų”, – sako L. Keraitis ir dalijasi 7 svarbiausiais DI istorijos įvykiais.

1. Sustiprintojo mokymosi proveržis (10-sis dešimtmetis):

1992 metais dirbtinio intelekto srityje įvyko svarbus proveržis. Sustiprinamojo mokymosi  (angl. „reinforcement learning“, RL) metodai leido sistemoms mokytis iš savo veiksmų, naviguoti sudėtingose aplinkose. Ši pažanga įkvėpė tolesnius tyrimus ir prisidėjo prie tokių technologijų, kaip robotai ir bepiločiai orlaiviai, vystymo. Šioje srityje svarbiausiais laikomi „Q-mokymosi“ ir „TD-Gamon“ algoritmų atsiradimai – jie leido optimizuoti veiksmus ir spręsti sudėtingas užduotis.

„Du pastarieji įvykiai išties leido kompiuterinėms sistemoms tobulėti ir mokytis iš savo klaidų. Pasitelkiant nuotraukų analizę atsirado galimybė nustatyti tam tikras ligas, o kompiuteriniai žaidimai gebėjo prisitaikyti prie žaidėjo elgsenos”, – paaiškina L. Keraitis.

2. Autonominių transporto priemonių lenktynės (2004 m.)

2004 m. pirmą kartą buvo surengtas konkursas „DARPA Grand Challenge“ – autonominių (bepiločių) automobilių lenktynės. Per pirmąsias lenktynes nei vienam automobiliui nepavyko įveikti 100 km ilgio trasos Mohavės dykumoje. 2005 m. vėl surengtos lenktynės buvo sėkmingesnės – nuvažiuoti visą trasą pavyko penkioms transporto priemonėms. Šios lenktynės padėjo paspartinti dirbtiniu intelektu paremtų vairavimo technologijų plėtrą.

3. Balso atpažinimo funkcijos „iPhone“ ir „Siri“ pristatymas (2011 m.) 

Anksčiau balso atpažinimo technologija buvo naudojama tik specializuotose srityse su ribotu funkcionalumu. „iPhone“ balso atpažinimo funkcija ir „Siri“ išmanusis asmeninis asistentas pirmą kartą leido mažai ką bendro su technologijomis turintiems žmonėms bendrauti su kompiuteriu balsu. „Siri“ galimybės apėmė skambučių iniciavimą, tekstinių žinučių siuntimą, klausimų atsakymą ir net nustatymų keitimą – viską per balso komandas. Tai paskatino kitas technologijų įmones kurti savo balsu valdomus asistentus bei DI pagrįstų asmeninių asistentų programų plėtrą visoje technologijų pramonėje.

4. Vaizdų atpažinimo technologijos (2015 m.)

2015 m. kasmetiniame „ImageNet“ iššūkyje paaiškėjo, kad DI paremtos mašinos jau gali aprašyti ir atpažinti vaizdus. Iššūkyje įvairioms DI mašininio mokymosi programoms buvo pateikta 1000 nuotraukų, kurias paprašyta kuo tiksliau identifikuoti ir apibūdinti. Tai joms pavyko padaryti 97,3 proc. tikslumu. Iki 2015-ųjų vaizdų atpažinimas buvo pagrindinis dirbtinio intelekto iššūkis.

„Technologijų kompanijos skubėjo įtraukti šias naujoves į savo programinę įrangą. „Google Photos” tais pačiais metais technologiją pritaikė atpažįstant objektus nuotraukose ir taip skirstant juos į kategorijas, pavyzdžiui, „gamtos vaizdai”, „automobiliai”, tačiau iki šiol pasitaiko ir vaizdų atpažinimo klaidų”, – teigia L. Keraitis.

5. „AlphaGo“ nugalėjo pasaulio „Go“ žaidimo čempioną (2016 m.)

Senovinis stalo žaidimas „Go“ buvo sukurtas Kinijoje prieš 3000 metų ir yra toks sudėtingas, kad galimų ėjimų skaičius yra beveik nepamatuojamas. Sukurti kompiuterines programas, kurios galėtų įveikti žmones loginiuose žaidimuose, buvo ilgalaikis dirbtinio intelekto tyrėjų tikslas. Tačiau 2016 m. bendrovės „DeepMind“ sukurta programa „AlphaGo“ pirmą kartą įveikė Lee Sedolą, tapusį pasaulio „Go“ žaidimo čempionu. Šį žaidimą internetu stebėjo per 200 milijonų žmonių. Ši pergalė parodė, kad DI sistemos gali išmokti įveikti sudėtingas užduotis, kuriose reikia strateginio mąstymo ir kūrybiškumo.

6. Didelių kalbos modelių atsiradimas (2017 m.)

2017 m. „Google“ mokslininkai paskelbė svarbų straipsnį, kuriame pristatė pirmąjį kalbos vertimo „transformerį“, paremtą mašininiu mokymusi. Užuot atskirai vertę kiekvieną žodį, „transformeriai“ vienu metu perskaito ištisus sakinius, nustatydami priklausomybę tarp žodžių ir išgaudami prasmę pagal kontekstą. Iki šio pokyčio „Google Translate“ vertimo technologija nelabai gerai suprasdavo sakinių sąsajas, todėl vertimai galėjo būti netikslūs. Tai tapo pagrindine technologija, naudojama vėlesniuose DI atradimuose ir dideliuose kalbos modeliuose (angl. „large language models“).

Po didžiųjų kalbos modelių proveržio atsirado galimybė gerokai kokybiškiems pokalbių robotams. Pavyzdžiui, „Tele2“ klientus konsultuoja pokalbių robotai „Rūta“ ir „Pildyk Botas“, galintys atsakyti į svarbiausius klientų klausimus, kitos organizacijos taip pat „robotizuoja” savo žinias.

7. „OpenAI“ išleidžia „GPT-1“ (2018 m.)

2018 m. „OpenAI“ išleido pirmąjį generatyvinį (kurti gebantį) iš anksto apmokytą kalbos modelį. Naudodamas šią technologiją, „GPT-1“ galėjo atsakyti į klausimus ir generuoti teksto blokus. Įrankis buvo apmokytas naudojant du didelius duomenų rinkinius: vieną su maždaug 8 milijonais interneto puslapių, o kitą – su daugiau kaip 11 tūkst. knygų. Nors technologija buvo sklandi ir gerokai pažangesnė nei jos pirmtakės, nesugebėjo nuosekliai generuoti ilgesnių teksto blokų ir buvo linkusi kartotis. Vėlesnės „GPT“ versijos tapo dabar mums geriausiai pažįstamais ir naudojamais DI pokalbių robotais.

„Pastarųjų metų progresas DI srityje buvo tikrai stulbinantis. Galima sakyti, kad ši sritis duoda jau brandžių vaisių – įrankių kasdienybėje iškylančioms problemoms spręsti. Įdomu, kur link visa tai nuves – galbūt po didelio susižavėjimo turėsime „DI žiemą”, o gal įsisiūbavęs progresas tik dar labiau sustiprins DI pajėgumus“, – sako L. Keraitis.

 

„Google“ pokalbių robote „Bard“ įdiegtas naujos kartos dirbtinio intelekto modelis „Gemini Pro“ nuo šiandien pradeda veikti daugelyje pasaulio šalių ir tampa prieinamas daugiau nei 40 kalbų, įskaitant lietuvių. Kartu su atnaujinimu „Bard“ pristato dar vieną naujovę – pakartotinės patikros funkciją. Nuo šiol vartotojai galės patikrinti atsakymus, palyginant juos su internete esančiu turiniu. Atnaujinta pokalbių roboto versija vartotojams prieinama nemokamai.

Pernai gruodį „Google“ pasidalijo žinia apie pasiektą proveržį dirbtinio intelekto (DI) srityje: technologijų bendrovė pristatė „Gemini“ – didžiausią ir galingiausią savo DI modelį. „Bard“ su „Gemini Pro“ versijoje gerokai patobulintos supratimo, apibendrinimo, samprotavimo, kodavimo ir planavimo funkcijos.

Į „Bard“ integruota „Gemini Pro“ versija nuo ketvirtadienio tampa prieinama daugiau nei 230 šalių ir teritorijų visame pasaulyje bei daugiau nei 40 kalbų, įskaitant ir lietuvių. 

Tai ypač praplės nemokamo pokalbių roboto galimybes. Pirmaujanti didžiųjų kalbos modelių ir pokalbių robotų vertinimo organizacija „Large Model Systems Organization“ (LMSYS) neseniai pripažino, kad „Bard“ su „Gemini Pro“ yra vienas geidžiamiausių šiuo metu egzistuojančių pokalbių robotų, ir pažymėjo, kad „Bard“ padarė „stulbinamą šuolį į priekį“.

Svarbus pokalbių roboto atnaujinimas – pakartotinės patikros funkcija. Nuo šiol „Bard“ naudotojai galės pasitikrinti atsakymus lietuvių kalba. Spustelėjus „G“ piktogramą, pokalbių robotas perskaitys atsakymą ir patikrins, ar internete yra informacijos atsakymui pagrįsti. Spustelėjus pažymėtas frazes, vartotojai galės sužinoti daugiau apie paieškos „Google“ ar internete metu rastą patvirtinančią arba prieštaraujančią informaciją.

Su šiais atnaujinimais „Bard“ tampa dar labiau prieinamas, pajėgesnis ir geriau pritaikytas atlikti įvairias užduotis – nuo sudėtingų kūrybinių projektų iki smulkių kasdienių užduočių.

Vystydami DI technologijas, „Google“ laikosi tvirto ir atsakingo požiūrio, tad diegiant atnaujinimus technologijų įmonė aktyviai bendradarbiavo su ekspertais, politikos formuotojais ir privatumo priežiūros institucijomis.

Naujausią „Bard“ su „Gemini Pro“ versiją išbandyti nemokamai galima adresu bard.google.com.