DeepMind dnes predstavil nový multimodálny systém AI, ktorý dokáže vykonávať viac ako 600 rôznych úloh.
Pod názvom Gato je to pravdepodobne najpôsobivejšia súprava strojového učenia typu všetko v jednom, akú svet doteraz videl.
Podľa DeepMind príspevok v blogu:
Agent, ktorý označujeme ako Gato, funguje ako multimodálna, viacúlohová a mnohotvárna všeobecná politika. Rovnaká sieť s rovnakými hmotnosťami môže hrať Atari, popisovať obrázky, chatovať, skladať bloky so skutočným ramenom robota a oveľa viac, pričom sa rozhoduje na základe kontextu, či sa má vygenerovať text, krútiace momenty kĺbov, stlačenie tlačidiel alebo iné tokeny.
A zatiaľ čo sa ešte len uvidí, ako presne to bude fungovať, keď sa k tomu dostanú výskumníci a používatelia mimo laboratórií DeepMind, zdá sa, že Gato je všetko, čo si GPT-3 želá, a ešte viac.
Tu je dôvod, prečo som smutný: GPT-3 je veľkojazyčný model (LLM) vytvorený spoločnosťou OpenAI, celosvetovo najlepšie financovanou spoločnosťou s umelou všeobecnou inteligenciou (AGI).
Predtým, ako budeme môcť porovnať GPT-3 a Gato, však musíme pochopiť, odkiaľ pochádzajú OpenAI a DeepMind ako podniky.
OpenAI je duchovným dieťaťom Elona Muska, má miliardovú podporu od Microsoftu a vláda USA by sa v podstate mohla menej starať o to, čo robí, pokiaľ ide o reguláciu a dohľad.
Majte na pamäti, že OpenAI jediný účel je vyvíjať a ovládať AGI (to je AI schopná robiť a učiť sa čokoľvek, čo by človek mohol, ak má rovnaký prístup), je trochu desivé, že všetko, čo sa spoločnosti podarilo vyrobiť, je skutočne luxusný LLM.
Nechápte ma zle, GPT-3 je pôsobivý. V skutočnosti je to pravdepodobne rovnako pôsobivé ako Gato od DeepMind, ale toto hodnotenie si vyžaduje určité nuansy.
OpenAI sa vydalo cestou LLM na svojej ceste k AGI z jednoduchého dôvodu: nikto nevie, ako zabezpečiť fungovanie AGI.
Rovnako ako to trvalo nejaký čas medzi objavením ohňa a vynálezom spaľovacieho motora, prísť na to, ako prejsť od hlbokého učenia k AGI, sa nestane cez noc.
GPT-3 je príkladom AI, ktorá dokáže aspoň niečo, čo vyzerá ako ľudské: generuje text.
To, čo DeepMind urobil s Gatom, je v podstate to isté. Zobralo to niečo, čo funguje podobne ako LLM, a zmenilo to na iluzionistu schopného viac ako 600 foriem prestidigitácie.
Ako povedal Mike Cook z výskumného kolektívu Knives and Paintbrushs, nedávno povedal Kyle Wiggers z TechCrunch:
Znie to vzrušujúco, že AI je schopná robiť všetky tieto úlohy, ktoré znejú veľmi odlišne, pretože nám to znie, ako keby písanie textu bolo veľmi odlišné od ovládania robota.
Ale v skutočnosti sa to príliš nelíši od toho, ako GPT-3 chápe rozdiel medzi bežným anglickým textom a kódom Python.
Neznamená to, že je to jednoduché, ale pre vonkajšieho pozorovateľa to mocne znie, že AI môže tiež uvariť šálku čaju alebo sa ľahko naučiť ďalších desať alebo päťdesiat iných úloh, a to nedokáže.
Gato a GPT-3 sú v podstate robustné systémy AI, ale ani jeden z nich nie je schopný všeobecnej inteligencie.
Tu je môj problém: Pokiaľ sa váš hazard na AGI neobjaví ako výsledok nejakého náhodného aktu šťastia – filmu Skrat prichádza na myseľ – pravdepodobne je čas, aby každý prehodnotil svoje časové plány na AGI.
Nepovedal by som „nikdy“, pretože to je jedno z jediných prekliatych slov vedy. Ale zdá sa, že AGI sa za našich životov nestane.
DeepMind pracuje na AGI viac ako desať rokov a OpenAI od roku 2015. A ani jeden z nich nedokázal vyriešiť úplne prvý problém na ceste k vyriešeniu AGI: vytvorenie AI, ktorá sa dokáže naučiť nové veci bez školenia.
Verím, že Gato by mohol byť najpokročilejším multimodálnym systémom AI na svete. Ale tiež si myslím, že DeepMind berie to isté koncept slepej uličky pre AGI že OpenAI má a len ju urobil predajnejšou.
Záverečné myšlienky: To, čo DeepMind urobil, je pozoruhodné a pravdepodobne to prinesie spoločnosti veľa peňazí.
Ak som generálnym riaditeľom spoločnosti Alphabet (materská spoločnosť DeepMind), buď vytáčam Gato ako čistý produkt, alebo tlačím DeepMind viac do vývoja ako do výskumu.
Gato by mohol mať potenciál dosahovať na spotrebiteľskom trhu lukratívnejšie výsledky ako Alexa, Siri alebo Google Assistant (so správnym marketingom a použiteľnými prípadmi použitia).
Ale Gato a GPT-3 nie sú o nič viac životaschopnými vstupnými bodmi pre AGI ako vyššie spomenutí virtuálni asistenti.
Gatoova schopnosť vykonávať viacero úloh je skôr ako videoherná konzola, ktorá dokáže uložiť 600 rôznych hier, než ako hra, ktorú môžete hrať 600 rôznymi spôsobmi. Nie je to všeobecná umelá inteligencia, je to hromada predtrénovaných úzkych modelov, ktoré sú úhľadne zbalené.
To nie je zlá vec, ak je to to, čo hľadáte. Ale v Gatovom sprievode jednoducho nič nie je výzkumná práca Naznačiť to je pre AGI aj pohľad správnym smerom, nieto ešte odrazový mostík.
Dobré meno a kapitál, ktoré spoločnosti ako DeepMind a OpenAI vygenerovali vďaka tvrdohlavému naliehaniu, že AGI je hneď za rohom, budú musieť v určitom okamihu ukázať aj tie najmenšie dividendy.