Ezra Klein
Þegar maður spyr fólk sem vinnur í gervigreind, þar á meðal þá sem halda að hún geti valdið heiminum hræðilegum skaða, hvers vegna þeir séu að þessu eða hver tilgangurinn sé er svarið ekki: „Ja, okkur finnst bara að við ættum að taka þessa skelfilegu áhættu vegna þess að það er svo gaman að spjalla við ChatGPT.“ Þeir segja: „Ja, hún á eftir að leysa öll þessi hræðilegu vísindalegu vandamál, sem við erum að glíma við, og hún á eftir að innleiða skeið nýjunga sem er ekki í líkingu við neitt sem mannkyn hefur áður upplifað.“
Það eru ekki mörg dæmi enn um að gervigreind geri eitthvað í þá veru, en eitt má nefna og það er AlphaFold, kerfi úr smiðju DeepMind, sem getur sagt fyrir um byggingu mörg hundruð milljóna próteina. Það er risastórt skref fram á við í vísindum.
Demis Hassabis er einn stofnenda DeepMind. DeepMind er í eigu Google og nýverið var Hassabis settur yfir öll gervigreindarumsvif Google. Nú er það því kallað Google DeepMind og hann rekur allt heila klabbið. Það gerir hann að einum mikilvægasta manni heims, í vinnu við að kortleggja framtíð gervigreindarinnar.
Hér á eftir fylgir afrit af samtali milli Ezra Klein og Demis Hassabis úr The Ezra Klein Show, sem hefur verið stytt og þjappað saman.
Klein: Segðu mér frá stofnun DeepMind. Hvernig ákvaðst þú að stofna fyrirtækið?
Hassabi: Í raun nær bakgrunnur minn í gervigreind mun lengra aftur en DeepMind. Ég byrjaði í leikjaiðnaðinum, skrifaði tölvuleiki og suma metsöluleiki á borð við Theme Park og Black and White, og fleiri leiki sem ég vann í á unglingsárum mínum. Gervigreind var lykilþáttur í þeim öllum.
Ef þú lítur yfir minn feril hef ég gert marga ólíka hluti, en allir voru þó í líkingu við DeepMind, vinna við [gervigreind almennt]. Þannig að háskólanámið í tölvuvísindum, doktorsnámið í taugavísindum, allt snerist þetta um að safna upplýsingum og innblæstri fyrir það sem síðan varð DeepMind.
Klein: Hvað er gervigreind í þínum huga?
Hassabi: Ég held að gervigreind sé vísindin á bak við það að gera vélar snjallar og síðan er vélnám undirgrein gervigreindar, sem sagt sú gerð gervigreindarkerfa sem lærir sjálf og lærir beint af gögnum og reynslu. Það er í raun á bak við endurreisn gervigreindar undanfarin 10 til 15 ár og er sú gervigreind sem við erum að vinna að í dag.
Klein: Eitt fyrsta framlag DeepMind var tilraun ykkar til að búa til nýja gerð af greind. Og hvernig þið reynduð að smíða, þjálfa og prófa hana í leikjum. Segðu mér frá þeirri ákvörðun að byrja að þjálfa gervigreind í vídeóleikjum því að það virðist ekki alveg liggja beint við.
Hassabi: Já, það var ein af fyrstu ákvörðununum þegar við stofnuðum DeepMind og ég held að það hafi reynst okkur vel. Margir sem voru að vinna í gervigreind á þessum tíma voru einkum að vinna í hlutum á borð við róbóta og samspil líkama og gervigreindar [til dæmis í gervilimum]. Það æxlaðist hins vegar þannig að rannsakendurnir eyddu tíma sínum mestmegnis í að fikta í tækjunum og netþjónunum, sem voru alltaf að bila. Vélmennin eru dýr og þau eru flókin. Þau er líka þunglamaleg. Ég gerði mér grein fyrir því að við gætum gert milljónir tilrauna í skýinu allar í einu og náð mun hraðari tileinkunartíðni með hlutfallslega ódýrum, fljótlegum og einföldum hætti.
Hinn kosturinn við leikina var að þeir höfðu verið samdir til að reyna á fólk og það var hægt að nota bestu leikmennina úr röðum manna sem frábært viðmið. Þeir voru með skýr markmið – vinna leikinn eða fá sem flest stig. Slík markmið eru mjög gagnleg ef þú vilt þjálfa námskerfi sem byggja sig upp, eins og við sérhæfum okkur í, og snúast um að ná í umbun og uppfyllla markmið.
Önnur svöl hlið er að hægt er að fara upp flækjustigann með því einfaldlega að fara í gegnum ólík tímabil í leikjunum. Þannig er hægt að þyngja prófið fyrir gervigreindarkerfin eftir því sem þau verða þróaðri.
Klein: Af öllum gervigreindarkerfum sem hafa verið gefin út hef ég alltaf verið hrifnastur og haft mestan áhuga á AlphaFold, sem er frá DeepMind. Segðu mér hvað AlphaFold er – hver vandinn er og hvernig þú ákveður að þar sé komið eitthvað sem þín kerfi geti tekist á við.
Hassabi: AlphaFold er kerfið sem við notum til að leysa vandann af umbroti próteina. Í grunninn er allri líffræðilegri virkni líkamans miðlað af próteinum. Amínósýruröðin lýsir próteinum og hún er einvíð runa af stöfum.
Í líkamanum skrúfast þau mjög, mjög hratt í þrívíð form og það er þetta þrívíða form sem stýrir virkni þeirra. Vandinn við umbrot próteinsins er því þessi: Er hægt að segja fyrir um hið þrívíða form próteinsins beint út frá amínósýruröðinni?
Ástæðan fyrir því að þetta er svona mikilvægt er að margir sjúkdómar orsakast af því að það verður misfella í umbroti próteins eða það brotnar vitlaust saman. Einnig þarf að vita hvernig yfirborð próteins lítur út ef það á að hanna lyf til að berjast gegn sjúkdómum og þarf að vita lagið á próteininu til að átta sig á að hvaða hluta próteinsins lyfið á að beinast.
Klein: Hvað fékk þig til að halda að umbrot próteina væri eins og tölvuleikir?
Hassabi: Umbrot próteina urðu á vegi mínum í grunnnáminu í háskóla á tíunda áratugnum vegna þess að ég átti að vinum marga líffræðinga sem voru með þetta á heilanum í Cambridge. Þeir útskýrðu vandamálið fyrir mér og mér fannst það heillandi. Mér fannst þetta líka fullkomið vandamál fyrir gervigreindina til að hjálpa til við einn góðan veðurdag.
Umbrot próteina komu aftur við sögu hjá mér seint á fyrsta áratug þessarar aldar. Það var gerður leikur sem heitir Foldit; hann var kallaður vísindaleikur fyrir almenning. Það hafði verið búinn til þrautaleikur á rannsóknastofu sem snerist um að fólk braut um prótein í þrívíðu viðmóti. Mér fannst þetta ekki sérlega skemmtilegur leikur, en þeir höfðu búið til mjög notendavænt viðmót.
Nokkrir tugir þúsunda notenda, sem voru áhugamenn um vísindi, urðu mjög uppteknir af leiknum. Ég man eftir að hafa skoðað þetta og hugsað með mér að það væri heillandi hvernig hægt væri að fá fólk til að sökkva sér í vísindi með því að spila leik.
Þegar ég fór að skoða þetta sá ég að sumir leikendurnir höfðu reiknað út ákveðin brot, sem gengu þvert á það sem hefði verið rökrétt röð amínósýranna, hryggjarstykkisins í próteininu, en höfðu leitt þá að réttri þrívíddarbyggingu þeirra.
Ég man að ég tengdi þetta við það sem við gerðum í AlphaGo þar sem okkur tókst að líkja eftir eðlisávísun ótrúlegra meistara í leiknum Go. Þannig að ég hugsaði með mér að ef þetta væri hægt í tilfelli þessara atvinnumanna í Go, sem höfðu varið öllu lífi sínu í leikinn, og síðan hefðu verið þessir áhugamenn í tölvuleiknum sem vissu ekkert um líffræði, af hverju ættum við ekki að geta líkt eftir því sem væri í gangi í eðlisávísun þessara áhugamanna í leiknum?
Klein: Þegar þú segir fyrir um byggingu próteins sem ekki hefur verið sagt fyrir um áður, hvernig veistu að þú hefur rétt fyrir þér? Við hverju ertu að bregðast?
Hassabi: Í hinum raunverulega heimi eru ekki einfaldir hlutir eins og stig eða skilyrði fyrir sigri. Það er augljóslega bara að finna í leikjum. En í próteinum og líffræði almennt er hægt að fína góða staðgengla eins og að lágmarka orkuna í kerfinu. Flest náttúruleg kerfi nýta orku vel þannig að það er hægt að elta orkustigið eða lausa orku í kerfinu og reyna að lágmarka það.
Einnig búum við að mikilli sögu erfiðra rannsókna. Á 50 árum hefur fólk í rannsóknarstofum um allan heim lagt mikið á sig og líffræðingum hefur tekist að finna byggingu á milli 100.000 og 150.000 próteina. Allar þessar upplýsingar eru vistaðar í gagnagrunni sem kallaður er Próteingrunnurinn (Protein Data Bank). Við getum notað hann til þjálfunar, en einnig sem viðmið til að prófa spár okkar.
Klein: Þannig að það eru til 100.000 til 150.000 í grunni, en síðan vitum við að það eru 100 milljónir eða 200 milljónir próteina. Það eru ekki miklar upplýsingar til að þjálfa. Næsta skref ykkar er síðan að mér skilst frekar hættulegt og mætir yfirleitt vanþóknun og það er að kerfið byrjar að þjálfa sig á forsendum spánna sem það gerir. Hvernig gerið þið það án þess að gervigreindin mengi sig og afvegaleiði?
Hassabi: Eins og þú bendir á eru 150.000 dæmi mjög lítið fyrir vélnámskerfi. Þannig að eitt af því sem við þurftum að gera var að bæta við hin raunverulegu gögn til að smíða fyrstu útgáfuna af AlphaFold. Ég held að við höfum gert það með því að láta AlphaFold spá fyrir um byggingu einnar milljónar nýrra próteina. Síðan létum við gervigreindina meta sjálfa sig, hversu viss hún væri um þessar spár. Síðan grisjuðum við og tókum frá efstu 30 til 35 prósentin – í kringum 300.000 spár – og settum aftur í þjálfunarlíkanið ásamt raunverulegu 150 þúsund próteinunum.
Þannig að við bættum við byggingu um hálfrar milljónar próteina, augljóslega ásamt þeim sem það hafði sjálft sagt fyrir um, til að þjálfa lokakerfið. Það kerfi var þá orðið nógu gott til að komast yfir þennan þröskuld öreindanákvæmni. Í raun má segja að við höfum verið með rétt svo næg gögn sem vísindasamfélag til að binda það við þetta sigtunarferli og við teljum að ástæðan fyrir því að það sé í lagi sé að við vorum mjög varkár – en fyrst og fremst höfðum við nóg af raunverulegum upplýsingum fyrir.
Við vorum með blöndu af raunverulegum og tilbúnum gögnum og það var nóg til að halda henni á sporinu. Einnig var mikið af góðum prófum – sjálfstæðum prófum – til að komast að því hversu góðar þessar spár væru og kerfið í heild vegna þess að með tímanum settu rannsakendur nýjar byggingar inn í grunninn sem komu til eftir lokadagsetningu okkar í þjálfun kerfisins. Og við gátum borið saman hversu nákvæmt kerfið var í samanburði við þessi nýju tilraunagögn.
Klein: Mig langar að tengja þetta við svolítið sem fólk sem hefur verið að fylgjast með gervigreindarmálum þekkir sennilega og það er ímyndunarvandinn. Þegar ég nota ChatGPT, eða í það minnsta ólíkar útgáfur þess, er algengt að maður spyrji raunverulegrar spurningar og það búi bara til texta fyrir þig?
Hassibi: Spjallbottar eru nú ekki ósvipaðir ofvitum. Þeir spinna bara það fyrsta sem kemur í hugann. Og við þurfum smá yfirvegun, skipulag og rökvísi til þess að segja má geðheilbrigðisprófa það sem forspáin er að segja þér.
Námskerfin sem við erum þekkt fyrir eru með djúpa sjálfsuppbyggingargetu og gera þetta. Uppbyggingarhlutinn af kerfinu, skipulagshlutinn, stillir af það sem líkanið segir honum.
Klein: Einn sproti af AlphaFold er hópur sem heyrir undir Alphabet, móðurfyrirtæki Google, og heitir Isomorphic Labs. Segðu mér aðeins frá þeim – vísindakenningunni, en einnig viðskiptahugmyndinni að baki.
Hassibi: Mikilvægi AlphaFold helgast af því að ég held að það geti verið hluti af því að hraða uppgötvun lyfja og þar með lækningu sjúkdóma. En það er aðeins hluti af ráðgátunni.
Isomorphic er systurfyrirtæki DeepMind, sem hefur það verkefni að búa til fleiri AlphaFold-kerfi, en á hliðarsviðum, með því að fara meira inn í efnafræðina, eins og að hanna lítil mólekúl, segja fyrir um eiginleika þessara litlu mólekúla og tryggja að við lágmörkum hluti á borð við eitrun og aukaverkanir og hámörkum getu þeirra til að bindast þeim próteinum sem við viljum að þau bindist.
Klein: Ég veit að þú hefur áhuga á að smíða almennt greindarkerfi. Getur þú sagt mér aðeins af því hvernig þú sérð nú fyrir þér að leiðin að því liggi?
Hassibi: Verkefni okkar er að smíða stórt, almennt kerfi. Þannig virkar heilinn. Við erum með eitt kerfi og við getum gert marga hluti með huganum.
Mér finnst áhugavert að á leiðinni að þessu marki hef ég alltaf verið þeirrar hyggju að við þyrftum ekki að bíða eftir að komast í algervigreind eða A.G.I. (Artificial General Intelligence) áður en við getum farið að ná ótrúlegri nytsemi út úr þessum kerfum með því að nota sams konar tækni, en kannski með því að sérhæfa þau á ákveðnu sviði. AlphaFold er frábært dæmi um það, kannski besta dæmið til þessa um þetta í gervigreind.
Það sem ég held að muni gerast á næsta skeiði þessara kerfa – og við erum að vinna í okkar eigin kerfum undir yfirskriftinni Gemini – sé að það verði blanda tveggja hluta. Við munum verða með kerfi sem stöðugt verður öflugra og við eigum í grunninn samskipti við í gegnum tungumál, en hefur aðra hæfileika eins og stærðfræði og kóðun og kannski smá rökfærslu- og skipulagsgetu, einhvern tímann í næstu kynslóðum þessara kerfa.
Eitt af því sem þessi kerfi geta gert er að nota verkfæri. Til að gera það sem þau þurfa að gera þurfa þau í raun að kalla til og nýta sér verkfæri og þessi verkfæri geta verið af ýmsum toga. Þau gætu verið forrit sem þau geta lært að nota, með því að nota uppbyggingarlærdóm. Eða þau geta verið önnur gervigreindarkerfi, önnur námskerfi.
Ég held að það sé ekki mikið vit í að tungumálalíkön kunni að umbrjóta prótein. Það myndi hljóma eins og ofursérhæfing í upplýsingagrunni í samhengi við tungumál og alla hina almennu hlutina sem kerfið þarf að læra og tileinka sér. Ég held að það væri skilvirkara fyrir það að kalla til önnur gervigreindarkerfi og nýta sér eitthvað á borð við AlphaFold ef það þyrfti að umbrjóta prótein.
En þetta er áhugavert vegna þess að á einhverjum tímapunkti eftir því sem tíminn líður verður farið að setja þessa hæfni aftur inn í almenna kerfið. En ég held að í það minnsta á næsta skeiði [þróunar gervigreindar] munum við sjá að almenna kerfið nýti sér þessi sérhæfðu kerfi.
Klein: Eitt af því sem ég hef smá áhyggjur af er að ég sé mun meiri gagnsemi fyrir mannkyn í þessum kerfum sem eru frekar vísindaleg en mannleg, en að allur áhuginn og fjárfestingin og orkan sé að fara í þessi kerfi sem eru mannlegri og einhvern veginn kunnuglegri, kerfi sem ég hef áhyggjur af að verði ekki jafn gagnleg.
Hassibi: Ég held að jafnvel í okkar nýja búningi sem Google DeepMind munum við halda áfram að keyra af krafti á hvorum tveggja vígstöðvum. Að vinna að framþróun í vísindum og læknavísindum mun alltaf verða kjarninn í okkar starfi og sú almenna köllun að gagnast mannkyni. En við munum einnig leggja hart að okkur við næstu kynslóð kerfa sem munu verða ný reynsla fyrir milljarða notenda og hjálpa þeim í þeirra daglega lífi. Ég er jafn spenntur fyrir möguleikunum á báðum þessum sviðum.
Það er meira þannig að kerfi á borð við AlphaFold eru vísindatæki fyrir sérfræðinga til að nota og efla sína vinnu þannig að þeir geti hraðað mikilvægum rannsóknum. Og á hinn bóginn, í augnablikinnu, held ég að spjallbottar séu frekar skemmtileg afþreyingarfyrirbæri.
En ég held að það sé svo miklu meira í vændum á því sviði. Ég sé fyrir mér að leiðir liggi saman í því sem ég talaði um áður með þessi almennu kerfi, kannski verður hægt að eiga í samskiptum við þau með tungumálinu. Ég held í raun að það sé mjög áhugverð blanda í vændum ef við reynum að færa út mörkin á báðum sviðum og það er það sem við hyggjumst fyrir þegar við höldum fram á veginn.
Klein: Ef við erum að komast að þeim punkti að einhver er við að það að búa eitthvað til í líkingu við almennt greindarkerfi, er það þá of öflug tækni til að vera í einkahöndum? Ætti þetta að vera eitthvað sem það fyrirtæki, hvað sem það verður, sem nær þangað fyrst ræður yfir? Eða þurfum við á því að halda að eitthvað annað ráði yfir því?
Hassibi: Mín persónulega skoðun er að það sé stærra en nokkurt eitt fyrirtæki eða ein þjóð. Ég held að það þurfi alþjóðlegt samstarf. Ég hef oft talað um það þurfi alþjóðlegt átak á borð við CERN í sambandi við almenna gervigreind. Og ég myndi gjarnan vilja sjá eitthvað slíkt þegar við nálgumst, kannski eftir mörg ár, almennt gervigreindarkerfi og þar verði farið í mjög vandaðar rannsóknir á öryggishlið þessara mála, til að skilja hvað þessi kerfi geta gert og jafnvel að prófa þau við aðstæður undir eftirliti og með miklum tölvuöryggisráðstöfunum á öllum sviðum. Ég held að það væri góð leið fram á við þegar við nálgumst gervigreindarkerfi á pari við manninn.
© 2023, The New York Times Company