Fable-líkan Anthropic markar nýtt skref í þróun gervigreindar
Framfarirnar í gervigreind birtast nú sífellt skýrar þar sem kerfin geta unnið lengur og skilað af sér flóknari verkefnum.
Notendur Claude frá Anthropic fengu ánægjulegar fréttir nú í byrjun mánaðar þegar Anthropic gerði Fable-líkanið aftur aðgengilegt, skömmu eftir að aðgangi að því hafði verið lokað tímabundið vegna öryggissjónarmiða. Endurkoman vakti athygli, enda hefur líkanið verið talið meðal öflugustu kerfa félagsins og undirstrikar hve hratt fremstu gervigreindarlíkönin eru að þróast.
Lykilbreytingarnar frá fyrri líkönum eru fyrst og fremst þrjár. Í fyrsta lagi getur Fable unnið mun lengri verkefni með minni aðkomu notanda, haldið samhengi yfir stærri gagnasöfn og skilað af sér heildstæðari vinnu en eldri líkön. Í öðru lagi virðist getan í forritun, netöryggi og úrvinnslu gagna hafa tekið stökk fram á við, sérstaklega í verkefnum þar sem líkanið þarf að greina vandamál, prófa lausnir og leiðrétta eigin vinnu yfir lengri tíma. Í þriðja lagi hefur Anthropic styrkt öryggisumgjörðina til muna. Viðkvæmar fyrirspurnir, til dæmis á sviði netöryggis, lífvísinda eða efnafræði, eru síaðar frá eða færðar yfir í önnur kerfi með meiri takmörkunum.

Ný líkön frá stærstu bandarísku gervigreindarfyrirtækjunum hafa komið fram með sífellt styttra millibili og getan virðist nú aukast hraðar en áður á flestum þeim mælikvörðum sem skipta máli. Framfarirnar sjást í betri röksemdafærslu, skýrari texta, hærri árangri í prófum og vaxandi getu kerfanna til að vinna lengri verkefni, nota verkfæri, leiðrétta eigin mistök.
Á sama tíma hefur sjálfur mælikvarðinn á framfarir breyst. Undanfarin misseri hefur umræðan að mestu snúist um hvort ný líkön svari betur, skrifi betur eða nái hærri einkunnum í tilteknum prófum. Sú nálgun fangar þó sífellt minni hluta myndarinnar eftir því sem kerfin fara að vinna lengri og flóknari verkefni. Mikilvægara er nú að horfa til þess hversu mikla raunverulega vinnu líkönin geta leyst af hendi, hversu lengi þau geta unnið sjálfstætt án stöðugrar aðkomu notanda og hversu mikið mannlegt vinnuframlag má kalla fram með einni vel skilgreindri beiðni.
Einn mælikvarði sem þróaður hefur verið er AA-Briefcase. Líkönin fá verkefni sem líkjast flóknum ráðgjafar- eða greiningarverkefnum og þurfa að vinna með mörg tengd undirverkefni, þúsundir heimildaskjala og skila afurðum á borð við minnisblöð, kynningar og töflureikna. Matið reynir þannig að fanga það sem verður sífellt mikilvægara eftir því sem líkönin verða sjálfstæðari: hvort þau geti haldið utan um langt verkefni, greint upplýsingar, forgangsraðað, dregið réttar ályktanir og skilað nothæfri niðurstöðu.

Lokuðu bandarísku líkönin eru enn fremst á þennan mælikvarða, sérstaklega Claude Mythos/Fable 5, en opin líkön, einkum frá Kína, eru að þróast hratt og verða sífellt raunhæfari valkostur fyrir breiðari notkun.
Þróunin sést einnig í því hvernig stærstu félögin á markaðnum lýsa næsta stigi tækninnar. Sam Altman, forstjóri OpenAI, hefur talað um að fyrstu gervigreindarþjónarnir séu farnir að verða hluti af vinnuafli fyrirtækja. Rohan Varma hjá OpenAI hefur tekið í sama streng og lýst skýjadrifnum gervigreindarþjónum sem nýjum grunninnviði í því hvernig vinna er unnin, þar sem slík kerfi geti sinnt raunverulegum verkefnum fyrirtækja í stórum skala. Anthropic setur sömu þróun fram með skýrum hætti í umfjöllun sinni um Claude Code:
„People decide what to build, and the agent decides how to build it.“
Þegar litið er lengra austur er einnig að eiga sér stað áhugaverð þróun sem hefur að mestu verið undir yfirborðinu. Samhliða lokuðu líkönunum frá bandarísku tæknirisunum hafa kínversk opin líkön tekið hröðum framförum. Þau eru yfirleitt nokkrum mánuðum á eftir fremstu lokuðu kerfunum, en eru mun ódýrari í notkun og hægt er að aðlaga að ólíkum verkefnum, fyrirtækjum og rekstrarumhverfi. Það skiptir miklu máli vegna þess að verð og aðgengi ráða oft úrslitum um hversu hratt ný tækni dreifist um hagkerfið. Ef þessi líkön halda áfram að þróast jafn hratt gæti stór hluti fyrirtækja fengið aðgang að mjög öflugri gervigreindargetu án þess að þurfa að byggja alla sína notkun á dýrustu kerfunum frá bandarísku tæknirisunum.
Þegar þetta er lagt saman er ljóst að gervigreindarkapphlaupið er að færast í nýjan fasa. Framfarirnar snúast síður um betri svör og meira um getu kerfanna til að leysa af hendi raunverulega vinnu innan fyrirtækja. Lokuðu bandarísku líkönin halda enn forystunni, en ódýrari opin líkön geta hraðað útbreiðslunni. Næstu misseri munu ráðast af því hversu hratt þessi geta færist inn í rekstur fyrirtækja og skilar sér í mælanlegri framleiðni, lægri kostnaði og raunverulegri verðmætasköpun.



