Kai dirbtinio intelekto kompanijos pristato naujus modelius, istorija dažniausiai skamba vienodai: daugiau parametrų, geresni testai, platesnis prieinamumas. Tačiau birželio 9 dieną „Anthropic" padarė kažką kitaip. Ji išleido tą patį modelį kaip du atskirus produktus — ir vieną iš jų iš esmės paslėpė nuo plačiosios visuomenės.
Naujasis modelis vadinasi „Claude Fable 5" ir tai yra galingiausias „Anthropic" iki šiol sukurtas dirbtinis intelektas. Kartu su juo kompanija pristatė ir „Claude Mythos 5" — identišką modelį be kibernetinio saugumo apribojimų. Skirtumas tas, kad „Mythos 5" gali naudotis tik kruopščiai atrinkta grupė: kibernetinės gynybos specialistai ir kritinės infrastruktūros operatoriai.
Klasifikatorius vietoj „atsisakau atsakyti"
Visiems kitiems skirtas „Fable 5" veikia su įdomiu mechanizmu. Kai vartotojo užklausa suveikia kibernetinio saugumo klasifikatorių, modelis neatsisako atsakyti — jis perduoda užklausą silpnesniam modeliui „Claude Opus 4.8" ir informuoja vartotoją apie perdavimą. Tai esminis pokytis nuo „atsisakau atsakyti", kurį naudoja dauguma AI kompanijų.
// reklamaČia gali būti jūsų reklamaSusisiekite →„Anthropic" argumentuoja, kad „Mythos" klasės modeliai geba taip efektyviai rasti ir išnaudoti programinės įrangos spragas, jog laisvai prieinami jie taptų reikšmingu ginklu užpuolikams. Kitaip tariant, kompanija sąmoningai pasirinko apriboti savo galingiausią produktą — ne todėl, kad negalėtų jo paleisti, o todėl, kad per gerai žino, ką jis gali.
Skaičiai įspūdingi. Vidinio testavimo metu, kai „Fable 5" buvo nustatytas blokuoti, o ne perduoti užklausas, klasifikatoriai sustabdė modelį nuo bet kokios pažangos atliekant puolamąsias kibernetines užduotis — žvalgybą, aptikimą, lateralinį judėjimą. Vienas išorinis partneris patvirtino, kad „Fable 5" neįvykdė nė vienos kenksmingos užklausos per pirmąjį bandymą, atlaikydamas 30 skirtingų viešai žinomų „jailbreak" metodų.
Kas dar blokuojama ir kiek tai kainuoja
Be kibernetinio saugumo, klasifikatoriai saugo ir nuo kitų rizikų: biologijos, chemijos ir modelio distiliacijos. Pastaroji yra įdomus atvejis — tai bandymas išgauti modelio gebėjimus ir panaudoti juos konkuruojančio modelio treniravimui. „Anthropic" blokuoja tai, kad išvengtų situacijos, kai pažangiausi gebėjimai nuteka be jokių saugumo mechanizmų.
Tiesa, sistema nėra tobula. „Anthropic" pripažįsta, kad apsaugos nustatytos konservatyviai — kartais suveikia ir visiškai nekaltos užklausos. Kompanija teigia, kad perdavimai įvyksta mažiau nei 5 procentuose sesijų, tad daugiau nei 95 procentais atvejų „Fable 5" elgiasi taip pat, kaip ir visiškai neapribotas „Mythos 5".
Išorinė klaidų medžioklės programa, trukusi daugiau nei 1000 valandų, neaptiko jokio universalaus būdo apeiti apsaugas. Po „Fable 5" paleidimo kompanija žada siaurinti klasifikatorius ir mažinti klaidingų suveikimų skaičių.
Ką tai reiškia AI pramonei
„Anthropic" sprendimas išleisti vieną modelį dviem skirtingais pavidalais žymi posūkį AI pramonėje. Vietoj to, kad varžytųsi vien dėl galingumo, kompanija pradeda varžytis dėl atsakingumo. Tai kartu ir rizika: jei konkurentai išleis panašaus galingumo modelius be tokių apribojimų, „Fable 5" gali pasirodyti mažiau patrauklus kūrėjams.
Kainos atžvilgiu „Fable 5" pastebimai pigesnis už ankstesnius modelius: 10 dolerių už milijoną įvesties žetonų ir 50 dolerių už milijoną išvesties žetonų — mažiau nei pusė ankstesnės „Mythos Preview" kainos. Iki birželio 22 dienos modelis nemokamai pasiekiamas „Pro", „Max", „Team" ir įmonių planų naudotojams, vėliau pereinant prie naudojimo kreditų.
Visgi tikrasis klausimas išlieka: ar vartotojai norės mokėti už modelį, kuris kartais atsisako atlikti, ką jie prašo? „Anthropic" lažinasi, kad taip. Jei šis statymas pasiteisins, „Fable 5" gali tapti ne tik galingiausiu, bet ir svarbiausiu šių metų AI leidiniu.
Europoje šie klausimai ypač aktualūs. ES AI Aktas reikalauja, kad didelės rizikos AI sistemos turėtų įmontuotus saugumo mechanizmus. „Fable 5" modelis — su klasifikatoriais vietoj paprasto atsisakymo — gali tapti pavyzdžiu, kaip ateityje atrodys atitiktis Europos reguliavimui. Lietuvos įmonėms, dirbančioms su AI, tai signalas: atsakingumas tampa konkurenciniu pranašumu, o ne tik teisiniu reikalavimu.
Tuo tarpu kūrėjų reakcija kol kas mišri. Vieni giria „Anthropic" už principingumą, kiti nerimauja, kad klasifikatoriai gali tapti pernelyg agresyvūs ir trukdyti teisėtam darbui.
Verta prisiminti, kad „Anthropic" buvo įkurta būtent su saugumo misija. 2021 metais grupė tyrėjų paliko „OpenAI", nes, jų manymu, kompanija per greitai juda komercializacijos linkme, nepakankamai įvertindama rizikas. Dabar, praėjus penkeriems metams, „Fable 5" yra bene ryškiausias šios filosofijos įsikūnijimas: galingiausias modelis sąmoningai apribotas.
Galiausiai viskas priklausys nuo to, kaip greitai kompanija sugebės susiaurinti apsaugas iki tikrai pavojingų užklausų, palikdama laisvę viskam kitam. Jei pavyks — „Fable 5" gali tapti etalonu. Jei ne — rinka balsuos kojomis.
Dažnai užduodami klausimai
- Kuo „Fable 5" skiriasi nuo „Mythos 5"?
- Tai tas pats modelis, tačiau „Fable 5" turi įjungtus papildomus klasifikatorius, kurie blokuoja kibernetinio saugumo, biologijos, chemijos ir modelio distiliacijos užklausas. „Mythos 5" šių apribojimų neturi, bet prieinamas tik patikrintiems kibernetinės gynybos specialistams.
- Ar galiu naudoti „Fable 5" nemokamai?
- Iki birželio 22 dienos „Fable 5" nemokamai pasiekiamas „Pro", „Max", „Team" ir įmonių planų naudotojams. Po to jis veiks naudojimo kreditų pagrindu. Kaina: 10 dolerių už milijoną įvesties žetonų, 50 dolerių už milijoną išvesties žetonų.
- Ką reiškia, kai klasifikatorius perduoda užklausą kitam modeliui?
- Kai jūsų užklausa suveikia saugumo klasifikatorių, „Fable 5" neatsisako atsakyti, o perduoda ją silpnesniam modeliui „Opus 4.8". Gaunate atsakymą ir pranešimą apie perdavimą. Kompanijos duomenimis, tai įvyksta mažiau nei 5 proc. sesijų.
Šaltiniai
- Anthropic Releases Claude Fable 5, Its Most Powerful AI Yet, With Cyber SafeguardsThehackernews · 2026
- Anthropic — Claude Fable 5 announcementAnthropic · 2026



