Anthropic-in Fable modeli kibertəhlükəsizlik məhdudiyyətləri ilə tənqid edilir
Anthropic yeni təqdim etdiyi Fable modelində kibertəhlükəsizliklə bağlı sərt məhdudiyyətlər tətbiq edib. Ekspertlər bu məhdudiyyətlərin həm modelin istifadəsini məhdudlaşdırdığını, həm də təkmilləşdirilməli olduğunu bildirirlər.
Anthropic şirkəti çərşənbə axşamı günü güclü və çox müzakirə olunan kibertəhlükəsizlik modeli Mythos-un məhdud və ictimai versiyası kimi təqdim etdiyi Fable modelini istifadəyə verdi.
Lakin tətbiq olunan məhdudiyyətlər hər kəs tərəfindən bəyənilməyib və bir sıra kibertəhlükəsizlik tədqiqatçıları və mütəxəssisləri onlayn platformalarda narazılıqlarını ifadə ediblər.
"[Fable] kibertəhlükəsizliklə bağlı ola biləcək bütün sorğuları rədd edir. Hətta sadə, zərərsiz məsələlər, məsələn, blog yazısını oxumaq belə," deyə IBM X-Force şirkətində çalışan tanınmış təhlükəsizlik tədqiqatçısı Valentina “Chompie” Palmiotti bildirib.
Modeldə məhdudiyyətlər işə düşdükdə, Fable söhbəti dayandırır və "təhlükəsizlik tədbirləri bu mesajı kibertəhlükəsizlik və ya biologiya mövzuları üçün işarələyib" deyə xəbərdarlıq edir.
Bu məhdudiyyətlər Fable modelinin zərərli proqramların inkişafında və ya proqram təminatına müdaxilə etmə riskinin qarşısını almaq üçün tətbiq olunub — bu, Anthropic-də uzun müddətdir mövcud olan bir narahatlıqdır. Biologiya ilə bağlı məhdudiyyətlər isə bənzər səbəbdən, yəni bioloji silahların hazırlanması təhlükəsinə qarşı qoyulub.
Ötən aprel ayında Anthropic “”Mythos”” modelini buraxarkən onu Project Glasswing adlı proqram çərçivəsində şirkətlər və təşkilatların məhdud sayı ilə payladı. Bu təşəbbüs kritik proqram təminatı və infrastrukturu qorumağı hədəfləyirdi. Son həftə Anthropic Mythos modelinin əlçatanlığını 15 ölkə üzrə yüzlərlə təşkilata genişləndirib.
Lakin yaxşı niyyətlərə baxmayaraq, kibertəhlükəsizlik mütəxəssisləri məhdudiyyətlərin qeyri-dəqiq tətbiqindən narahatdırlar. Təcrübəli kibertəhlükəsizlik mütəxəssisi Matt Suiche bildirir ki, “təhlükəsiz kod yazmağı istəyəndə Fable bunu proqram mühəndisliyi yox, kibertəhlükəsizlik işi kimi qəbul edir və nəticədə səviyyə aşağı düşür”. Fable modelində məhdudiyyətə çatanda avtomatik olaraq Claude Opus 4.8 versiyasına keçilir. Suiche qeyd edir ki, məhdudiyyətlər əsasən açar sözlərə əsaslanır və "kibertəhlükəsizlik" sahəsi ilə bağlı hər hansı termin məhdudiyyətləri işə salır.
Suiche həmçinin əlavə edib: “Anlamaq olar ki, hələ erkən mərhələdəyik və guardrail-lər inkişaf mərhələsindədir. Vaxt keçdikcə Anthropic və digər qabaqcıl model şirkətləri yeni nəsil kibertəhlükəsizlik şirkətləri ilə daha sıx əməkdaşlıq edəcək. Belə buraxılışlarda daha çox istifadəçini əhatə etmək daha yaxşıdır, məhdudiyyətləri isə zamanla yumşaltmaq mümkündür.”
Başqa bir tədqiqatçı X platformasında şikayət edib ki, “hətta kod icmalının istənilməsi belə Fable-in məhdudiyyətlərini işə sala bilir”.
Anthropic şirkətindən dərhal şərh ala bilmədik.
Modeldəki guardrail mexanizmlərindən əlavə, Anthropic kibertəhlükəsizlik üzrə mütəxəssislərin Cyber Verification Program proqramına müraciət etməsini tələb edir. Qəbul edilən tətbiqçilər Claude modelindən kibertəhlükəsizlik işləri üçün daha az məhdudiyyətlə istifadə edə bilirlər. OpenAI şirkətində də buna bənzər Trusted Access for Cyber proqramı mövcuddur.
TechCrunch
Cybersecurity researchers aren’t happy about the guardrails on Anthropic’s Fable
Orijinal məqaləyə keç


