Patronus AI 50 milyon dollar yatırım ilə süni intellekti sınaqdan keçirir
Patronus AI süni intellekt agentlərinin əməliyyat qabiliyyətini qiymətləndirmək üçün simulyasiya olunmuş rəqəmsal mühitlər yaradır. Şirkət son investisiya turunda 50 milyon dollar toplayaraq ümumi maliyyələşməsini 70 milyon dollara çatdırıb.
Süni intellekt agentləri getdikcə təkmilləşir. Onlar suallara cavab verməkdən mürəkkəb çoxsəviyyəli tapşırıqları avtonom şəkildə yerinə yetirməyə doğru inkişaf edir.
Lakin bu agentlərin səyahət rezervasiyası etməsi və ya istifadəçilər adından maliyyə təhlili aparması üçün etibarlı olmaları vacibdir. Bu səbəbdən model təminatçıları və agentləri hazırlayan startaplar onların müxtəlif geniş ssenarilərdə etibarlı işlədiyini təsdiqləmək istəyir.
Süni intellekt laboratoriyaları tez-tez modellərinin performansını göstərmək üçün benchmarklardan istifadə edir, amma yüksək bal, hətta agent yönümlü benchmark da süni intellektin müxtəlif mürəkkəb, real dünya vəzifələrini düzgün yerinə yetirəcəyini sübut etmir.
Patronus AI 2023-cü ildə Meta AI-nin keçmiş tədqiqatçıları Anand Kannappan və Rebecca Qian tərəfindən yaradılıb. Startap modellərin performansını qiymətləndirmək üçün simulyasiya olunan rəqəmsal mühitlər qurur və model istehsalçıları ilə şirkətlərə agentləri təkmilləşdirməkdə yardım edir.
San-Fransisko mərkəzli Patronus AI mühüm problemi həll edir. Notable Capital-in idarəedici direktorlarından Glenn Solomonun sözlərinə görə, Frontier AI laboratoriyası və müxtəlif startaplar şirkətin simulyasiya mühitlərinə böyük tələbat göstərir.
Şirkətin gəliri son il ərzində 15 dəfə artıb və bu, investorların diqqətini cəlb edib. Patronus cümə axşamı günü Greenfield Partners tərəfindən idarə olunan 50 milyon dollarlıq Series B investisiya turunu açıqlayıb. Notable Capital, Lightspeed, Datadog və Samsung da tura qoşulub. Bu investisiya şirkətin ümumi maliyyələşməsini 70 milyon dollara çatdırıb.
Patronus özünü “rəqəmsal dünya modelləri” adlandırdığı vasitələrlə vebsaytların və daxili sistemlərin surətlərini yaradır. Bu mühitlərdə agentlər təlimdən sonra təkrar gücləndirmə öyrənmə metoduyla sınaqdan keçirilir, bu üsul müvəffəqiyyətli tapşırıqları mükafatlandırır, səhvləri isə cəzalandırır.
AI laboratoriyaları bu rəqəmsal simulyasiyalara çox dəyər verir. Bu, agentlərə müxtəlif, bəzən isə proqnozlaşdırılması çətin ssenariləri sınamağa imkan yaradır. Patronus yanaşmasını Waymo-nun avtonom avtomobilləri sərt hava şəraiti və nadir təhlükələrə qarşı sınaq üçün yaratdığı süni dünya ilə müqayisə edir.
AI agentləri tez-tez qısa yol tuturlar və tapşırığı düzgün yerinə yetirmirlər. Glenn Solomon bildirib ki, “Patronus hiylələri aşkara çıxarmaqda və modelləri məsuliyyətə cəlb etməkdə çox bacarıqlıdır.”
Hazırda Patronus proqram mühəndisliyi və maliyyə sahələri üçün simulyasiya edilmiş rəqəmsal dünyalar təqdim edir, lakin Anand Kannappan bunların yalnız başlanğıc olduğunu söyləyir.
O, bildirir: “Bu gün əsas diqqətimiz dərhal yoxlana və təsdiqlənə bilən problemlər üzərindədir. Amma yoxlanılması çox çətin və ya qeyri-mümkün olan sahələr də var.”
Kannappan əlavə edib: “Bu proseslərin yoxlanılması asan deyil. Biz agentin 10 saat, 10 gün ya 10 həftə işləyə biləcəyi mühiti yaratmaq istəyirik.”
Rəqiblər baxımından Patronus əsas rəqabətini AI laboratoriyalarının agent davranışını qiymətləndirmək üçün yaratdığı daxili komandalarla aparır. İnsan məlumatı toplayan Mercor və Surge modellərə təkrar gücləndirmə öyrənməsində yardım etsə də, Patronus agentlərin davranışını insan iştirakı olmadan qiymətləndirir.
TechCrunch
Patronus AI lands $50M to build ‘digital worlds’ that stress-test AI agents
Orijinal məqaləyə keç


