General Compute süni intellekt hesablama gücünü SambaNova çipləri ilə artırır
General Compute SambaNova-nın yeni çiplərindən istifadə edərək süni intellekt modellərinin cavab vermə müddətini sürətləndirir. Şirkət 15 milyon dollar investisiya cəlb edib və unikal texnologiyası ilə hesablama mərkəzlərində yerləşdirmə çətinliyini azaldır.
Süni intellekt modellərini işlədən kompüterlərə tələbat artmaqda davam edir. Ancaq bazarda əsas problemlərdən biri düzgün çiplərin tapılması, digər problem isə onları data mərkəzlərinə yerləşdirərək gəlir gətirməsidir.
General Compute adlı yeni neokloud—modelin öyrədilməsi deyil, yalnız cavab verilməsi mərhələsində işləyən süni intellekt hesablama gücünü icarəyə verən şirkət—bu problemlərə həll yolları tapıb və AI ekosisteminin gələcəyini göstərir. Şirkət FUSE VC liderliyində, Carya Venture Partners və Village Global Ventures-in iştirakı ilə 15 milyon dollar sərmayə toplayıb, ümumi dəyəri isə 60 milyon dollardır.
Düzgün çip nədir? GPU-ların tələbatı çoxalıb, lakin artıq qəbul olunur ki, AI modelləri öyrədildikdən sonra onların işlədilməsi üçün GPU-lar ən uyğun çip deyil. Modelin aktiv cavab yaratdığı mərhələnin hesablama tələbləri öyrədilmədən fərqlidir və bu məqsədlə xüsusi çip sinfi hazırlanır. Nvidia-nın dekabrda 20 milyard dollarlıq Groq əməliyyatı və Cerebras-ın ötən həftə 57 milyard dollarlıq IPO-su bunun sübutudur.
Hər iki şirkətin imkanları məhdud olduğundan, General Compute-in təsisçiləri, CEO Finn Puklowski və CTO Ceyson Gudison başqa seçim müəyyən ediblər. Onlar Intel dəstəkli, yalnız inference üçün ixtisaslaşmış çip istehsalçısı SambaNova-ya müraciət ediblər, hansı ki, Silikon Vadisində geniş müzakirələrdən kənarda qalıb.
SambaNova bu il yeni çiplərini təqdim edərkən vəziyyət dəyişə bilər. Yeni arxitektura daha çevikdir və inference zamanı konteksti saxlamaq üçün daha çox yaddaşdan istifadə edir. Şirkət iddia edir ki, SambaNova yalnız GPU-lardan deyil, həmçinin Groq və Cerebras kimi digər xüsusi çiplərdən üstün performans göstərir. Puklowski deyir ki, bu çiplər saniyədə 600-700 token yarada biləcək, halbuki GPU-lar üçün bu rəqəm təxminən 250 token təşkil edir.
General Compute SambaNova-nın SN50 çiplərindən 300 milyon dollarlıq sifariş verib və onları ilk neokloud kimi tətbiq edəcək.
Bu çiplər General Compute üçün ikinci böyük problemi, yəni yerləşdirmə məsələsini də həll edir: Onlar hava ilə soyudulur, su ilə deyil, daha az enerji sərf edir və mövcud data mərkəzi obyektlərinə əlavə infrastruktur yatırımı olmadan quraşdırıla bilər.
Puklowski colocation—General Compute-in avadanlığı başqasının obyektində yerləşdirməsi—müqavilələri axtarır, yalnız data mərkəzi təminatçıları ilə yox, həm də kripto maynerlərlə əməkdaşlıq edir. Çünki bitcoin istehsalının xərcləri tez-tez qiymətindən yüksək olur və maynerlər infrastrukturlarını digər məqsədlər üçün istifadə etmək istəyirlər.
General Compute ötən həftə bulud xidmətini istifadəyə verib və artıq MiniMax 2.7 adlı güclü açıq mənbə LLM-i ən sürətli işlədən olduğunu bildirir.
Cey Hasselman 2021-ci ildə Groq-a sərmayə qoyaraq inference sektoruna erkən daxil olub. Bu il AI sahəsinə həsr olunmuş Evercrest Partners fondunu yaradıb və General Compute-ə ilk investisiyasını edib. Hasselman SambaNova ilə General Compute arasındakı əməkdaşlıqda Coreweave və Nvidia-nın əlaqəsini, həmçinin Groq-un çip istehsalı və əvvəlki bulud xidmətinin birləşməsinə paralellər görür.
Onun sözlərinə görə, “Onlar çiplərini yüksək inkişaf potensialı olan mühitlərdə yerləşdirəcək, sağlam müştəri qarışığına ehtiyac duyur. General Compute SambaNova-ya bahis etdiyi kimi, SambaNova da General Compute-ə bahis edir.”
Əsas sual AI gələcəyində hansı kompüter arxitekturasının daha çox dəyər qazanacağıdır. İnference buludları çoxsaylı modellər və agentlərin olduğu, heç bir təminatçının dominant olmadığı, sürət və inference xərclərinin əsas rəqabət amillərinə çevrildiyi bir dünyaya istiqamət verir. Məsələn, bu həftə OpenRouter-un 113 milyon dollarlıq Series B sərmayəsi şirkətin müştərilərə bir neçə modelə çıxış verərək token xərclərini optimallaşdırma qabiliyyətini göstərir.
Sürət həm qiymət, həm də imkanlar baxımından önəmlidir. Puklowski kodlaşdırma agentləri üçün saatlarla çəkən işləri beş-üm on dəqiqəyə endirmək, müştəri xidməti üçün səs agentlərini daha sürətli cavab verən və daha səmərəli etmək istəyir.
“Əgər ChatGPT istifadə etsəniz və o saniyədə 50 token verirsə, bu hələ də bizim oxuma sürətimizdən qat-qat sürətlidir,” Puklowski TechCrunch-a deyib. “İndi agentlər arası mübadilə başlayıb—agentlər bizim adımıza oxuyur, verilənlər bazalarını yoxlayır, buna görə sürət artırılmalıdır.”
TechCrunch
Has the hunt for AI compute uncovered the next Cerebras?
Orijinal məqaləyə keç


