Texnologiya şirkətləri daha ucuz süni intellekt modellərinə keçməyə hazırdır?
Süni intellekt sahəsində xərclərin artması istifadəçiləri daha kiçik və sərfəli modellərə yönləndirir. Coinbase-in həmtəsisçisi Brian Armstrong ənənəvi böyük modellərin azalacağını, daha ucuz olanların isə dominant olacağını proqnozlaşdırır.
Süni intellekt inqilabı əsasən belə bir fərziyyəyə əsaslanıb: daha böyük modellər daha güclüdür və ən güclü modellər üstünlük qazanır. İndi isə sənaye bu fərziyyənin pozulmasının nəticəsini görməyə başlayır.
Artan xərclər artıq istifadəçilərdə daha kiçik və ucuz modellərə yenidən baxmaq məcburiyyəti yaradıb. Bu yeni xərc-şüurlu seçim hələ sənayedə necə təsir göstərəcəyi məlum deyil, lakin təsiri əhəmiyyətli ola bilər.
Coinbase-in həmtəsisçisi Brian Armstrong-un ən yaxşı şəkildə ifadə etdiyi proqnoza görə, yaxın 12-18 ay ərzində işlərin 80 faizi 99 faiz ucuz olan modellərdə həyata keçiriləcək.
Armstrong X platformasında yazır: “Zəkaya olan tələbat demək olar ki, sonsuzdur, lakin işlərin 80 faizi 12-18 ay ərzində 99 faiz ucuz modellərdə işləyəcək. 20 faizi isə ən son nəsil modellərdə qalacaq, burada maksimum zəka səviyyəsi vacibdir.”
Bu dəyişiklik əgər doğru olsa, süni intellekt sahəsində əhəmiyyətli dəyişiklik olacaq. İndiyədək əksər AI şirkətləri keyfiyyətə əsaslanaraq ən qabaqcıl modelə üstünlük verirdilər. Əgər daha ucuz modellər keyfiyyətə təsir etmir və eyni işi görə bilirsə, bu, süni intellekt iqtisadiyyatında böyük dönüş nöqtəsi olar. Azad olunacaq böyük qənaət isə əsasən böyük laboratoriyalarla bağlıdır və bu, OpenAI və Anthropic kimi şirkətlərin IPO mərhələsində iqtisadi zərbə ola bilər.
Bu proses sənayedə əsas sualdır: şirkətlər kiçik modellərə keçməyə hazırdırmı?
İlkin testlər göstərir ki, düzgün təyin olunmuş vaxtda ucuz modellər keyfiyyətə hər hansı mənfi təsir olmadan istifadə oluna bilər. Hüquq sahəsində AI aləti olan Harvey-nin apardığı son testdə, məhsulun keyfiyyəti qorunub saxlanaraq xərclər 3 dəfə azaltdı. Bu test, Fireworks AI platforması ilə ortaq aparılıb və Claude Opus ilə Fireworks’ün GLM 5.1 modulunun kombinasiyasından ibarət olub. Daha intensiv tapşırıqlar üçün Opus-moduluna keçərək server vaxtı və ümumi xərc xeyli azaldılıb.
Harvey-nin həmtəsisçisi Gabe Pereyra TechCrunch-a deyib: “Keyfiyyət hər zaman prioritetdir, xüsusilə hüquq sahəsində. Lakin indiki keyfiyyət anlayışı dəyişir – artıq ən güclü modeli seçmək deyil, ən düzgün cavabı ən səmərəli şəkildə verən modeli istifadə etməkdir.”
Bu tendensiya əsasən böyük laboratoriyalarla Çin modelləri və ya açıq çəki modelləri arasında qarşıdurmadan bəhs olunur, lakin əsas fərq özəl və açıq modellər arasında deyil, böyük və kiçik modellər arasındadır. Məsələn, GPT-5.5 modelindən DeepSeek-in V4 Flash modelinə keçmək qənaətlidirsə, GPT-5.4-mini modelinə keçmək də eyni effekti verə bilər.
Böyük laboratoriyalar tərəfindən təqdim olunan daxili hesablama ilə müstəqil açıq çəki modelləri arasında aktiv qiymət savaşı gedir, lakin kiçik model və böyük model rəqabətində hansı növ kiçik modelin qalib gəlməsi o qədər də önəmli deyil.
Bütün bunlar gözlənilən haldır – lazım olmayan hesablamalar istifadə edilməməlidir. Lakin bu, indiyədək sənayedə dominant olan miqyaslandırma yanaşmasına ziddir. İnvestorların subsidiyalarını aldığı müddətdə müştərilər ən yüksək texnologiyaya üstünlük verirdilər.
Tokan qiymətlərinin artması və subsidiyaların azalması ilə istifadəçilər ilk dəfə xərclərin təzyiqi ilə üzləşir. Bu yeni təzyiq kiçik modellərə keçidi sürətləndirə bilər, ya da istifadəçilər daha az zəng etmək, kontekstdən qənaətlə istifadə etmək və ya ən az perspektivli tətbiqlərdən imtina etmək yolu ilə xərcləri azalda bilər.
Amma əgər əksər tətbiqlər kiçik modellərlə eyni dərəcədə işləyə bilirsə, bu, hesablamaların həcmi üzərində böyük təsir göstərə və qabaqcıl modellərin təlim xərclərini əsaslandırmaqla bağlı yeni suallar ortaya çıxara bilər.



