Süni intellektin əsas terminləri izah olundu
Bu məqalə süni intellekt sahəsində tez-tez istifadə olunan əsas terminləri sadə və aydın şəkildə izah edir. Sözlər və anlayışlar sahənin sürətli inkişafına uyğun yenilənir.
Süni intellekt dünyanı dəyişdirir və bunun necə baş verdiyini anlamaq üçün tamamilə yeni bir dil formalaşdırır. Bir neçə dəqiqə süni intellektlə bağlı oxuduqda LLM-lər, RAG, RLHF və sahədəki mütəxəssisləri belə çaşdıra biləcək çoxsaylı digər terminlərlə qarşılaşırsınız. Bu lüğət həmin çətinliyi aradan götürmək məqsədi daşıyır. Sahə inkişaf etdikcə müntəzəm yenilənir və canlı sənəd kimi qəbul edilir.
AGI
Süni ümumi intellekt və ya AGI qeyri-müəyyən anlayışdır. Əsasən, əksər vəzifələrdə orta insandan daha bacarıqlı süni intellekti ifadə edir. "OpenAI"nin rəhbəri Sem Altman AGI-nı “ortalama insana bərabər əməkdaş kimi işə götürülə bilən” sistem kimi təsvir edib. Bu əməkdaşı işə götürə bilərsiniz. "OpenAI"nin əsasnaməsində AGI “iqtisadi baxımdan ən dəyərli işlərin çoxunda insanlardan üstün olan yüksək müstəqil sistemlər” kimi müəyyən olunur. Google DeepMind isə AGI-nı “insanların əksər əqli vəzifələrdə ən azı bərabər bacarıqlı süni intellekt” kimi qiymətləndirir. Qarışıqdır? Narahat olmayın — AI tədqiqatlarının qabaqcıl mütəxəssisləri də belədir.
Süni intellekt agenti
Süni intellekt agenti sizin adınıza müxtəlif vəzifələri yerinə yetirən alət deməkdir. Məsələn, sadə çatbotun ödəyə bilmədiyi xərclərin sənədləşdirilməsi, bilet və ya restoran masası sifarişi, hətta proqram yazmaq və onu saxlamaq. Lakin daha əvvəl izah etdiyimiz kimi, bu sahədə hələ çox dəyişən tələb olunur, buna görə “AI agent” kimi ifadə müxtəlif şəxslər üçün fərqli məna daşıyır. İmkanları tam reallaşdırmaq üçün infrastrukturlar hələ formalaşır. Əsas anlayış müstəqil sistemdir ki, müxtəlif AI-lərdən istifadə edərək çoxmərhələli tapşırıqları icra edir.
API son nöqtələri
API son nöqtələr proqram təminatının arxa tərəfində yerləşən “düymələr” kimidir. Digər proqramlar onları basaraq funksiyaları işə sala bilir. Proqramçılar bu interfeyslərdən inteqrasiya yaratmaq üçün yararlanırlar — məsələn, bir tətbiqin məlumatı başqa tətbiqdən alması və ya AI agentinin insan müdaxiləsi olmadan üçüncü tərəf xidmətlərini idarə etməsi mümkündür. Ağıllı ev cihazları və əlaqəli platformalarda bu gizli düymələr mövcuddur, adi istifadəçilər isə onlardan xəbərsizdir. AI agentləri inkişaf etdikcə təkbaşına bu son nöqtələri tapıb istifadə edə bilir, bu da avtomatlaşdırma üçün güclü və gözlənilməz imkanları yaradır.
Düşüncə zənciri
Sadə suala insan beyni çox düşünmədən cavab verir — məsələn, “zürafə yoxsa pişik hansı heyvandır daha hündür?”. Amma tez-tez düzgün cavab üçün qələm və kağız lazımdır, çünki bir sıra aralıq addımlar olur. Məsələn, təsərrüfatda toyuq və inək birlikdə 40 başı və 120 ayağı varsa, düzgün cavab üçün sadə tənlik yazmaq lazım gəlir (20 toyuq, 20 inək).
AI-də düşüncə zənciri böyük dil modelləri üçün məsələnin kiçik mərhələlərə bölünərək məntiqi nəticənin yaxşılaşdırılmasıdır. Cavab almaq daha çox vaxt aparır, lakin xüsusilə məntiq və kodlaşdırmada daha doğru olar. Bu model ənənəvi LLM-lərdən yaranıb və möhkəmləndirmə təlimi ilə düşüncə zənciri üçün optimallaşdırılıb.
(Bax: Böyük dil modeli )
Kodlaşdırma agentləri
Bu, "AI agenti" anlayışının spesifik formasıdır; öz məqsədini mərhələlərlə yerinə yetirən proqram deməkdir. Kodlaşdırma agenti proqram təminatı inkişafına tətbiq olunur. İnsan üçün kod təklif etmək əvəzinə, avtonom şəkildə kod yazır, test edir və səhvləri düzəldir. Bu, proqramçıların gün ərzində etdiyi iterativ işə bərabər hesab olunur. Agentlər kod bazasının hamısını idarə edir, səhvləri tapır, testlər keçirir və minimum insan nəzarəti ilə düzəlişlər edir. Belə təsəvvür edin ki, çox sürətli və daim diqqətli stajyor tutmusunuz, amma işin nəticəsi yenə insan tərəfindən yoxlanmalıdır.
Hesablama
Çoxmənalı termindir, amma əsasən süni intellekt modellərinin işləməsini təmin edən hesablama gücü ni bildirir. Bu proses süni intellekt sənayesini qüvvətləndirir və güclü modellərin hazırlanması və istifadəsini mümkün edir. Term tez-tez hesablama gücünü verən aparat hissələri — GPU, CPU, TPU və digər infrastruktur növləri — üçün işlədir.
Dərin öyrənmə
Özünü təkmilləşdirən maşın öyrənməsinin alt sahəsidir və çox təbəqəli süni neyron şəbəkəsindən ibarətdir. Bu, sadə maşın öyrənmə metodlarından — xətti modellərdən və qərar ağaclarından — daha mürəkkəb əlaqələr qurmağa imkan verir. Dərin öyrənmənin strukturu insan beynində neyronların bir-birinə bağlı yollarından ilhamlanıb.
Dərin öyrənmə modelləri mühəndislərin xüsusiyyətləri müəyyən etməsini tələb etmədən məlumatdan vacib elementləri aşkar edir. Onlar səhvlərdən öyrənir, təkrarlayır və nəticələri yaxşılaşdırır. Amma milyonlarla məlumat nöqtəsi tələb etdiyinə görə təlim vaxtı və xərcləri yüksək olur.
(Bax: Neyron şəbəkəsi )
Diffuziya
Diffuziya süni intellektin sənət, musiqi və mətn yaradıcısı modellərinin əsas texnologiyasıdır. Fizikadan ilhamlanmış diffuziya sistemləri məlumatın strukturunu tədricən “dağıdır” — şəkillər, mahnılar və s., səs-küy əlavə etməklə, heç nə qalmayana qədər. Fizikada diffuziya qeyri-geri dönəndir — məsələn, qəhvədə şəkər kub formasına qayıda bilməz. Amma AI-də diffuziya sistemləri dağıtılmış məlumatı bərpa etmək üçün “əks diffuziya” prosesini öyrənir, səs-küydən məlumatı bərpa qabiliyyəti qazanır.
Distillə (süzmə)
Distillə böyük AI modelindən “müəllim-tələbə” modeli ilə bilik çıxarmadır. İnkişafçılar müəllim modelinə sorğu göndərir və cavabları qeyd edir. Bəzən dəqiqlik üçün verilənlər bazası ilə müqayisə edilir. Bu cavablarla tələbə modeli müəllim davranışını təqlid edir.
Distillə böyük model əsasında kiçik və effektiv model yaratmağa imkan verir, minimal itki ilə. Məsələn, OpenAI GPT-4 Turbo modelini belə yarada bilər. Bütün AI şirkətləri distillədən istifadə edir, bəzi rəqib şirkətlər isə bu üsulla qabaqcıl modellərə çatmış ola bilərlər. Rəqibdən alınan distillə AI API və çat köməkçilərinin istifadə qaydalarının pozulmasıdır.
Fincəl düzəlişi
Bu, AI modelinin müəyyən vəzifə və ya sahə üzrə daha yaxşı nəticə göstərməsi üçün əlavə təlimidir. Adətən sahə-spesifik məlumatların əlavə olunması ilə həyata keçirilir.
Bir çox AI startapları böyük dil modellərini bazanın başlanğıcı hesab edir və öz sahələrinə uyğunlaşdırmaq üçün fincəl düzəlişi ilə təkmilləşdirirlər.
(Bax: Böyük dil modeli [LLM] )
GAN
Generative Adversarial Network (GAN) reallaşmaya yaxın məlumat yaratmaq üçün istifadə olunan maşın öyrənmə üsuludur. İki neyron şəbəkəsi birlikdə işləyir: biri məlumat yaradır, digəri isə bu məlumatın süni olduğunu aşkar etməyə çalışır. Onlar bir-biri ilə rəqabət içindədilər. GAN-lər insan müdaxiləsi olmadan məhsulları real görünməyə optimallaşdırır. Ən yaxşı dar tətbiqlər üçündür, məsələn, realist foto və video yaradıcılığı, ümumi məqsədli AI üçün deyil.
Halüsinasiya
AI modellərinin yalnış və ya düz olmayan məlumat yaratmasını bildirən termindir. Bu, AI keyfiyyəti üçün ciddi problemdir.
Halüsinasiya nəticələri yanıltıcı ola, real həyatda risk və təhlükələr yarada bilər — məsələn, səhv tibbi məsləhət verə bilər. Bu problem təlim verilən məlumatın boşluqları ilə bağlıdır. Bu səbəbdən ixtisaslaşmış və sahə-spesifik AI modelləri hazırlanır ki, yanlış məlumat riski azalsın.
İnferensiya
İnferensiya AI modelinin işə salınmasıdır. Bu proses modelə əvvəl öyrəndiyi məlumatlardan nəticə çıxarmağa imkan verir. Təlim olmadan inferensiya mümkün deyil; model əvvəl analiz etməlidir ki, nəticə versin.
İnferensiya müxtəlif aparatlarda — smartfon prosessorlarından tutmuş güclü GPU-lar və AI sürətləndiricilərinə qədər — həyata keçirilə bilər. Böyük modelləri noutbukda işlətmək uzun çəkər, amma yüksək səviyyəli AI çipləri olan bulud serveri asanlıqla idarə edir.
(Bax: Təlim )
Böyük dil modeli (LLM)
Böyük dil modelləri məşhur AI köməkçilərində istifadə olunur, məsələn, ChatGPT, Claude, Google-un Gemini, Meta-nın AI Llama, Microsoft Copilot, və Mistralın Le Chat. AI köməkçilə söhbətdə sorğunuz birbaşa böyük dil modeli tərəfindən qarşılanır, həmçinin veb axtarış və kod tərcüməçiləri kimi vasitələrdən istifadə olunur.
LLM-lər milyardlarla ədədi parametrdən ibarət dərin neyron şəbəkəsidir, sözlər və ifadələr arasındakı əlaqələri öyrənir, dili çoxölçülü xəritə kimi təsvir edir. Milyardlarla kitab, məqalə və transkriptdəki nümunələr üzərində təlim alır. Sorğu verildikdə ən uyğun ehtimallı cavab generasiya olunur.
(Bax: Neyron şəbəkəsi, yaddaş keş)
Yaddaş keş
İnferensiyanı, yəni istifadəçinin sorğusuna cavab yaratma prosesini sürətləndirən vasitədir. Keş yaddaş optimallaşdırması inferensiyanın effektivliyini artırır. AI yüksək riyazi hesablama tələb edir və hər dəfə hesablama yeni enerji sərf edir. Keş bəzi hesablamaları gələcək sorğular üçün saxlayaraq ümumi enerji və vaxt sərfini azaldır. Müxtəlif yaddaş keş növləri var, ən çox tanınan KV (açar-dəyər) keşidir. KV keş transformer əsaslı modellərdə cavabı sürətləndirir və vaxtı azaldır.
Neyron şəbəkəsi
Dərin öyrənmə və böyük dil modellərinin əsasını təşkil edən çox təbəqəli alqoritmik quruluşdur. İnsan beynində neyronların bir-birinə sıx bağlı yollarından ilhamlanır. 1940-cı illərdən gələn fikir olsa da, böyük sürətlə inkişafı GPU-ların videoyayın sənayesinə girməsindən sonra başladı. Neyron şəbəkə AI sistemləri səs tanıma, müstəqil gəzişmə və dərman kəşfi kimi sahələrdə böyük uğurlar qazandı.
(Bax: Böyük dil modeli [LLM], Açıq mənbə)
Açıq mənbə proqram təminatı
Bu, kodun hər kəsin istifadəsinə, yoxlanılmasına və dəyişdirilməsinə açıq olması deməkdir. Süni intellektdə buna Meta-nın Llama modeli nümunədir, əməliyyat sistemində Linux buna paraleldir. Açıq mənbə tədqiqatçıların, tərtibatçıların və şirkətlərin bir-birinin işinə əsaslanaraq sürətli inkişafına və müstəqil təhlükəsizlik yoxlamalarına imkan verir. Bağlı mənbədə isə kod gizlidir, məhsul istifadə olunur, amma onun necə işlədiyini görmək mümkün deyil; məsələn, OpenAI-nin GPT modelləri belədir. Bu, AI sənayesində əsas müzakirə mövzusudur.
TechCrunch
So you’ve heard these AI terms and nodded along; let’s fix that
Orijinal məqaləyə keç


