OpenAI və digər laboratoriyalar üçün robot təlim məlumatlarını toplayan XDOF layihəsi
OpenAI 2021-ci ildə dayandırdığı robot proqramını yenidən işə salmağı planlaşdırır. XDOF isə robotların fiziki mühitdə əməliyyatlarını öyrənmək üçün lazım olan ilkin təlim məlumatlarının toplanması və işlənməsi ilə məşğuldur.
İki həftə əvvəl OpenAI 2021-ci ildə dayandırdığı robot proqramını yenidən işə salacağını açıqladı. Bu, süni intellekt sahəsinin qabaqcıl laboratoriyalarının maşınların fiziki mühitdə funksionallığını öyrənmək yarışında olduqlarını göstərir. Ancaq bacarıqlı robotlar yaratmaq üçün süni intellekt sənayesində hələ mövcud olmayan, dil modellərində istifadə olunan təlim məlumatlarına bənzər, fiziki qarşılıqlı əlaqəni əhatə edən məlumatlar tələb olunur.
Bu ehtiyac yeni infrastruktur biznesinin yaranmasına səbəb olur. Kütləvi açıq mətndən öyrənmiş dil modellərindən fərqli olaraq, robotlar üçün fiziki qarşılıqlı əlaqələri əhatə edən və çox az mövcud olan məlumat lazımdır. YouTube videoları və müvəqqəti işçilər tərəfindən çəkilən görüntülər isə keyfiyyətcə aşağıdır və fiziki dünyaya uyğun gəlməkdə çətinlik çəkir.
XDOF (səslənir: eks-dof) bu gün rəsmi olaraq ortaya çıxır və hesab edir ki, süni intellektdə növbəti böyük problem modellər və ya çiplər yox, robotları fiziki mühitdə hərəkət etməyə öyrədən məlumatların toplanma dövrüdür.
Startap qabaqcıl laboratoriyalar və robot şirkətlərinin özlərinin rahat yaratmağa qadir olmadığı məlumat boru kəmərləri, toplanması vasitələri və annotasiya sistemlərini qurmağı hədəfləyir. Bu məqsədlə Thrive Capital, Spark Capital, a16z, Lux və WndrCo-dan 70 milyon dollar sərmayə yığıb. XDOF-un təsisçisi və icraçı direktoru Filip Vu deyir ki, şirkət artıq 60 nəfərlik heyətlə 20-dən çox müştəri, o cümlədən bir neçə qabaqcıl süni intellekt laboratoriyası ilə işləyir, amma onların adını açıqlamır.
“Bütün aparıcı laboratoriyalar robotika sahəsində fəaliyyət göstərməyə çalışır,” Vu vurğulayıb. “Dil modeli yarışlarında gecikmənin problemlərini artıq gördük... bu texnologiyanı gec öyrənmək istəməzsiniz, çünki fiziki süni intellekt növbəti sərhəddir və hər kəs bu sahədədir.”
Vu doktorantura tələbəsi olanda bu məsələyə diqqət yetirib. Onun tədqiqatı robotların böyük həcmli məlumat dəstlərindən bacarıq öyrənməsi ilə bağlı olub. Əsas problem isə belə geniş məlumatların olmaması idi.
“İşləmək üçün kifayət qədər məlumat bazamız yox idi,” Vu TechCrunch-a deyib. “Bu, yumurta-toyuq məsələsi idi — öncə məlumat toplamalı idik ki, robotika üçün ilkin modelin necə öyrədiləcəyini araşdıraq.”
Vu və gələcəkdə XDOF-un həmtəsisçisi və texniki direktoru Fred Şentu GELLO adlı aşağı maliyyətli teleoperatorlu sistem üzərində işləyirdi. Bu sistem insan operatora robot qolunu idarə edərək təlim məlumatları yaratmağa imkan verir. “Bu iş robotika sahəsində böyük nüfuza malik oldu, çünki bir çox insan oxşar problemlərlə üzləşirdi və belə məlumat toplama cihazlarından istifadə etməyə başladı,” Vu söyləyib.
Üçüncü təsisçi və baş əməliyyatlar direktoru Nemo Cin ilə birlikdə Vu oktyabr 2024-də robot modelləri üzərində işləyən şirkətlər üçün məlumat ekosistemini qurmaq məqsədi ilə XDOF-u təsis edib. Şirkət təkcə məlumat təchizatına deyil, həmçinin məlumatların təmizlənməsi, texnoloji vasitələr və annotasiya üzərində də işləyir — robotların öyrədilməsi üçün davamlı bir dövr yaratmaq üçün.
Şirkət UC Berkeley-nin süni intellekt tədqiqat laboratoriyası ilə əməkdaşlıq edir və əvvəllər akademiyada olmayan ən böyük keyfiyyətli robot təlim məlumatları kolleksiyasını — ABC-ni təqdim etməyə hazırlaşır. Bu kolleksiya 130 min robot hərəkət trayektoriyası, 300 saat simulasiya və 100 saat qiymətləndirmədən ibarətdir.
“Dil, təsvir və digər sahələrdə modellər və məlumatlar açıqlandıqda, icmanın gözlənilməz nəticələr əldə etdiyini görmüşük,” Berkeley doktorantı Devid Makallister bildirib.
Komanda artıq bu məlumatlarla robotları köynək qatlamaq, qutuları düzəltmək və AirPods simlərini qutularına yerləşdirmək kimi standart vəzifələrdə öyrədib.
Məhdudiyyətsiz hərəkət azadlığı
Şirkət məlumat piramidində üç səviyyəli işləməyi planlaşdırır. Ən dəyərli səviyyə teleoperator metoduyla robotun yerləşdirildiyi real cihazda toplanan məlumatdır; ikinci səviyyə daha ümumi məlumatları toplayan teleoperatorlu robotlardır; son səviyyə isə insan tərəfindən adi gündəlik vəzifələr zamanı toplanan “egosentrik” məlumatdır. XDOF bu mərhələdə öz geyilə bilən sensorlarını yaratmağı planlaşdırır.
“Kameranın seçimi məlumat keyfiyyətinə təsir edir — bu da əl izləmə alqoritminin performansına təsir göstərir,” Vu deyib. “Əgər avadanlıq yaxşı tərtib edilməzsə, toplanan məlumat gözlənilməz problemlər yarada bilər.”
Şirkət dünya üzrə teleoperatorlar və egosentrik məlumat operatorlarından ibarət böyük əmək qüvvəsi yaratmağı planlaşdırır. Bu, əmək tələb edən modeldir və sual yaranır: Niyə əsas laboratoriyalar özləri bu məlumat istehsalını həyata keçirmir?
“Bu məqsəd üçün yüzlərlə robot olan, yüz min kvadrat fut anbara ehtiyac var,” Vu deyir. “Robotları təmin etmək, onların fiziki parametrlərini kalibrləmək və operatorları hazırlamaq lazımdır.”
Belə infrastruktur, diqqət, kapital və əməliyyat səviyyəsi tələb edir və əksər laboratoriyalar bunu kənarlaşdırmağı üstün tuturlar. XDOF məhz burada bazar fürsəti görür.
XDOF adı robotikadakı “hərəkət azadlığı dərəcələri” terminindən götürülüb. İnsan qolunun çiyindən biləyə qədər yeddi hərəkət azadlığı var. Figure.AI şirkətinin son robotu isə 30 hərəkət azadlığına malikdir. Şirkət rəhbəri Filip Vu bildirir ki, XDOF-un adı məhdudiyyət olmadan istənilən hərəkət azadlığını ifadə edir.
TechCrunch
Collecting robot training data is dirty, unglamorous work. Some AI labs are already paying XDOF to do it
Orijinal məqaləyə keç


