OpenAI-მ მათემატიკის საერთაშორისო ოლიმპიადაზე ოქროს მედლის აღების შესახებ ნაადრევად გამოაცხადა

OpenAI-ს განცხადებით, მათმა ახალმა AI მოდელმა მათემატიკის საერთაშორისო ოლიმპიადაზე ოქროს მედალი მოიპოვა, თუმცა ნაადრევმა განცხადებამ და თვითშეფასების პროცესმა საზოგადოებაში კითხვები გააჩინა.

OpenAI-მ მათემატიკის საერთაშორისო ოლიმპიადაზე ოქროს მედლის აღების შესახებ ნაადრევად გამოაცხადა

გასულ შაბათს, OpenAI-ს მკვლევარმა ალექსანდერ ვეიმ განაცხადა, რომ კომპანიის ახალმა ექსპერიმენტულმა AI მოდელმა მათემატიკის საერთაშორისო ოლიმპიადაზე (IMO) ოქროს მედლის დონის შედეგი აჩვენა — სტანდარტი, რომელსაც ყოველწლიურად მონაწილეთა 9%-ზე ნაკლები აღწევს. თუმცა, განცხადება IMO-ს ორგანიზატორების მიერ დაწესებული ემბარგოს დარღვევით გაკეთდა, რომელიც AI კომპანიებს სთხოვდა, შედეგების გამოქვეყნებისგან 28 ივლისამდე შეეკავებინათ თავი.

საუკეთესო ტექნოლოგიური კომპანიები გეძებენ!
ეწვიე ITJobs.ge-ს
საუკეთესო ტექნოლოგიური კომპანიები გეძებენ!
ეწვიე ITJobs.ge-ს

გავრცელებული ინფორმაციით, ექსპერიმენტულმა მოდელმა ოლიმპიადის ექვსი, დამტკიცებაზე დაფუძნებული ამოცანა იგივე პირობებში გადაჭრა, როგორშიც ადამიანები: 4.5 საათი თითო სესიაზე, ინტერნეტისა და კალკულატორების გარეშე. თუმცა, რამდენიმე წყარო, რომლებიც პროცესს იცნობენ, ამბობს, რომ ვინაიდან OpenAI-მ საკუთარი შედეგები თვითონვე შეაფასა, კომპანიის განცხადების ლეგიტიმურობა, შესაძლოა, კითხვის ნიშნის ქვეშ დადგეს. OpenAI გეგმავს, ამოხსნები და შეფასების კრიტერიუმები საჯარო განხილვისთვის გამოაქვეყნოს.

OpenAI-ს თქმით, მათი მიღწევა განსხვავდება წინა მცდელობებისგან, რომლებიც ეყრდნობოდა სპეციალიზებულ, მათემატიკური თეორემების დამამტკიცებელ სისტემებს. კომპანიის განცხადებით, მათმა მოდელმა ამოცანები ჩვეულებრივ ტექსტად დაამუშავა და ბუნებრივ ენაზე დაწერილი ამოხსნები წარმოადგინა, რითაც ის უფრო ზოგადი დანიშნულების ენობრივ მოდელად მუშაობდა, ვიდრე სპეციალურად მათემატიკისთვის შექმნილ სისტემად.

„მათემატიკა ლოგიკური აზროვნების დასამტკიცებელი ველია — ის სტრუქტურირებული, მკაცრი და ძნელად გასაყალბებელია,“ — ნათქვამია კომპანიის განცხადებაში. „ეს აჩვენებს, რომ ზოგადი დანიშნულების მეთოდებს ახლა შეუძლიათ, აჯობონ ხელით მორგებულ სისტემებს ამოცანებში, რომლებიც დიდი ხნის განმავლობაში მიუწვდომლად ითვლებოდა.“

მიუხედავად იმისა, რომ კომპანიამ დაადასტურა, რომ მათი შემდეგი დიდი მოდელი, GPT-5, „მალე გამოვა“, მათ განმარტეს, რომ ეს მიღწევა ექსპერიმენტულ მოდელს ეკუთვნის. „ამ დონის შესაძლებლობების მქონე მოდელი უახლოეს მომავალში არ გამოვა,“ — აცხადებს OpenAI. სავარაუდოდ, ამ კონკრეტული ექსპერიმენტისთვის კომპანიას უზარმაზარი გამოთვლითი რესურსების (და, შესაბამისად, დიდი ხარჯების) გაღება დასჭირდა.

ნაადრევი განცხადება და საზოგადოების რეაქცია

გარდა იმისა, რომ შედეგების თვითშეფასებამ კითხვები გააჩინა, OpenAI-მ IMO-ს საზოგადოება იმითაც გააღიზიანა, რომ შაბათის განცხადებით დაარღვია მათემატიკის საერთაშორისო ოლიმპიადის ემბარგო. Harmonic-მა, კიდევ ერთმა AI კომპანიამ, რომელიც შეჯიბრში მონაწილეობდა, 20 ივლისს X-ზე დაწერა, რომ „IMO-ს საბჭომ გვთხოვა, სხვა წამყვან AI კომპანიებთან ერთად, შედეგების გამოქვეყნებისგან 28 ივლისამდე შეგვეკავებინა თავი.“

ნაადრევმა განცხადებამ აიძულა Google DeepMind-ი, რომელსაც საკუთარი შედეგები შეთანხმებული თარიღისთვის ჰქონდა გამზადებული, თავისი განცხადება ორშაბათს, 22 ივლისს, გამოექვეყნებინა.

გაურკვევლობა, როგორც ჩანს, IMO-ს შეჯიბრის სხვადასხვა ფორმატიდან მომდინარეობს. მაშინ, როცა ზოგიერთი AI კომპანია უშუალოდ IMO-ს საბჭოსთან თანამშრომლობდა, OpenAI დამოუკიდებლად მოქმედებდა — მან მიიღო ამოცანები, მაგრამ არ მონაწილეობდა ფორმალურ საკოორდინაციო პროცესში, რომელიც 28 ივლისის ემბარგოსაც მოიცავდა.

OpenAI-ს მკვლევარმა ნოამ ბრაუნმა განცხადების დრო X-ზე დაიცვა და თქვა, რომ კომპანია „არ იყო კავშირში IMO-სთან“ და გამოქვეყნებამდე მხოლოდ ერთ ორგანიზატორს ესაუბრა. მისი თქმით, მათ დახურვის ცერემონიამდე მოიცადეს და „არავის უთხოვია, რომ განცხადება უფრო გვიან გაგვეკეთებინა“.

თუმცა, IMO-ს კოორდინატორმა განაცხადა, რომ OpenAI-მ შედეგები დახურვის ცერემონიამდე გამოაქვეყნა, რაც ბრაუნის განცხადებას ეწინააღმდეგება. კოორდინატორმა OpenAI-ს ქმედებებს „უხეში და შეუფერებელი“ უწოდა.

Google-ის საპასუხო სვლა: ოფიციალურად დადასტურებული ოქრო

OpenAI-ს განცხადების შემდეგ, ორშაბათს, Google DeepMind-მა საკუთარი შედეგები გამოაქვეყნა და ასევე განაცხადა ოქროს მედლის დონის შედეგზე — მათმა მოდელმა Gemini Deep Think-მა ექვსიდან ხუთი ამოცანა ამოხსნა.

OpenAI-სგან განსხვავებით, Google უშუალოდ IMO-ს ორგანიზატორებთან მუშაობდა და მისი შედეგები ოფიციალურად შეფასდა და დამოწმდა IMO-ს კოორდინატორების მიერ. Google-ი გეგმავდა 28 ივლისის ემბარგოს დაცვას, მაგრამ OpenAI-ს ნაადრევი განცხადების გამო, შედეგები ადრე გამოაქვეყნა.

DeepMind-ის უფროსმა მეცნიერმა, თანგ ლუონგმა, Ars Technica-ს განუცხადა: „ჩვენ IMO-ს ორგანიზაციასთან დავადასტურეთ, რომ ხუთი ამოცანა იდეალურად ამოვხსენით. ვფიქრობ, ვინც ეს პროცესი არ გაიარა, ჩვენ არ ვიცით, იქნებ მათ ერთი ქულა დაკარგეს და ვერცხლი მიიღეს.“

რა არის მათემატიკის საერთაშორისო ოლიმპიადა?

მათემატიკის საერთაშორისო ოლიმპიადა 1959 წლიდან ტარდება და მათემატიკური აზროვნების ერთ-ერთ ყველაზე რთულ გამოცდას წარმოადგენს. 100-ზე მეტი ქვეყანა აგზავნის ექვს მონაწილეს, რომლებიც ორ, 4.5-საათიან სესიაზე ექვს, დამტკიცებაზე დაფუძნებულ ამოცანას ხსნიან. ამოცანები, როგორც წესი, მოითხოვს ღრმა მათემატიკურ ინტუიციასა და კრეატიულობას და არა უბრალოდ გამოთვლით ძალას.

მაგალითად, 2025 წლის ერთ-ერთი ამოცანა სტუდენტებს სთხოვდა, დაემტკიცებინათ, რომ სამკუთხა ბადეზე წერტილების დასაფარად გამოყენებულ ხაზებს შორის, ე.წ. „მზიანი“ ხაზების (რომლებიც არც ჰორიზონტალურია, არც ვერტიკალური და არც 45°-იანი დიაგონალური) რაოდენობა ყოველთვის შეიძლება იყოს მხოლოდ 0, 1 ან 3 — და არასდროს 2, 4 ან სხვა რომელიმე რიცხვი.

OpenAI-ს შედეგებმა გააკვირვა პროგნოზების ბაზრები, რომლებიც 2025 წლისთვის ნებისმიერი AI სისტემის მიერ IMO-ს ოქროს მედლის მოპოვებას დაახლოებით 18%-იან ალბათობას ანიჭებდნენ.

ITNEWS-ის მეგობარი ვებ-გვერდია ITJOBS.GE. ITJOBS.GE-ზე ორგანიზაციებს და ფიზიკურ პირებს, აქვთ საშუალება განათავსონ როგორც ვაკანსიები, ტრენინგები და ივენთები ასევე კონკრეტული Tech დავალებები, რისთვისაც ეძებენ დეველოპერებს, დიზაინერებს, სეო სპეციალისტებს და ა.შ. ITJOBS.GE - იპოვე დასაქმების საუკეთესო შესაძლებლობები ან გამოაქვეყნე ვაკანსია / დავალება და მიაწვდინე ხმა სასურველ აუდიტორიას.

გაზიარება

როგორია თქვენი რეაქცია?

მოწონება მოწონება 0
არ მომწონს არ მომწონს 0
სიყვარული სიყვარული 0
სასაცილო სასაცილო 0
გაბრაზებული გაბრაზებული 0
მოწყენილი მოწყენილი 0
ვაუ ვაუ 0