Gemini Deep Think-მა მათემატიკა ისწავლა და საერთაშორისო ოლიმპიადაზე ოქროს მედალი მოიპოვა

Google DeepMind-ის მოდელმა, Gemini Deep Think-მა, მათემატიკის საერთაშორისო ოლიმპიადაზე ოქროს მედალი მოიპოვა. OpenAI-სგან განსხვავებით, Google-მა ოფიციალური წესები დაიცვა და შედეგები IMO-ს მიერ დაამოწმებინა.

ივლ 24, 2025 0 5

საკითხავ სიაში დამატება

Gemini Deep Think-მა მათემატიკა ისწავლა და საერთაშორისო ოლიმპიადაზე ოქროს მედალი მოიპოვა

DeepMind-მა, OpenAI-სგან განსხვავებით, ოქროს მედლის მოსაპოვებლად IMO-ს წესები დაიცვა.

საუკეთესო ტექნოლოგიური კომპანიები გეძებენ!

ეწვიე ITJobs.ge-ს

საუკეთესო ტექნოლოგიური კომპანიები გეძებენ!

ეწვიე ITJobs.ge-ს

მათემატიკის ყოველწლიურ საერთაშორისო ოლიმპიადაში (IMO) მონაწილე სტუდენტები მსოფლიოს ყველაზე ნიჭიერ ახალგაზრდა მათემატიკოსებს წარმოადგენენ. წელს მათ ძლიერი AI მოდელების გაუმჯობესებულ არმიასთან მოუწიათ დაპირისპირება, რომელთა შორის იყო Google-ის Gemini Deep Think. კომპანიის განცხადებით, მათ საკუთარი მოდელი ადამიანების იდენტურ პირობებში გამოსცადეს და გასული წლის ისედაც სოლიდური შედეგი გააუმჯობესეს.

Google-ის თქმით, მათმა სპეციალურად მორგებულმა მათემატიკურმა AI-მ ექვსიდან ხუთი ამოცანა სწორად ამოხსნა, რაც ოქროს მედლის სტატუსისთვის საკმარისია. და, OpenAI-სგან განსხვავებით, Google-მა IMO-ს მიერ დადგენილი წესებით ითამაშა.

ახალი Gemini

Google DeepMind-ის გუნდი გასული წლის IMO-ს შეჯიბრში AlphaProof და AlphaGeometry 2 მოდელებისგან შემდგარი AI-თ მონაწილეობდა. ამ სისტემამ ექვსიდან ოთხი კითხვის სწორად ამოხსნა შეძლო, რისთვისაც ვერცხლის მედალი დაიმსახურა.

2025 წელს Google DeepMind იმ კომპანიების ჯგუფში იყო, რომლებიც IMO-სთან თანამშრომლობდნენ, რათა მათი მოდელები ოფიციალურად შეეფასებინათ და დაემოწმებინათ კოორდინატორებს. Google-ი ამ შემთხვევისთვის ახალი მოდელით მოემზადა. Gemini Deep Think მიმდინარე წლის დასაწყისში დაანონსდა, როგორც სიმულირებული მსჯელობის მოდელების უფრო ანალიტიკური ვერსია. ერთი ხაზოვანი „აზროვნების“ ნაცვლად, Deep Think პარალელურად რამდენიმე მსჯელობის პროცესს აწარმოებს, შედეგებს აერთიანებს, ადარებს და მხოლოდ ამის შემდეგ იძლევა საბოლოო პასუხს.

თანგ ლუონგის, DeepMind-ის უფროსი მეცნიერისა და IMO-ს გუნდის ხელმძღვანელის თქმით, ეს გასული წლის მცდელობასთან შედარებით პარადიგმის ცვლილებაა. 2024 წელს ექსპერტს უწევდა ბუნებრივი ენით დასმული კითხვების „დარგობრივ-სპეციფიკურ ენაზე“ თარგმნა. ახლა კი Deep Think-ი თავიდან ბოლომდე ბუნებრივ ენაზე მუშაობს და ის სპეციალურად მათემატიკისთვის არ შექმნილა.

იმისთვის, რომ Deep Think-ი IMO-სთვის მოემზადებინათ, Google-მა გამოიყენა განმტკიცებითი სწავლების ახალი ტექნიკა, მაღალი ხარისხის, „ვრცელი ამოხსნების“ გამოყენებით. ამან მოდელს უკეთესი საფუძველი მისცა იმის გასაგებად, თუ როგორ უნდა გაუმკლავდეს პასუხამდე მისასვლელ თითოეულ ნაბიჯს. „ასეთი ტიპის სწავლებით, თქვენ შეგიძლიათ, მიიღოთ მართლაც მყარი, ვრცელი ფორმის მსჯელობა,“ — ამბობს ლუონგი.

როგორც მოსალოდნელი იყო, Deep Think-ს პასუხის გენერირებისთვის უფრო მეტი დრო სჭირდება, ვიდრე Gemini-ის აპლიკაციაში ხელმისაწვდომ მარტივ ვერსიებს. თუმცა, AI-მ იგივე წესები დაიცვა, რაც ადამიანმა მონაწილეებმა — მას მიაწოდეს ამოცანების აღწერა და პასუხები 4.5-საათიან დროის ლიმიტში გასცა.

მკაცრი დამტკიცებები

AI ფირმები, როგორიცაა DeepMind, ბოლო რამდენიმე წელია IMO-თი ინტერესდებიან, რადგან ის უნიკალურ გამოწვევას წარმოადგენს. კითხვები მოითხოვს კრიტიკულ აზროვნებასა და მათემატიკის მრავალი დისციპლინის — ალგებრის, კომბინატორიკის, გეომეტრიისა და რიცხვთა თეორიის — ცოდნას.

DeepMind-ის გუნდმა ყურადღება გაამახვილა Deep Think-ის მუშაობის საინტერესო ასპექტებზე. მაგალითად, მესამე ამოცანაში ბევრმა ადამიანმა გამოიყენა მაგისტრატურის დონის კონცეფცია, დირიხლეს თეორემა. Deep Think-მა კი გააცნობიერა, რომ ამოცანის ამოხსნა უფრო მარტივი მათემატიკით იყო შესაძლებელი. „ჩვენმა მოდელმა მართლაც ბრწყინვალე დაკვირვება გააკეთა და მხოლოდ ელემენტარული რიცხვთა თეორია გამოიყენა ამოცანის სრული დამტკიცების შესაქმნელად,“ — ამბობს ჯუნიუკ იუნგი, DeepMind-ის მკვლევარი და ბრაუნის უნივერსიტეტის პროფესორი.

რაც შეეხება ერთადერთ არასწორ პასუხს, გუნდის თქმით, ეს ობიექტურად ყველაზე რთული ამოცანა იყო. იუნგი განმარტავს, რომ Deep Think-მა არასწორი ჰიპოთეზით დაიწყო მუშაობა და თავიდანვე არასწორ გზაზე დადგა. თუმცა, იუნგი აღნიშნავს, რომ ეს ამოცანა მხოლოდ ხუთმა სტუდენტმა შეძლო სწორად ამოხსნა. მიუხედავად ამისა, Google-მა 35 ქულა დააგროვა და ოქროს მედალი მოიპოვა — ამ დონეს ადამიან მონაწილეთა მხოლოდ 8% აღწევს.

Google-ი ხაზს უსვამს, რომ Deep Think-მა იგივე შეფასების პროცესი გაიარა, რასაც სტუდენტები. OpenAI-მაც გამოაცხადა IMO-ზე მიღწეული შედეგები, მაგრამ მან არ ითანამშრომლა ორგანიზაციასთან დადგენილი პროცესის დასაცავად. ამის ნაცვლად, მან IMO-ს ყოფილი მონაწილეებისგან შემდგარ პანელს შეაფასებინა თავისი პასუხები და ოქროს მედალი თვითონვე მიანიჭა საკუთარ თავს.

„ჩვენ IMO-ს ორგანიზაციასთან დავადასტურეთ, რომ ხუთი ამოცანა იდეალურად ამოვხსენით,“ — ამბობს ლუონგი. „ვფიქრობ, ვინც ეს პროცესი არ გაიარა, ჩვენ არ ვიცით, იქნებ მათ ერთი ქულა დაკარგეს და ვერცხლი მიიღეს.“

Google-ის თქმით, Deep Think-ის ეს ვერსია ამჟამად სანდო ტესტერების ჯგუფისთვის, მათ შორის მათემატიკოსებისთვის, ხდება ხელმისაწვდომი. საბოლოოდ, ეს მოდელი ხელმისაწვდომი გახდება Google AI Ultra-ს გამომწერებისთვის, რომლებიც თვეში 250 დოლარს იხდიან Google-ის ყველაზე დიდ და ძვირადღირებულ მოდელებზე წვდომისთვის.

ITNEWS-ის მეგობარი ვებ-გვერდია ITJOBS.GE. ITJOBS.GE-ზე ორგანიზაციებს და ფიზიკურ პირებს, აქვთ საშუალება განათავსონ როგორც ვაკანსიები, ტრენინგები და ივენთები ასევე კონკრეტული Tech დავალებები, რისთვისაც ეძებენ დეველოპერებს, დიზაინერებს, სეო სპეციალისტებს და ა.შ. ITJOBS.GE - იპოვე დასაქმების საუკეთესო შესაძლებლობები ან გამოაქვეყნე ვაკანსია / დავალება და მიაწვდინე ხმა სასურველ აუდიტორიას.