2023 წლის AI ქსელის ინოვაციების კონფერენცია, რომელიც გაიმართა პეკინის ინტელექტუალური ქსელის მოდელში BBS, ZTE საკაბელო პროდუქტების მოდელის უფროსი არქიტექტორი Ji'an-Guo Lu შექმნა სიბრძნის ქსელი ახალი ერა: დიდი მოდელი მართავს ZTE- ს თემის მომავალს ZTE– ს თემის მომავალი, რომელიც ახდენს კორპუსის ხარისხის გაუმჯობესებას და Digital ტყუპის მონაცემთა ციკლის გამოყენებას.
ლუ ჯიანგუომ თქვა, რომ მრავალი ძირითადი ტექნოლოგია, როგორიცაა AI ჩართვა, ციფრული ტყუპი და განზრახვა, ხელს შეუწყობს თვით-ინტელექტის ქსელის დაზვერვის დონეს L4- დან L5- მდე და თვით-ინტელექტის ქსელს გააგრძელებს განმეორება და განვითარებადი თვითგამორკვევის დასრულების მიზნით. ამ საკვანძო ტექნოლოგიებს შორის, AI არის ყველაზე მნიშვნელოვანი ძრავა, ხოლო დიდი მოდელები არის AI ტექნოლოგიის გასაღები.
იმის შესახებ, თუ როგორ უნდა გამოიყენოთ დიდი მოდელი თვითშეფასების ქსელში, ლუ ჯიანგუომ გააცნო, რომ დიდ მოდელს აქვს სუპერ თაობის უნარი და შეუძლია სწრაფად წარმოქმნას დიდი რაოდენობის სქემები. ინტელექტუალური ქსელის ოპერაციებისთვის ასეთი საჭიროა ოპერაციული ნაბიჯების დიდი რაოდენობის განხორციელება, რაც ექვემდებარება მაღალ განზომილებიან სივრცეში, რომ იპოვოთ ოპტიმალური გადაწყვეტა, ყველა შესაძლო პროცესისთვის მითითებული ხსნარი, ზოგადი გადაწყვეტილებების დიდი მოდელი, როგორიცაა NP (არა პოლინომიური) პრობლემა, დიდი რაოდენობით ნიმუშები, შეფასება, ოპტიმიზაცია, განმეორება შეუძლია ეფექტურად შეუდგეს ოპტიმალურ გადაწყვეტას. ამასთან, მიუხედავად იმისა, რომ დიდი მოდელები წარმოქმნიან ბევრ სქემას, ძნელია იმის უზრუნველყოფა, რომ ეს სქემები სასარგებლოა. მიუხედავად იმისა, რომ დიდ მოდელებს აქვთ გარკვეული აზროვნების უნარი, მათ მაინც სჭირდებათ ადამიანის ჩარევა რთული ლოგიკის მოგვარებისას. ამ პრობლემის გადასაჭრელად, ZTE გვთავაზობს ექსპერტიზის გამოცდილების ინტეგრირებას მოდელის დამატებითი წინასწარი ტრენინგის პროცესში და მოდელის სრულყოფილი დარეგულირების პროცესში, დახურული მარყუჟის გამეორების შესაქმნელად. ამ გზით შეიძლება განხორციელდეს სახელმძღვანელო უკუკავშირის გამაგრების სწავლა ხელსაწყოს გამაგრების გამაგრების სწავლისთვის, რომელსაც შეუძლია ეფექტურად გამოიყენოს ერთი მხრივ დიდი მოდელების წარმოქმნის სიმძლავრე, ხოლო მეორეს მხრივ, უზრუნველყოს, რომ წარმოქმნილი დიაგნოსტიკური სქემა ზუსტი და საიმედოა. ამ სქემაში, ეს არის საკვანძო ბმული, რომ შექმნას ოპერაციისა და შენარჩუნების ცოდნის რუქა, ცოდნის ინჟინერიასთან ერთად. მონაცემთა Flywheel სქემის წარმოქმნა ემყარება ოპერაციისა და შენარჩუნების ცოდნის რუქას, რათა თავიდან აიცილოს მოდელის ილუზია და უზრუნველყოს თაობის სქემის საიმედოობა და სიზუსტე. ამ ცოდნის გრაფიკზე დაფუძნებულმა მიდგომამ შეიძლება უკეთესად ინტეგრირდეს ექსპერტიზის გამოცდილება და მოდელის წარმოქმნის შესაძლებლობები, უფრო საიმედო გადაწყვეტილებების მისაღებად.
დიდი მოდელის განაცხადის ლოგიკის დიზაინისთვის, ლუ ჯიანგუომ შემდგომში გააცნო, რომ ZTE მიიღებს მოდელის ორიენტირებული დახურული მარყუჟის მეთოდს სწრაფი ინჟინერიის საფუძველზე. დიზაინის არსი არის ადამიანის ენის სტრუქტურირებული გამოხატვის (სწრაფი შაბლონის), როგორც შეყვანის, წარმოქმნის სტრუქტურირებული გამომავალი (მოწყობის სქემა) დიდი მოდელის საშუალებით და საბოლოოდ აერთიანებს განაცხადის ჩარჩოს ინტერაქტიული შესრულებას. ზემოაღნიშნული ლოგიკის გასაცნობად, ZTE შექმნის ტექნიკურ პრეპარატებს მრავალი ასპექტისგან, მაგალითად, მრავალ მოდალური შესაძლებლობების ევოლუცია, კორპუსის მომზადება, რესურსების ურთიერთობის ცოდნის ცოდნის ინექცია, ატომური API კორპუსის რეზერვი / ატომური API შესაძლებლობების რეზერვი, ხელოვნური სიმულაციის ხარვეზების გარემო, ციფრული ტყუპი ავტომატური სიმულაციური გარემო და ხელსაწყოების მომზადება.
ლუ ჯიანგუომ საბოლოოდ თქვა, რომ დიდი მოდელის მთავარი ღირებულება მდგომარეობს მისი წარმოშობის უნარში, ანუ მას შეუძლია წარმოქმნას ინოვაცია არსებული ცოდნის შერწყმით. ამასთან, ამ საგანგებო შესაძლებლობების რეალიზაცია დამოკიდებულია მონაცემთა მაღალი ხარისხის წარმოებაზე, მიღებაზე და ნალექებზე. მონაცემთა სათნო ციკლი არის განმსაზღვრელი ფაქტორი.
პოსტის დრო: ნოემბერი -20-2023