ხელოვნური ინტელექტით მალე რეკლამებს „გადაიღებთ“ - ვიდეო რევოლუცია სახელად Sora / სორა
Sora / სორა - ეს კიდევ ერთი რევოლუციური პროდუქტია OpenAI-ისგან, რომლის შესახებაც ინფორმაცია 2024 წლის 15 თებერვალს ოფიციალურად გამოქვეყნდა. Sora წარმოადგენს ხელოვნური ინტელექტის დიფუზურ მოდელს რომელიც ქმნის რეალისტურ, შემოქმედებით სცენებს ტექსტური ინსტრუქციის ანუ პრომპტების საშუალებით.
მარტივად რომ ვთქვათ, სორა არის Text-to-Video კრეატორი, რომელსაც შეძლებთ მიწეროთ როგორი ვიდეოს შექმნა გსურთ, ის კი რამდეინიმე წუთში თქვენ ფანტაზიას ვიდეოდ გარდასახავს. მაგარია არა 😎!? ალბათ ახლა უმრავი კითხვა გაქვთ, ვეცდებით ზოგიერთ მათგანს ვუპასუხოთ წინამდებერე ბლოგში, მანამდე კი დატკბით ხელოვნური ინტელექტის მიერ შექმნილი რამდენიმე ნიმუშით, რომელიც წარმოდგენელია OpenAI-ის ოფიციალური პრეზენტაციიდან.
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
Prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.
Prompt: A young man at his 20s is sitting on a piece of cloud in the sky, reading a book.
რა შეუძლია OpenAI-ის ვიდეო კრეატორ ხელოვნურ ინტელექტს, - სორას (Sora)?
გარდა იმისა, რომ სორას შეუძლია ვიდეოს გენერირება მხოლოდ ტექსტური ინსტრუქციებიდან ასევე შეუძლია "გადაიღოს ვიდეო" თქვენ მიერ ატვირთული ჩვეულებრივი სურათიდან და შექმნას მისგან 1 წუთამდე ვიდეო. გასაცორია ის ფაქტიც, რომ თქვენი სურათის მიხედვით შექმნილ ვიდეოში, ხელოვნური ინტელექტი "ხვდება" სურათზე გამოსახული ობიექტის არსს და მის მცირე დეტალებსაც კი ითვალისწინებს.
Sora-ს ვიდეოების შექმნისას "იაზრებს" ადამიანების ბაზისურ ემოციებსაც კი, რასაც რეალისტურ და საუცხოო შედეგამდე მივყავართ. სორას ასევე შეუძლია დაამუშაოს თქვენ მიერ მიწოდებული ვიდეო და გააუმჯობესოს ის, ან შეავსოს დაკარგული კადრები, რამაც შესაძლოა დამატებით დრო და ფინანსური რესურსი დაგვიზოგოს.
რა არ შეუძლია სორას?
ამ მომენტისთვის (21/02/2024) Sora-ს აქვს გარკვეული სისუსტეები. ის კარგად ვერ აღიქვამს კომპლექსურ და ინტერაქციულ სცენებს, მაგალითად:
ბავშვმა ჩაკბიჩა შოკოლადი, მაგრამ მომდევნო კადრში შოკოლადი კვლავ მთლიანი ჩანს.
ბურთის ხტუნაობის ტრაექტორია, დავუშვათ ის ხვდება კედელს და შემდეგ ადამიანს, ბუნებრივია უკუქმედება ბურთზე მნიშვნელოვანად განსხვავებული იქნება, თუმცა ჩვენი ხელოვნური ინტელექტი ჯერ-ჯეროებით მხოლოდ სწავლობს მე-6 კლასის ფიზიკის (მექანიკის) კანონებს.
როგორ გამოვიყენო Sora?
ჯერ-ჯერობით სორა საჯაროდ არ არის ხელმისაწვდომი. თუმცა, OpenAI-მ გამოაქვეყნა ნიმუშები და უზრუნველყო წვდომა Red teamer-ებსა და შერჩეულ კონტენტ კრეატორებთან. ჩვენც მოუთმენლად ველოდებით Sora-ს გატესტვას და მის პრაქტიკაში გამოყენებას, თვალი ადევნეთ ჩვენ ბლოგს და აუცლიებლად გამცნობთ ამის შესახებ, ასევე პრაქტიკულ, სასარგებლო რჩევებსაც გაგიზიარებთ.
რა ეღირება Sora-ს მომსახურება?
რთული სათქმალია, რადგან ჯერ-ჯერობით მის შესახებ ოფიციალური ინფორმაცია არ არსებობს. თუმცა ცნობლია, რომ ის ეფუძნება OpenAI GPT4-ს და DALL·E 3 -ს. Sora შესრულებულ საქმეს ნაცვლად ტოკენებისა (Token) დაითვლის Patche -ებით, ეს არის ვიდეოებში წარმოდგენილი გამოსახაულების უმცირესი ერთეული, რომელსაც OpenAI ითვლის. ის თავისი არსით ძალიან ჰგავს Token-ებს.
Sora იყენებს DALL·E 3 -ის მიდგომებს, ამიტომ მოდით ვცადოთ დავთვალოთ რა გამოვა ამ შემთხვევაში გენერირებული ვიდეოს ფასი.
იმ საფასო პოლიტიკის გათვალისწინებით რაც Image model DALL·E 3-ს აქვს (იხ. სქრინშოთი), თუ გვსურს 1 წუთიანი HD ან Full HD ვიდეოს გენერაცია ამისათვის დაგვჭრიდება 1800 კადრი (60*30 ვინაიდან სტანდარტულად 1 წამიან ვიდეო 30 სურათისგან შედგება), შესაბამისად ჩვენი 1 ვიდეოს საფასური იქნება 72$ და 216$-ს შორის (1800*0,04 და 1800*0,12).
როგორც ვხედავთ ასეთი დათვლით ვიდეოს გენერაციის ფასი ისეთ მაღალ ნიშნულს აღწევს რაც ამ სერვისის მასიური გაყიდვას შეუძლებელს ხდის. წარმოდგენისთვის, მისი კონკურეტები (RunwayML, Lumen5, Synthesia) რომლებიც უკვე გვთავაზობენ მსგავს სერვისებს (მართალია საგრძნობლად დაბალ ხარისხს, იხ. ვიდეო) მათი ფასები 1 წუთიანი 1 ვიდეოსთვის რამდენიმე დოლარიდან 20$-მდე მერყეობს.
Credit by: synthesia.io
სავარაუდოა, რომ ერთჯერადი გადახდის (Pay-per-use) სისტემასთან ერთად აუცილებლად შემოგვთავაზებს Subscription-based გადახდის მოდელსაც (ისევე როგორც ამას GPT4-ისთვის იყენებს).
რას შეცვლის სორა? რა შეიძლება იყოს მისი პოტენციური გავლენა?
Sora / სორას აქვს პოტენციალი მოახდინოს რევოლუცია სხვადასხვა შემოქმედებით სფეროებში, მათ შორის კინოს, ანიმაციის, რეკლამისა და ვიდეო თამაშების განვითარებაში.
სორას შეუძლია ვიდეოს შექმნის პროცესის სუპერგამარტივება, რაც მინიმალური ტექნიკური გამოცდილების მქონე პირებს საშუალებას მისცემთ განახორციელონ თავიანთი იდეები საკუთარ სამუშაო მაგიდებთან და კომპიუტერებთან მჯდომებმა.
თუმცა, უნდა აღინიშნოს რომ ამ ტექნოლოგიის ეთიკურობასთან დაკავშირებით არსებობს ნეგატიური მოლოდინები და შფოთვის მიზეზებიც რადგან Deepfake -ის შექმნა და დეზინფორმაციის გავრცელება კიდევ უფრო გამარტივდება.
როგორც OpenAI გვეუბნება, Sora უყრის საფუძველს ისეთ მოდელებს, რომლებსაც შეუძლიათ რეალური სამყაროს გაგება და სიმულაცია, მათ სჯერათ, რომ სორა მნიშვნელოვანი ეტაპი იქნება AGI -ს მისაღწევად.
სასარგებლო ბმულები:
OpenAI -ის ვებსაიტი: openai.com აქ შეგიძლიათ იხილოთ სხვა ოფიციალური ვიდეო ილუსტრაციები
YouTube demos of Sora: youtube.com
თუ თქვენ გაინტერესებთ მეტი, ხელოვნური ინტელექტის შესხებ გაეცანით სტატიას