ხელოვნური ინტელექტით მალე რეკლამებს „გადაიღებთ“ - ვიდეო რევოლუცია სახელად Sora / სორა

ხელოვნური ინტელექტით მალე რეკლამებს „გადაიღებთ“ - ვიდეო რევოლუცია სახელად Sora / სორა

2-4 წუთი

Sora / სორა - ეს კიდევ ერთი რევოლუციური პროდუქტია OpenAI-ისგან, რომლის შესახებაც ინფორმაცია 2024 წლის 15 თებერვალს ოფიციალურად გამოქვეყნდა.  Sora წარმოადგენს ხელოვნური ინტელექტის დიფუზურ მოდელს რომელიც ქმნის რეალისტურ, შემოქმედებით სცენებს ტექსტური ინსტრუქციის ანუ პრომპტების საშუალებით.

მარტივად რომ ვთქვათ, სორა არის Text-to-Video კრეატორი, რომელსაც შეძლებთ მიწეროთ როგორი ვიდეოს შექმნა გსურთ, ის კი რამდეინიმე წუთში თქვენ ფანტაზიას ვიდეოდ გარდასახავს. მაგარია არა 😎!?  ალბათ ახლა უმრავი კითხვა გაქვთ, ვეცდებით ზოგიერთ მათგანს ვუპასუხოთ წინამდებერე ბლოგში, მანამდე კი დატკბით ხელოვნური ინტელექტის მიერ შექმნილი რამდენიმე ნიმუშით, რომელიც წარმოდგენელია OpenAI-ის ოფიციალური პრეზენტაციიდან.


Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

 


Prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.

 


Prompt: A young man at his 20s is sitting on a piece of cloud in the sky, reading a book.

რა შეუძლია OpenAI-ის ვიდეო კრეატორ ხელოვნურ ინტელექტს, - სორას (Sora)?

გარდა იმისა, რომ სორას შეუძლია ვიდეოს გენერირება მხოლოდ ტექსტური ინსტრუქციებიდან ასევე შეუძლია "გადაიღოს ვიდეო" თქვენ მიერ ატვირთული ჩვეულებრივი სურათიდან და შექმნას მისგან 1 წუთამდე ვიდეო. გასაცორია ის ფაქტიც, რომ თქვენი სურათის მიხედვით შექმნილ ვიდეოში, ხელოვნური ინტელექტი "ხვდება" სურათზე გამოსახული ობიექტის არსს და მის მცირე დეტალებსაც კი ითვალისწინებს.

Sora-ს ვიდეოების შექმნისას "იაზრებს" ადამიანების ბაზისურ ემოციებსაც კი, რასაც რეალისტურ და საუცხოო შედეგამდე  მივყავართ. სორას ასევე შეუძლია დაამუშაოს თქვენ მიერ მიწოდებული ვიდეო და გააუმჯობესოს ის, ან შეავსოს დაკარგული კადრები, რამაც შესაძლოა დამატებით დრო და ფინანსური რესურსი დაგვიზოგოს.

რა არ შეუძლია სორას?

ამ მომენტისთვის (21/02/2024) Sora-ს აქვს გარკვეული სისუსტეები. ის კარგად ვერ აღიქვამს კომპლექსურ და ინტერაქციულ სცენებს, მაგალითად:

ბავშვმა ჩაკბიჩა შოკოლადი, მაგრამ მომდევნო კადრში შოკოლადი კვლავ მთლიანი ჩანს.

ბურთის ხტუნაობის ტრაექტორია, დავუშვათ ის ხვდება კედელს და შემდეგ ადამიანს, ბუნებრივია უკუქმედება ბურთზე მნიშვნელოვანად განსხვავებული იქნება, თუმცა ჩვენი ხელოვნური ინტელექტი ჯერ-ჯეროებით მხოლოდ სწავლობს მე-6 კლასის ფიზიკის (მექანიკის) კანონებს.

 

როგორ გამოვიყენო Sora?

ჯერ-ჯერობით სორა საჯაროდ არ არის ხელმისაწვდომი. თუმცა, OpenAI-მ გამოაქვეყნა ნიმუშები და უზრუნველყო წვდომა  Red teamer-ებსა  და შერჩეულ კონტენტ კრეატორებთან. ჩვენც მოუთმენლად ველოდებით Sora-ს გატესტვას და მის პრაქტიკაში გამოყენებას, თვალი ადევნეთ ჩვენ ბლოგს და აუცლიებლად გამცნობთ ამის შესახებ, ასევე პრაქტიკულ, სასარგებლო რჩევებსაც გაგიზიარებთ.

 

რა ეღირება Sora-ს მომსახურება?

რთული სათქმალია, რადგან ჯერ-ჯერობით მის შესახებ ოფიციალური ინფორმაცია არ არსებობს. თუმცა ცნობლია, რომ ის ეფუძნება OpenAI GPT4-ს და DALL·E 3 -ს. Sora შესრულებულ საქმეს ნაცვლად ტოკენებისა (Token) დაითვლის Patche -ებით, ეს არის ვიდეოებში წარმოდგენილი გამოსახაულების უმცირესი ერთეული, რომელსაც OpenAI ითვლის. ის თავისი არსით ძალიან ჰგავს Token-ებს.

Sora იყენებს DALL·E 3 -ის მიდგომებს, ამიტომ მოდით ვცადოთ დავთვალოთ რა გამოვა ამ შემთხვევაში გენერირებული ვიდეოს ფასი.

იმ საფასო პოლიტიკის გათვალისწინებით რაც Image model DALL·E 3-ს აქვს (იხ. სქრინშოთი), თუ გვსურს 1 წუთიანი  HD ან Full HD ვიდეოს გენერაცია ამისათვის დაგვჭრიდება 1800 კადრი (60*30 ვინაიდან სტანდარტულად 1 წამიან ვიდეო 30 სურათისგან შედგება), შესაბამისად ჩვენი 1 ვიდეოს საფასური იქნება 72$ და 216$-ს შორის (1800*0,04 და 1800*0,12)

dalle-3, Sora price სორას ფასი

როგორც ვხედავთ ასეთი დათვლით ვიდეოს გენერაციის ფასი ისეთ მაღალ ნიშნულს აღწევს რაც ამ სერვისის მასიური გაყიდვას შეუძლებელს ხდის. წარმოდგენისთვის, მისი კონკურეტები (RunwayML, Lumen5, Synthesia) რომლებიც უკვე გვთავაზობენ მსგავს სერვისებს (მართალია საგრძნობლად დაბალ ხარისხს, იხ. ვიდეო) მათი ფასები 1 წუთიანი 1 ვიდეოსთვის რამდენიმე დოლარიდან 20$-მდე მერყეობს.


Credit by: synthesia.io

სავარაუდოა, რომ ერთჯერადი გადახდის (Pay-per-use) სისტემასთან ერთად აუცილებლად შემოგვთავაზებს Subscription-based გადახდის მოდელსაც (ისევე როგორც ამას GPT4-ისთვის იყენებს). 

 

რას შეცვლის სორა? რა შეიძლება იყოს მისი პოტენციური გავლენა?

Sora / სორას აქვს პოტენციალი მოახდინოს რევოლუცია სხვადასხვა შემოქმედებით სფეროებში, მათ შორის კინოს, ანიმაციის, რეკლამისა და ვიდეო თამაშების განვითარებაში.

სორას შეუძლია ვიდეოს შექმნის პროცესის სუპერგამარტივება, რაც მინიმალური ტექნიკური გამოცდილების მქონე პირებს საშუალებას მისცემთ განახორციელონ თავიანთი იდეები საკუთარ სამუშაო მაგიდებთან და კომპიუტერებთან მჯდომებმა.

თუმცა, უნდა აღინიშნოს რომ ამ ტექნოლოგიის ეთიკურობასთან დაკავშირებით არსებობს ნეგატიური მოლოდინები და შფოთვის მიზეზებიც რადგან Deepfake -ის შექმნა და დეზინფორმაციის გავრცელება კიდევ უფრო გამარტივდება.

როგორც OpenAI გვეუბნება, Sora უყრის საფუძველს ისეთ მოდელებს, რომლებსაც შეუძლიათ რეალური სამყაროს გაგება და სიმულაცია, მათ სჯერათ, რომ სორა მნიშვნელოვანი ეტაპი იქნება AGI -ს მისაღწევად.

სასარგებლო ბმულები:

OpenAI -ის ვებსაიტი: openai.com  აქ შეგიძლიათ იხილოთ სხვა ოფიციალური ვიდეო ილუსტრაციები

YouTube demos of Sora: youtube.com

თუ თქვენ გაინტერესებთ მეტი, ხელოვნური ინტელექტის შესხებ გაეცანით სტატიას

რა არის ხელოვნური ინტელექტი, იგივე AI  [ძალიან მარტივად]

რა არის ხელოვნური ინტელექტი, იგივე AI [ძალიან მარტივად]

3-6 წუთი

რა მოხდა 2022 წლის 30 ნოემბერს? თამამად შეიძლება ითქვას რომ ეს დღე კაცობრიობის ისტორიაში ახალი ფურცლის დაწყების თარიღად ჩაიწერება. ყველანი, ახალი ბორბლის გამოგონების მომსწრენი გავხდით რაც ჩვენ ცხოვრებას ახალ საფეხურზე აიყვანს. დიადი სიახლეების და გარდაქმნების ეპოქა უკვე დაიწყო და ამის უარყოფა შეუძლებელია!

 

რა არის ხელოვნური ინტელექტი (AI)

ხელოვნური ინტელექტი (AIArtificial Intelligence)   ეს არის კომპიუტერული მეცნიერების დარგი რომელიც მუშაობს ჭკვიანი სისტემების, მექანიზმებისა და ალგორითმების ე.წ. სოფტის შექმნაზე რომლებიც ასრულებენ  იმ სამუშაოს რასაც ადამიანები.

ხელოვნურ ინტელექტს შეუძლია დასწავლა, ადაპტირება ახალ ინფორმაციასთან და რთული სააზროვნო დავალებების შესრულება ისე რომ არ ან მინიმალურ დონეზე საჭიროებს ადამიანური რესურსის გამოყენებას.  

 

  • AI-ს მოკლე ისტორია

ხელოვნური ინტელექტის ისტორია

DALL·E 3-ის მიერ გენერირებული ფოტო

ჯერ კიდევ ბერძნულ მითოლოგიაში, ცეცხლისა და მჭედლობის ღმერთმა ჰეფესტოსმა რომელიც დიდი ინოვატორობით გამოირჩეოდა, შექმნა ოქროს მოსამსახურეები, რომლებიც როგორც მითი იუწყება  აზროვნებდნენ და ცოცხალ ადამიანებს გავდნენ. ჰეფესტოსმა თავისი ქმნილებები მშობლებს, ზევსსა და ჰერას აჩუქა რომელთაც წლების მანძილზე ემსახურებოდნენ ეს ოქროს მოსამსახურეები.

მოკლედ და ლაკონიურად გავირბინოთ ათწლეულები AI ისტორიასთან დაკავშირებით: 

1836 წელი: კემბრიჯის უნივერსიტეტის მათემატიკოსმა და  ლავლეისის გრაფინია აუგუსტა ადა ბაირონმა შექმნეს  გამოთვლითი მანქანის პირველი დიზაინი.

1940 წელი: პრინსტონელმა მათემატიკოსმა, ჯონ ვონ ნეუმანმა შექმნა Stored-program computer-ის არქიტექტურა, ეს არის კონცეპტი იმის შესახებ რომ კომპიუტერის პროგრამა და მონაცემთა პროცესინგის წყარო კომპიუტერის შიგნით ჰარდის დონეზე არსებული მეხსიერებიდან უნდა წამოსულიყო. ამავე წელს, უორენ მაკკალოხმა და უოლტერ პიტსმა გზა გაუხსნეს ნეირონულ ქსელებს, როდესაც გამოაქვეყნეს ნაშრომი: ნერვულ აქტივობაში იმანენტური იდეების ლოგიკური გამოთვლა, რომელმაც შემოგვთავაზა პირველი მათემატიკური მოდელი ნეირონული ქსელის შესაქმნელად.

1950 - იანები: ბრიტანელი მათემატიკოსი ალან ტიურინგი, აქვეყნებს ნაშრომს -  Computing Machinery and Intelligence სადაც  მათემატიკოსმა როგორც თავად უწოდა ‘’იმიტაციური თამაში’’  ეწ  ტიურინგის ტესტი წარმოგვიდგინა რომელიც მანქანის უნარიანობის ერთგვარი ტესტია.

1956 წელი: დარტმუთის კოლეჯში , DARPA -ს მიერ ფინანსირებულ AI -ს  პირველ კონფერენციაზე ჯონ მაკარტიმ გამოიგონა ტერმინი ‘’ხელოვნური ინტელექტი’’.  ამავე კონფერენციაზე, კომპიუტერულ მეცნიერებათა ინჟინერმა ალან ნიუელმა და ეკონომისტმა, კოგნიტურმა ფსიქოლოგმა და პოლიტოლოგმა ჰერბერტ საიმონმა წარადგინეს რევოლუციური კომპიუტერული პროგრამა  Logic Theorist რომელიც ითვლება პირველ AI პროგრამად.

1950 იანების ბოლო: ალან ნიუელმა და ჰერბერტ საიმონმა  გამოაქვეყნეს General Problem Solver Algorithm  რომელიც ვერ ხსნიდა რთულ პრობლემებს, მაგრამ ეს ერთგვარი შესაძლებლობა იყო  უფრო დახვეწილი შემეცნებითი არქიტექტურის შესაქმნელად.   ამ ხანებშივე ჯონ მაკარტიმ შექმნა AI პროგრამირების  ენა Lisp  რომელსაც დღესაც იყენებენ.

1960 იანების შუა წლები: MIT-ის პროფესორმა,  ჯოზეფ ვაიზენბაუმმა, შექმნა  ბუნებრივი ენის დამუშავების პროგრამა  ELIZA,  რომელმაც გზა გაუხსნა თანამედროვე ჩატბოტებს.

1967 წელი: ფრენკ როზენბლატმა შექმნა პირველი კომპიუტერი, რომელიც შექმნილია ნეირონულ ქსელზე, რომელსაც შეუძლია "სწავლა" ცდის  და შეცდომის გზით - Mark 1 Perceptron.

1968 წელი: მარვინ მინსკიმ და სეიმურ პეპერტმა გამოაქვეყნეს ნაშრომი სახელწოდებით Perceptrons: An Introduction to Computational Geometry, რომელიც უმალვე გახდა საეტაპო ნამუშევარი  ნეირონული ქსელების შესახებ.

1974-1980 წლებში: ადგილი აქვს პირველ ‘’AI ზამთარს“  როცა  ხელისუფლებამ და ბიზნესმა ჩაუხსნეს ფინანსირება AI კვლევებს.

1980 იანი წლები : ედვარდ ფეიგენბაუმის მიერ შემუშავებული საექსპერტო სისტემებისა და Deep learning - ის შესახებ კვლევებმა გამოიწვიეს  AI აღფრთოვანების ახალი ტალღა. ინტენსიურად იწყება ნეირონული ქსელების გამოყენება თუმცა მალევე სამთავრობო დაფინანსება და ინდუსტრიის მხარდაჭერა კვლავ კვდება და დგება ''მეორე AI ზამთარი"  1990-იანი წლების შუა პერიოდამდე.

1997 წელი: IBM ის Deep Blue- მ ჭადრაკში მსოფლიო ჩემპიონი გარი კასპაროვი დაამარცხა არა მხოლოდ ერთ, არამედ განმეორებით საჭადრაკო პარტიაშიც.

2011 წელი: IBM -ის Watson -მა დაამარცხა ბრედ რატერი და კენ ჯენინგსი Jeopardy - ში.

2015 წელი: Baidu-ს სუპერკომპიუტერი Minwa რომელიც იყენებს Deep Neural Network- ს აიდენტიფიცირებს და ალაგებს ფოტოებს იმაზე უფრო კარგად ვიდრე ადამიანი.

2016 წელი: DeepMind -ის AlphaGo-მ  დაამარცხა  გო-ს ხუთმატჩიან თამაშში მსოფლიო ჩემპიონი ლი სოდოლი.

 

ხელოვნური ინტელექტის (AI-ის) ტიპების შესახებ

არსებობს 3 ტიპის ხელოვნური ინტელექტი:

  • Narrow AI / Weak AI, სისტემა შექმნილია და გაწვრთნილია კონკრეტული სპეციფიკური დავალებების გადასაჭრელად მონაცემთა ბაზაზე დაყრდნობით, მაგ: Apple -ის  Siri  სწორედ ასეთ ხელოვნურ ინტელექტთა სიას განეკუთვნება,  ისე როგორც Samsung-ის Bixby თუ Google Assistant.
  • Strong AI / Artificial General Intelligence (AGI) – მას შეეძლება ადამიანის ტვინის კოგნიტური უნარების კოპირება. როცა იგი შეხვდება უცნობ  პრობლემას გამოიყენებს ერთი შეხედვით გაუგებარ ლოგიკას და წამოიღებს  გარკვეულ ინფორმაციას განსხვავებული    სფეროებიდან და ამგვარად გადაჭრის საკითხებს. AGI-მ აუცილებლად უნდა გაიაროს სხვა და სხვა ხარისხის მაჩვენებელი ტესტები მათ შორის ყველაზე მნიშვნელოვანი  ტიურინგის ტესტიც.
  • Artificial Super Intelligence (ASI)- ხელოვნური ინტელექტის ჰიპოტეტური ტიპია რომელიც თავისი კოგნიტური და გონებრივი უნარებით ადამიანზე აღმატებული იქნება. შესაბამისად პრობლემების გადაწყვეტასა და  მიზეზ-შედეგობრიობა დასწავლაშიც მასზე ძლიერი და უნარიანი იქნება.

 

  • როგორ მუშაობს AI?

AI სისტემა დიდი რაოდენობის ინფორმაციას (Big Data) აანალიზებს პატერნებად და კორელანტებად და იყენებს მათ იმისთვის რომ შექმნას ე.წ. წინასწარმეტყველებანი / ვარაუდები.  ამ პროცესში ის ძირითადად იყენებს შემდეგ ფუნდამენტურ  კოგნიტურ უნარებს :

  • სწავლა (Learning)
  • მიზეზ-შედეგობრიობა (Reasoning)
  • პრობლემის გადაწყვეტა  (Problem-solving)
  • გადაწყვეტილების მიღება (Decision-making)
  • თვით შესწორება  (Self- correction)

 

რაში ვიყენებთ ხელოვნურ ინტელექტს?

ხელოვნური ინტელექტი  გამოიყენება ადამიანის საქმიანობის მრავალ სფეროში:

ჯანდაცვა: AI -ის საშუალებით იქმნება ახალი წამლები და მკურნალობის საშუალებები, მარტივდება და უფრო ზუსტი ხდება დაავადებათა დიაგნოსტიკის პროცესი.

ფინანსები:  მარტივია როგორც თაღლითების დეტექცია ამ სფეროში ისე საინვესტიციო გადაწყვეტილებების მიღება -  პროგნოზირება და ფინანსური კონსულტაციების გაწევა.

საცალო გაყიდვები: ამარტივებს პროდუქტების რეკომენდირების პროცესს პოტენციურ მომხმარებლებთან,  მათზე მორგებულს ხდის ყიდვის პროცესს და აოპტიმიზირებს  ამ პროდუქციის მიტანის გზებსაც.

ტრანსპორტი: თვითმმავალი მანქანები, მოძრაობის ნაკადის ოპტიმიზაცია, უსაფრთხოების გაუმჯობესება.

მანუფაქტურა: ხდება დავალებების  ავტომატიზირება, ხარისხის კონტროლის გაუმჯობესება  და მოთხოვნის წინასწარმეტყველება.

უსაფრთხოება: კიბერ თავდასხმების დეტექცია, პოტენციური საფრთხეების მინიმიზაცია, მონაცემთა უსაფრთხოების გაუმჯობესება.

გართობის ინდუსტრია: იქმნება  ვიდეო თამაშები, ფილმები რომლებიც პერსონალიზირებულია და დამყარებულია კონკრეტული ადამიანების გართობის გამოცდილებაზე.

 

  • ეთიკური დილემები ხელოვნური ინტელქტის გამოყენებისას

მოკლედ რამდენიმე მნიშვნელოვანი ეთიკური პრობლემის შესახებ:

მიკერძოებულობა / სტერეოტიპულობა: AI სისტემა გაწვრთნილია კონკრეტულ მონაცემებზე, თუ მონაცემები მიკერძოებული, არაობიექტური და სტერეოტიპულია შედეგიც შესაბამისი გვექნება.

ავტონომია : დროსთან ერთად AI სისტემები უფრო განვითარდებიან და ისინი უფრო მეტ გადაწყვეტილებას მიიღებენ დამოუკიდებელად. ჩნდება კითხვა, მაგ : ვინაა პასუხისმგებელი თუ თვითმავალი მანქანა ადამიანს დაეჯახება - ავტომობილის მწარმოებელი,  AI სისტემის დეველოპერი თუ ავტომობილის მფლობელი?

პრივატულობა: AI სისტემები აგროვებენ ინახავენ და ამუშავებენ უდიდესი მოცულობის მონაცემებს ადამიანების შესახებ. რა ტიპის პრობლემები შეიძლება გამოიწვიოს ამან, თქვენი ფანტაზიისთვის მომინდვია...

უსაფრთხოება: თუ AI სისტემა გამოვა მწყობრიდან ნეგატიური შედეგები შეიძლება ძალიან დიდ მასშტაბებზე გავიდეს ჯაჭვური რეაქციიდან გამომდინარე.

ავტონომიური სამხედრო იარაღი : AI -ს საშუალებით შეიძლება შეიქმნას ავტონომიური საბრძოლო იარაღები რომელთა ქმედებაში მოყვანას არ ჭირდება ადამიანური ჩარევები. აქ უკვე ადგილი აქვს სერიოზულ ეთიკურ დილემას, გამოვიყენოთ თუ არა ხელოვნური ინტელექტი სამხედრო მიზნებისთვის.  

 

სასარგებლო უფასო ბმულები