Sora Kείμενο σε Bίντεο από το OpenAI
Αυτό το μοντέλο AI μπορεί να δημιουργήσει ρεαλιστικές και φανταστικές σκηνές από οδηγίες κειμένου. Βασίζεται σε προηγούμενες έρευνες στα μοντέλα DALL-E και GPT.
Η Sora είναι ένα μοντέλο τεχνητής νοημοσύνης που μπορεί να δημιουργεί ρεαλιστικές και φανταστικές σκηνές από οδηγίες κειμένου. Μπορεί να παράγει βίντεο διάρκειας έως και ενός λεπτού, διατηρώντας παράλληλα την οπτική ποιότητα και την τήρηση της προτροπής του χρήστη.
Αναπτύχθηκε από την OpenAi, την ίδια εταιρεία που δημιούργησε το ChatGPT. Το Sora είναι ικανό να δημιουργεί σύνθετες σκηνές με πολλούς χαρακτήρες, συγκεκριμένους τύπους κίνησης και ακριβείς λεπτομέρειες του θέματος και του περιβάλλοντος.
Το μοντέλο καταλαβαίνει όχι μόνο τι ζήτησε ο χρήστης στην προτροπή, αλλά και πώς αυτά τα πράγματα υπάρχουν στον φυσικό κόσμο. Το τρέχον μοντέλο έχει κάποιες αδυναμίες. Μπορεί να δυσκολεύεται με την ακριβή προσομοίωση της φυσικής μιας σύνθετης σκηνής και μπορεί να μην κατανοεί συγκεκριμένες περιπτώσεις αιτίας και αποτελέσματος.
"Τα εργαλεία παραγωγικής τεχνητής νοημοσύνης εξελίσσονται τόσο γρήγορα και έχουμε κοινωνικό δίκτυο - το οποίο οδηγεί σε μια αχίλλειο πτέρνα της δημοκρατίας μας και δεν θα μπορούσε να συμβεί σε χειρότερη στιγμή". Ο Oren Etzioni, ιδρυτής του TruMedia.org, δήλωσε στο CBS MoneyWatch.
Οι ειδικοί σε θέματα ασφάλειας θα αξιολογήσουν το εργαλείο για να καταλάβουν πώς θα μπορούσε ενδεχομένως να δημιουργήσει παραπληροφόρηση και περιεχόμενο μίσους, δήλωσε το OpenAi.
OpenAi η εταιρεία πίσω από το Sora
Στην ουσία της, η OpenAi αφιερώνεται στην ανάπτυξη προηγμένων τεχνολογιών τεχνητής νοημοσύνης με ασφαλή και ωφέλιμο τρόπο. Η εταιρεία λειτουργεί με μια μοναδική ηθική, ισορροπώντας τον στόχο να επιτύχει φιλόδοξους τεχνολογικούς στόχους με βαθιά δέσμευση στην ηθική και υπεύθυνη ανάπτυξη της τεχνητής νοημοσύνης.
Στην πρωτεύουσα βρίσκεται ο Σαμ Άλτμαν, συνιδρυτής και συν-CEO, ένας επιφανής πρωταγωνιστής στον κόσμο της τεχνολογίας, γνωστός για τον προηγούμενο ρόλο του ως πρόεδρος του επιταχυντή start-up Y Combinator.
Είναι Διαθέσιμο στο Κοινό
Όχι, η Sora γίνεται διαθέσιμη στους πράκτορες της κόκκινης ομάδας για την αξιολόγηση κρίσιμων περιοχών για βλάβες ή κινδύνους.
Θα δώσουν επίσης πρόσβαση σε έναν αριθμό καλλιτεχνών εικαστικών, σχεδιαστών και κινηματογραφιστών για να αποκτήσουν σχόλια σχετικά με το πώς να προωθήσουν το μοντέλο ώστε να είναι πιο χρήσιμο για τους δημιουργικούς επαγγελματίες.
Πώς Λειτουργεί το Sora
Το μοντέλο έχει μια βαθιά κατανόηση της γλώσσας, που του επιτρέπει να ερμηνεύσει με ακρίβεια τις προτροπές και να δημιουργήσει συναρπαστικούς χαρακτήρες που εκφράζουν έντονα συναισθήματα. Το Sora μπορεί επίσης να δημιουργήσει πολλαπλά γυρίσματα μέσα σε ένα μοναδικό παραγόμενο βίντεο που επιμένουν με ακρίβεια στους χαρακτήρες και στο οπτικό στυλ.
Το Sora βασίζεται σε προηγούμενες έρευνες στα μοντέλα DALL-E και GPT. Χρησιμοποιεί την τεχνική recaptioning από το DALL-E 3, η οποία περιλαμβάνει τη δημιουργία εξαιρετικά περιγραφικών τίτλων για τα οπτικά δεδομένα εκπαίδευσης.
Ως αποτέλεσμα, το μοντέλο είναι σε θέση να ακολουθεί πιστότερα τις οδηγίες κειμένου του χρήστη στο παραγόμενο βίντεο.
Η Sora λειτουργεί ως βάση για μοντέλα που μπορούν να κατανοήσουν και να προσομοιώσουν τον πραγματικό κόσμο.
Είμαι περίεργος να δω πώς θα αντιδράσει η Pika Ai σε αυτή την είδηση..
Μέτρα Aσφαλείας
Θα λάβουν διάφορα σημαντικά μέτρα ασφαλείας πριν από τη διάθεση του Sora στα προϊόντα της OpenAI. Συνεργάζονταν με red teamers - ειδικούς σε τομείς όπως η παραπληροφόρηση, το περιεχόμενο μίσους και η προκατάληψη.
Κατασκευάζουν επίσης εργαλεία που βοηθούν στον εντοπισμό παραπλανητικού περιεχομένου, όπως ένας classifier ανίχνευσης που μπορεί να καταλάβει πότε ένα βίντεο δημιουργήθηκε από το Sora. Το οποίο είναι πολύ καλό, αφού το 2024 είναι έτος εκλογών στις ΗΠΑ.
Θα συνεργαστούν με υπεύθυνους χάραξης πολιτικής, εκπαιδευτικούς και καλλιτέχνες σε όλο τον κόσμο για να κατανοήσουν τις ανησυχίες τους και να εντοπίσουν θετικές περιπτώσεις χρήσης αυτής της νέας τεχνολογίας.
Παρόλες τις ολοκληρωμένες έρευνες και δοκιμές, δεν μπορούμε να προβλέψουμε όλους τους ευεργετικούς τρόπους με τους οποίους οι άνθρωποι θα χρησιμοποιήσουν την τεχνολογία, ούτε όλους τους τρόπους με τους οποίους θα την εκμεταλλευτούν.
Η Sora σε Δράση, Τι Mπορεί να Kάνει
Πραγματική ζωή
CyberPunk
UltraRealistic