Είναι το Tέλος για το Stability AI?

Ξεκλειδώστε τη δύναμη των προηγμένων μοντέλων δημιουργίας εικόνων της Stability AI που δημιουργούν εντυπωσιακές, υψηλής ποιότητας εικόνες μόνο με κείμενο.

Alessandro Rossi S

3/22/20241 λεπτά ανάγνωσης

Το 2022, η εταιρεία Stability AI, που χρηματοδοτεί την ανάπτυξη ανοικτού κώδικα συστημάτων παραγωγής μουσικής και εικόνων όπως το Dance Diffusion και το Stable Diffusion, ανακοίνωσε ότι συγκέντρωσε $101 εκατομμύρια δολάρια σε μια γύρο χρηματοδότησης που οδήγησε η Coatue και η Lightspeed Venture Partners με τη συμμετοχή της O’Shaughnessy Ventures LLC.

Η εταιρεία Stability AI με έδρα το Λονδίνο και το Σαν Φρανσίσκο είναι το αποτέλεσμα της φαντασίας του διευθύνοντος συμβούλου Emad Mostaque. Αφού αποφοίτησε από το Πανεπιστήμιο της Οξφόρδης με μεταπτυχιακό στα μαθηματικά και την επιστήμη των υπολογιστών, εργάστηκε ως αναλυτής σε διάφορα hedge funds πριν αλλάξει κατεύθυνση προς πιο δημόσιες δραστηριότητες.

Ο Mostaque ιδρυσε και χρηματοδότησε την Stability AI το 2020, κινούμενος τόσο από το προσωπικό του ενδιαφέρον για την τεχνητή νοημοσύνη, όσο και από αυτό που χαρακτήρισε ως έλλειψη "οργάνωσης" μέσα στην κοινότητα της ανοιχτού κώδικα τεχνητής νοημοσύνης.

Οπότε, τι οδήγησε την εταιρεία στην πολύπλοκη κατάσταση που αντιμετωπίζει σήμερα?

Τρία μέλη της ομάδας έρευνας της εταιρείας Stability AI Ltd. φαίνεται ότι έχουν αποχωρήσει από την καλά χρηματοδοτούμενη εταιρεία τεχνητής νοημοσύνης.

Η αρχική έκδοση του Stable Diffusion αναπτύχθηκε από μια ομάδα πέντε ερευνητών στο Πανεπιστήμιο Ludwig Maximilian του Μονάχου. Τα τρία μέλη της ομάδας της Stable AI που φαίνεται ότι έχουν αποχωρήσει από την εταιρεία, οι Robin Rombach, Andreas Blattmann και Dominik Lorenz, ήταν μέλη αυτής της ομάδας. Ο Rombach ήταν ο επικεφαλής της ομάδας.

Τι Eίναι το Stability AI?

Η Stability AI είναι μια εταιρεία που αναπτύσσει μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα. Το προϊόν που ξεχωρίζει, το Stable Diffusion, είναι πολύ δημοφιλές για το μοντέλο κειμένου προς εικόνα που μπορεί να δημιουργήσει υψηλής ποιότητας εικόνες από απλά κείμενα.

Η αποστολή της Stability AI είναι να παρέχει τη βάση για την ενεργοποίηση του δυναμικού της ανθρωπότητας. Οι βασικές της αξίες περιλαμβάνουν την πρακτικότητα, την επίδραση, τη συνεργατικότητα, τη φιλοδοξία, το θάρρος, την καινοτομία και τη διαφάνεια. Η Stability AI δεσμεύεται πλήρως να εντοπίζει νόμιμες λύσεις που κάνουν τη διαφορά, συνεργαζόμενη στενά με εταίρους, πελάτες και κοινότητες για να επιτύχει περισσότερα.

Έχουμε συγκρίνει εικόνες εξόδου από το Stable Diffusion 3 με διάφορα άλλα ανοικτά μοντέλα, συμπεριλαμβανομένων των SDXL, SDXL Turbo, Stable Cascade, Playground v2.5 και Pixart-α, καθώς και κλειστά συστήματα όπως τα DALL·E 3, Midjourney v6 και Ideogram v1 για να αξιολογήσουμε την απόδοση βάσει ανθρώπινων ανταποκρίσεων.

Από τα αποτελέσματα των δοκιμών μας, διαπιστώσαμε ότι το Stable Diffusion 3 είναι ίσο ή υπερέχει των τρεχουσών κορυφαίων συστημάτων δημιουργίας εικόνων από κείμενο σε όλους τους παραπάνω τομείς.

Εγκατάσταση βήμα προς βήμα

Η ρύθμιση του λογαριασμού σας Stability AI είναι αρκετά απλή.

Step 1:

Επισκεφθείτε την ιστοσελίδα https://beta.dreamstudio.ai/generate και κάντε κλικ στο "Login". Θα εμφανιστεί η ακόλουθη σελίδα.

Step 2:

Κάντε κλικ στο "Login" και δημιουργήστε το λογαριασμό σας.

Step 3:

Είστε έτοιμοι να αρχίσετε να εισάγετε τις προτροπές σας. Αυτό το εργαλείο σας επιτρέπει όχι μόνο να δημιουργείτε εικόνες αλλά και να αλλάζετε ήδη υπάρχουσες.

Ένα ακόμη πράγμα που πρέπει να γνωρίζετε είναι ότι μπορείτε να χρησιμοποιήσετε την "Αρνητική προτροπή" για να πείτε στην Τεχνητή Νοημοσύνη τι δεν θέλετε να εμφανίζεται.

Συμβουλές για τη χρήση του Stability AI

Χρησιμοποιήστε σαφείς και περιεκτικές εντολές: Όσο πιο σαφείς και περιεκτικές είναι οι εντολές σας, τόσο πιο πιθανό είναι να λάβετε τα αποτελέσματα που θέλετε. Για παράδειγμα, αντί να εισάγετε "Ένας σκύλος που κάθεται στο σαλόνι", θα μπορούσατε να εισάγετε "Ένας σκύλος που κάθεται στο σαλόνι και παρακολουθεί τον ιδιοκτήτη του να ζωγραφίζει".
Χρησιμοποιήστε αρνητικές εντολές για να αποκλείσετε ανεπιθύμητες εικόνες: Αν υπάρχουν συγκεκριμένες εικόνες που δεν θέλετε να δημιουργήσετε, μπορείτε να χρησιμοποιήσετε αρνητικές εντολές για να τις αποκλείσετε. Για παράδειγμα, αν δεν θέλετε η εικόνα να είναι χαριτωμένη, θα μπορούσατε να εισάγετε "όχι χαριτωμένη" ως αρνητική εντολή.
Πειραματιστείτε με διαφορετικές ρυθμίσεις: Η διαδικτυακή εφαρμογή έχει μια σειρά από ρυθμίσεις που μπορείτε να προσαρμόσετε, όπως το μέγεθος της εικόνας, τον αριθμό των επαναλήψεων και τη μέθοδο δειγματοληψίας. Πειραματιστείτε με διαφορετικές ρυθμίσεις για να δείτε πώς επηρεάζουν τις δημιουργούμενες εικόνες.
Να είστε υπομονετικοί: Η δημιουργία εικόνων με αυτό το εργαλείο μπορεί να χρειαστεί κάποιο χρόνο, ιδιαίτερα για εικόνες υψηλής ανάλυσης. Να είστε υπομονετικοί και αφήστε τη διαδικτυακή εφαρμογή να κάνει τη δουλειά της.

Stable Bίντεο 3D

Στις 18 Μαρτίου κυκλοφόρησαν το Stable Video 3D (SV3D), ένα γεννητικό μοντέλο βασισμένο στο Stable Video Diffusion, προωθώντας τον τομέα της τεχνολογίας 3D και παρέχοντας σημαντική βελτίωση στην ποιότητα και την ομοιογένεια της προβολής.

Αυτή η κυκλοφορία περιλαμβάνει δύο παραλλαγές: το SV3D_u και το SV3D_p. Το SV3D_u δημιουργεί τρισδιάστατα βίντεο με ελλειπτικές προβολές βασιζόμενο σε μοναδικές εικόνες εισόδου χωρίς καθορισμένες κάμερες.

Το SV3D_p επεκτείνει τη δυνατότητα προσαρμόζοντας τόσο μοναδικές εικόνες όσο και ελλειπτικές προβολές, επιτρέποντας τη δημιουργία τρισδιάστατων βίντεο κατά μήκος συγκεκριμένων διαδρομών κάμερας.

Προσαρμόζοντας το μοντέλο διάχυσης εικόνας προς βίντεο Stable Video Diffusion με την προσθήκη συνθηκών διαδρομής κάμερας, το Stable Video 3D είναι σε θέση να δημιουργήσει πολλαπλές προβολές ενός αντικειμένου. Η χρήση μοντέλων διάχυσης βίντεο, αντίθετα με τα μοντέλα διάχυσης εικόνων όπως αυτά που χρησιμοποιούνται στο Stable Zero123, προσφέρει σημαντικά οφέλη στη γενίκευση και την ομοιογένεια των παραγόμενων εξόδων.

Το Stable Video 3D εισάγει σημαντικές προόδους στη γεννήτρια 3D, ιδιαίτερα στη σύνθεση νέων προβολών (NVS). Αντίθετα με προηγούμενες προσεγγίσεις που συχνά αντιμετωπίζουν περιορισμένες οπτικές γωνίες και αντιφάσεις στα αποτελέσματα, το Stable Video 3D μπορεί να παρέχει συνεκτικές προβολές από οποιαδήποτε γωνία με επαρκή γενίκευση.

Πηγές:

TechCrunch. (2022, October 17). Stability AI, the startup behind Stable Diffusion, raises $101M. TechCrunch. Retrieved from https://techcrunch.com/2022/10/17/stability-ai-the-startup-behind-stable-diffusion-raises-101m/

Stability AI. (Year). Stable Diffusion 3 Research Paper. Retrieved from https://stability.ai/news/stable-diffusion-3-research-paper