Τι Eίναι το ImageFX από την Google

Το ImageFx δίνει τη δυνατότητα στον καθένα να δημιουργεί εκπληκτικές εικόνες. Εξερευνήστε τις δυνατότητές του και τους ηθικούς προβληματισμούς για υπεύθυνη τέχνη AI.

Alessandro Rossi S

2/20/20241 λεπτά ανάγνωσης

logo white, ImageFX by Google, Google logo, black background
logo white, ImageFX by Google, Google logo, black background

Η Google ανακοίνωσε την κυκλοφορία του εργαλείου δημιουργίας εικόνων με τεχνητή νοημοσύνη, ImageFX, την 1η Φεβρουαρίου 2024.

Το ImageFX είναι ένα νέο εργαλείο στα " Labs " της Google που επιτρέπει στους χρήστες να δημιουργούν εικόνες με απλές οδηγίες κειμένου. Eίναι μια AI γεννήτρια μετατροπής κειμένου σε εικόνα που βασίζεται στο Imagen 2, ένα μοντέλο διάχυσης κειμένου σε εικόνα που δημιουργήθηκε από το Google DeepMind, το οποίο έχει τη δυνατότητα να δημιουργεί εικόνες υψηλής ποιότητας.

Αυτή η συσκευή μετατροπής κειμένου σε εικόνα είναι πλέον διαθέσιμη μέσω της ιστοσελίδας Google Labs για χρήστες στις ΗΠΑ, την Αυστραλία, τη Νέα Ζηλανδία και την Κένυα.

Η ανάρτηση στο blog από την Kristin Yim, product manager στο "Labs" ανέφερε:

imagers by google, login page,
imagers by google, login page,

"Το ImageFX είναι ένα νέο εργαλείο στα Labs που επιτρέπει στους χρήστες να δημιουργούν εικόνες με απλές προτροπές κειμένου. Τα πρώτα μας πειράματα στα Labs ανέδειξαν πόσο σημαντική είναι η δημιουργική εξερεύνηση για τους νέους χρήστες των εργαλείων AI. Για να προωθήσει περισσότερο τη δημιουργικότητα, το ImageFX περιλαμβάνει μια διεπαφή προτροπής με " expressive chips " που σας επιτρέπουν να πειραματιστείτε γρήγορα με τις παρακείμενες διαστάσεις της δημιουργίας και των ιδεών σας."

Πώς Λειτουργεί το ImageFX

Το Imagen 2, το μοντέλο πίσω από το ImageFX, είναι η πιο προηγμένη τεχνολογία διάχυσης κειμένου σε εικόνα της Googles, παρέχοντας υψηλής ποιότητας, φωτορεαλιστικές εξόδους που είναι στενά προσανατολισμένες και σύμφωνες με τις προτροπές του χρήστη.

Για να βοηθήσουν στη δημιουργία ποιοτικότερων και ακριβέστερων εικόνων που προσαρμόζονται καλύτερα στην προτροπή του χρήστη, πρόσθεσαν επιπλέον περιγραφές στις λεζάντες (captions) των εικόνων στο σύνολο δεδομένων εκπαίδευσης του Imagen 2, βοηθώντας το Imagen 2 να μάθει διαφορετικά στυλ λεζάντας και να γενικεύσει για να κατανοήσει καλύτερα ένα ευρύ φάσμα προτροπών του χρήστη.

Το σύνολο δεδομένων και οι εξελίξεις στο μοντέλο του Imagen 2 έχουν επιφέρει βελτιώσεις σε πολλούς από τους τομείς με τους οποίους συχνά δυσκολεύονται τα εργαλεία μετατροπής κειμένου σε εικόνα, συμπεριλαμβανομένης της απόδοσης ρεαλιστικών χεριών και ανθρώπινων προσώπων και της ελαχιστοποίησης των ενοχλητικών οπτικών τεχνουργημάτων.

imagefx by google, user interface
imagefx by google, user interface

Πώς η ImageFX Kαταπολεμά την Παραπληροφόρηση

Όλες οι εικόνες που παράγονται με το ImageFX και όλα τα τραγούδια που παράγονται με το MusicFX χαρακτηρίζονται από το SynthID, ένα εργαλείο που αναπτύχθηκε από την Google DeepMind και προσθέτει ένα ψηφιακό υδατογράφημα απευθείας στο περιεχόμενο που παράγουμε.

Η δυνατότητα αναγνώρισης του περιεχομένου που παράγεται με AI είναι κρίσιμης σημασίας για την προώθηση της εμπιστοσύνης στις πληροφορίες. Αν και δεν αποτελεί "ασημένια σφαίρα" για την αντιμετώπιση του προβλήματος της παραπληροφόρησης, το SynthID αποτελεί μια πρώιμη και υποσχόμενη τεχνική λύση σε αυτό το πιεστικό ζήτημα ασφάλειας της τεχνητής νοημοσύνης.

Τα υδατογραφήματα SynthID δεν γίνονται αντιληπτά από το ανθρώπινο μάτι και το αυτί, αλλά είναι ανιχνεύσιμα για αναγνώριση. Επιπλέον, όλες οι εικόνες που παράγονται με τη χρήση του ImageFX περιλαμβάνουν μεταδεδομένα IPTC, παρέχοντας στους ανθρώπους περισσότερες πληροφορίες κάθε φορά που συναντούν τις εικόνες που παράγονται από την τεχνητή νοημοσύνη μας.

imagers by google, watermarked vs no watermarked image
imagers by google, watermarked vs no watermarked image

Συμπέρασμα

Καθώς το ImageFx συνεχίζει να εξελίσσεται, έχει τεράστιες δυνατότητες να εκδημοκρατίσει την οπτική δημιουργία και να επαναπροσδιορίσει τη σχέση μας με την τέχνη.

Καθώς η τέχνη που δημιουργείται από την τεχνητή νοημοσύνη γίνεται όλο και πιο διαδεδομένη, πρέπει να θυμόμαστε ότι η ανθρώπινη δημιουργικότητα βρίσκεται στον πυρήνα της. Το ImageFx είναι ένα εργαλείο που πρέπει να χρησιμοποιείται με περίσκεψη και όχι να αντικαθιστά το καλλιτεχνικό όραμα.

Καθώς το εργαλείο αρχίζει να κυκλοφορεί σε διάφορες χώρες, συμπεριλαμβανομένης της Ελλάδας, θα φροντίσουμε να το δοκιμάσουμε και να δημιουργήσουμε έναν οδηγό βήμα-προς-βήμα, ώστε οι χρήστες μας να είναι πάντα ενημερωμένοι για τη χρήση των τελευταίων τεχνολογιών.

Πηγές:

Google AI Blog. (2024, February). Google Labs: ImageFX and TextFX with generative AI. https://blog.google/technology/ai/google-labs-imagefx-textfx-generative-ai/

DeepMind. (n.d.). Synthia: Neural scene rendering for interactive environments. https://deepmind.google/technologies/synthid/

DeepMind. (n.d.). Imagen: Text-to-image generation with Imagen 2. https://deepmind.google/technologies/imagen-2/

Google AI. (n.d.). ImageFX. https://aitestkitchen.withgoogle.com/tools/image-fx