Η OpenAI παρουσίασε το ChatGPT Images 2.0, μια νέα γενιά συστήματος δημιουργίας εικόνων που ενσωματώνεται στο ChatGPT, περίπου έναν χρόνο μετά την πρώτη δυνατότητα δημιουργίας εικόνων μέσω του chatbot. Η εταιρεία το περιγράφει ως μια σημαντική αναβάθμιση, καθώς στοχεύει να βελτιώσει τόσο την ακρίβεια στην εκτέλεση εντολών όσο και την οπτική συνοχή των αποτελεσμάτων.
Σύμφωνα με την OpenAI, το νέο σύστημα είναι πολύ καλύτερο στο να ακολουθεί σύνθετες οδηγίες, να αποδίδει σωστά πυκνό κείμενο μέσα σε εικόνες και να τοποθετεί αντικείμενα με λογικές σχέσεις μέσα σε μια σκηνή. Αυτή η βελτίωση το καθιστά πιο αξιόπιστο σε περιπτώσεις όπου η λεπτομέρεια και η ακρίβεια παίζουν σημαντικό ρόλο, όπως στον σχεδιασμό ή στην οπτικοποίηση ιδεών.

Ένα από τα πιο σημαντικά νέα στοιχεία είναι ότι για πρώτη φορά η OpenAI ενσωματώνει «λογική ικανότητα» σε μοντέλο εικόνας. Αυτό σημαίνει ότι το σύστημα μπορεί να αξιοποιεί εξωτερική αναζήτηση και να ελέγχει καλύτερα τα αποτελέσματά του, προσπαθώντας να μειώσει τα λάθη και τις ασυνέπειες.
Επιπλέον, το Images 2.0 παρουσιάζει σημαντική πρόοδο στην κατανόηση και απόδοση μη λατινικών γλωσσών, όπως τα Ιαπωνικά, τα Κορεατικά, τα Κινέζικα, τα Χίντι και τα Μπενγκάλι. Παράλληλα, αποδίδει καλύτερα διαφορετικά «οπτικά στυλ», κάτι που το καθιστά χρήσιμο για δημιουργικές εφαρμογές όπως storyboards και πρωτότυπα παιχνιδιών.
Το σύστημα προσφέρει επίσης μεγαλύτερη ευελιξία στις αναλογίες εικόνας, με δυνατότητα δημιουργίας από πολύ οριζόντιες έως πολύ κάθετες συνθέσεις, καθώς και ανάλυση έως 2K. Επιπλέον, μπορεί να παράγει πολλαπλές εικόνες ταυτόχρονα σε μία εκτέλεση.
Σε δοκιμές, το μοντέλο έδειξε ικανοποιητική απόδοση σε δύσκολες εργασίες, όπως pixel art και μετατροπή εικόνων σε διαφανές φόντο, αν και σε ορισμένες περιπτώσεις υπήρξαν μικρές αποκλίσεις από το αρχικό ζητούμενο.
Το Images 2.0 είναι διαθέσιμο σε όλους τους χρήστες του ChatGPT, με πιο προηγμένα αποτελέσματα για συνδρομητές, ενώ διατίθεται και μέσω API. Η κυκλοφορία του έρχεται σε μια περίοδο έντονου ανταγωνισμού στον χώρο των εργαλείων δημιουργίας εικόνας με AI.





