Η Google DeepMind συνεχίζει να ωθεί τα όρια της τεχνητής νοημοσύνης με το Project Genie, ένα νέο εργαλείο που επιτρέπει στο κοινό να δημιουργεί και να εξερευνά διαδραστικούς κόσμους που παράγονται από AI. Το Project Genie βασίζεται στο προηγμένο Genie 3, ένα μοντέλο που μπορεί να δημιουργεί εικόνες και να αντιδρά στις κινήσεις του χρήστη μέσα στο περιβάλλον που προσομοιώνει. Αρχικά, το Genie 3 είχε παρουσιαστεί το καλοκαίρι ως εργαλείο για εκπαίδευση AI πρακτόρων, αλλά τώρα η Google ανοίγει την εμπειρία και για εξωτερικούς χρήστες μέσω της συνδρομής AI Ultra, που κοστίζει 250 δολάρια τον μήνα.
Για να συμμετάσχει κάποιος, πρέπει να ζει προς το παρόν στις Ηνωμένες Πολιτείες και να είναι άνω των 18 ετών. Το Project Genie προσφέρει τρία διαφορετικά modes αλληλεπίδρασης: World Sketching, Exploration και Remixing. Στο World Sketching, το μοντέλο Nano Banana Pro δημιουργεί την αρχική εικόνα που θα χρησιμοποιήσει το Genie 3 για να φτιάξει τον κόσμο που θα εξερευνήσει ο χρήστης. Σε αυτό το στάδιο, μπορείς να ορίσεις τον χαρακτήρα σου, την προοπτική της κάμερας — first-person, third-person ή ισομετρική — και τον τρόπο εξερεύνησης του κόσμου. Προτού ξεκινήσει η δημιουργία, το Nano Banana Pro «σχεδιάζει» μια πρόβλεψη της εικόνας, δίνοντας τη δυνατότητα να κάνεις τροποποιήσεις και βελτιώσεις.
Το Project Genie δεν είναι κινητήρας παιχνιδιού, αν και τα αποτελέσματα μπορεί να φαίνονται game-like και μπορεί να προσομοιώνει φυσικές αλληλεπιδράσεις. Κάθε γενιά περιορίζεται στα 60 δευτερόλεπτα, με παρουσίαση σε 720p και 24fps, οπότε δεν πρόκειται για παραδοσιακή εμπειρία παιχνιδιού. Παρ’ όλα αυτά, για τους συνδρομητές AI Ultra, το Project Genie είναι μια μοναδική ευκαιρία να δουν από κοντά την κορυφαία έρευνα της DeepMind και να πειραματιστούν με την δημιουργία διαδραστικών ψηφιακών κόσμων όπως ποτέ πριν.
Οι χρήστες μπορούν επίσης να γράφουν δικά τους prompts για να επαναδημιουργήσουν ή να ανακατέψουν κόσμους που έχουν δημιουργήσει άλλοι, καθιστώντας το Project Genie ένα δημιουργικό εργαλείο για εξερεύνηση, φαντασία και πειραματισμό. Η δυνατότητα να βλέπεις τον κόσμο να αντιδρά στις κινήσεις σου δίνει μια μοναδική αίσθηση αλληλεπίδρασης και εμβύθισης, ανοίγοντας τον δρόμο για νέες εφαρμογές AI σε διαδραστικά περιβάλλοντα και ψηφιακή αφήγηση.






