Μια μέρα πρόσφατα, σε ένα τραπέζι στο εργαστήριο του Jean Oh στη γειτονιά Squirrel Hill του Πίτσμπουργκ, ένας βραχίονας ρομπότ ήταν απασχολημένος σε έναν καμβά. Σιγά-σιγά, σαν ο αέρας να ήταν παχύρρευστος, βούτηξε ένα πινέλο σε μια δεξαμενή με ανοιχτό γκρι χρώμα σε μια παλέτα, στριφογύρισε και χάιδεψε τον καμβά, αφήνοντας ένα σημάδι μήκους ίντσας ανάμεσα σε ένα σύμπλεγμα από άλλες πινελιές. Έπειτα αποσύρθηκε και σταμάτησε, σαν να ήθελε να αξιολογήσει τη δουλειά του.

Οι πινελιές, κυρίως διαφορετικές αποχρώσεις του γκρι, πρότειναν κάτι αφηρημένο – μια μυρμηγκοφωλιά, ίσως. Ω, επικεφαλής του RoBot Intelligence Group στο Πανεπιστήμιο Carnegie Mellon, ντυμένος με ένα φούτερ που έφερε τη φράση «Υπάρχουν καλλιτέχνες ανάμεσά μας», τον κοίταξε με έγκριση. Ο διδακτορικός της φοιτητής, Peter Schaldenbrand, στάθηκε δίπλα.

Το έργο του Oh, το οποίο περιλαμβάνει όραση ρομπότ και θέματα στην αυτόνομη αεροπορία, αγγίζει συχνά αυτό που είναι γνωστό ως το χάσμα sim-to-real: πώς οι μηχανές που εκπαιδεύονται σε ένα προσομοιωμένο περιβάλλον μπορούν να δράσουν στον πραγματικό κόσμο. Τα τελευταία χρόνια, η Schaldenbrand ηγήθηκε μιας προσπάθειας να γεφυρώσει το χάσμα sim-to-real μεταξύ εξελιγμένων προγραμμάτων δημιουργίας εικόνων όπως το Stable Diffusion και φυσικών έργων τέχνης όπως σχέδια και πίνακες ζωγραφικής. Αυτό φάνηκε κυρίως στο έργο γνωστό ως FRIDA, η τελευταία επανάληψη του οποίου στροβιλιζόταν ρυθμικά σε μια γωνιά του εργαστηρίου. (Το FRIDA είναι ένα αρκτικόλεξο για το Framework and Robotics Initiative for Developing Arts, αν και οι ερευνητές επέλεξαν το ακρωνύμιο, εμπνευσμένο από τη Φρίντα Κάλο, πριν αποφασίσουν τι σημαίνει.)

Η διαδικασία μετάβασης από τις γλωσσικές προτροπές σε εικόνες με pixel και πινελιές μπορεί να είναι περίπλοκη, καθώς το ρομπότ πρέπει να λογοδοτεί για «τον θόρυβο του πραγματικού κόσμου», είπε ο Oh. Αλλά αυτή, ο Schaldenbrand και ο Jim McCann, ένας ρομποτικός στο Carnegie Mellon που βοήθησε επίσης στην ανάπτυξη του FRIDA, πιστεύουν ότι η έρευνα αξίζει να συνεχιστεί για δύο λόγους: Θα μπορούσε να βελτιώσει τη διεπαφή μεταξύ ανθρώπων και μηχανών και θα μπορούσε, μέσω της τέχνης, να βοηθήσει στη σύνδεση των ανθρώπων ο ένας στον άλλον.

«Αυτά τα μοντέλα εκπαιδεύονται με βάση τα δεδομένα του καθενός», είπε ο McCann, αναφερόμενος στα μεγάλα γλωσσικά μοντέλα που χρησιμοποιούν ηλεκτρικά εργαλεία όπως το ChatGPT και το DALL-E. «Και έτσι εξακολουθώ να πιστεύω ότι ανακαλύπτουμε πώς έργα όπως αυτό, που χρησιμοποιούν τέτοια μοντέλα, μπορούν να προσφέρουν αξία πίσω στους ανθρώπους».

Το κενό sim-to-real παρέχει ένα εκπληκτικά δύσκολο πρόβλημα για τους ρομποτικούς και τους μηχανικούς υπολογιστών. Μερικά συστήματα τεχνητής νοημοσύνης μπορούν να απαριθμήσουν τα βήματα που περιλαμβάνει το περπάτημα (σφίξτε τον τετρακέφαλο και λυγίστε την κνήμη σας πίσω, γείρετε το βάρος σας προς τα πίσω και τεντώστε τον μέγιστο γλουτιαίο γλουτό) και μπορούν να κάνουν μια προσομοίωση σωματικής βόλτας σε έναν εικονικό κόσμο. Έτσι, είναι δελεαστικό να σκεφτούμε ότι αυτά τα συστήματα θα μπορούσαν εύκολα να κάνουν ένα φυσικό σώμα να περπατήσει στον πραγματικό κόσμο.

Οχι τόσο. Στη δεκαετία του 1980, ο επιστήμονας υπολογιστών Hans Moravec σημείωσε ότι η τεχνητή νοημοσύνη ήταν καλή στο να εμπλέκεται σε περίπλοκους συλλογισμούς και να αναλύει τεράστιες ποσότητες δεδομένων, αλλά ότι ήταν κακό σε απλές σωματικές δραστηριότητες, όπως το να μαζεύει ένα μπουκάλι νερό. Αυτό είναι γνωστό ως το παράδοξο του Moravec. (Η φυσική υπεροχή των ανθρώπων μπορεί να εξηγηθεί από τη μακρά εξελικτική ιστορία του σώματός μας· οι εργασίες που είναι απλές για εμάς υποστηρίζονται από εκατομμύρια χρόνια πειραματισμών του Δαρβίνου.)

Η ζωγραφική, η οποία συχνά αναμιγνύει ιδέες υψηλών αντιλήψεων και βασικές σωματικές ενέργειες, ανακουφίζει το παράδοξο: Πώς καταφέρνουμε να συλλάβουμε τον παραλογισμό της ανθρώπινης συνείδησης με τις κινήσεις ενός χεριού;

Εργαλεία δημιουργίας εικόνων AI όπως το Midjourney, το DALL-E και το Stable Diffusion εκπαιδεύονται τροφοδοτώντας νευρωνικά δίκτυα τεράστιες βάσεις δεδομένων εικόνων και αντίστοιχες περιγραφές κειμένου. Ο προγραμματισμένος στόχος είναι να μοντελοποιήσει τις σχέσεις μεταξύ των σημασιών των λέξεων και των χαρακτηριστικών των εικόνων και στη συνέχεια να χρησιμοποιήσει αυτές τις σχέσεις σε ένα «μοντέλο διάχυσης» για να δημιουργήσει πρωτότυπες εικόνες που διατηρούν το νόημα συγκεκριμένων περιγραφών. (Η προτροπή «Μια οικογένεια που κάνει πικνίκ στο πάρκο» θα δημιουργεί μια νέα εικόνα κάθε φορά που χρησιμοποιείται· καθεμία θα είναι κατανοητή ως οικογενειακό πικνίκ στο πάρκο.)

Αλλά τέτοιες εικόνες υπάρχουν μόνο στον κόσμο sim των υπολογιστών, που αποτελείται από εικονοστοιχεία διαφορετικής απόχρωσης και έντασης. Αφήστε την προσομοίωση και η εικόνα μένει πίσω.

Για να λύσουν αυτό το πρόβλημα, η Oh και οι συνάδελφοί της έλαβαν υπόψη τη φυσική κατάσταση της FRIDA. Κολλημένο σε έναν τοίχο στο εργαστήριό τους είναι ένα κομμάτι χαρτί με 130 διαφορετικές πινελιές σε μαύρο χρώμα: μπούκλες και γραμμές, μερικές μακριές και ίσιες, άλλες λίγο περισσότερες από τελείες. Τα σημάδια αντιπροσωπεύουν το εύρος της κίνησης του ρομπότ και προγραμματίστηκαν στο μοντέλο διάχυσής του.

«Φωτογραφίζουμε τις πινελιές, μοντελοποιούμε αυτή την αλληλεπίδραση και, στη συνέχεια, λαμβάνουμε μια πραγματικά ακριβή προσομοίωση πινελιών που βασίζεται στο τι μπορεί πραγματικά να κάνει το ρομπότ», είπε ο Schaldenbrand. Όταν του ζητηθεί, το μοντέλο θα δημιουργούσε μια εικόνα μιας μπαλαρίνας βατράχου σε pixel, αλλά μόνο σε διαμορφώσεις που ήταν δυνατόν να ζωγραφίσει το ρομπότ χρησιμοποιώντας αυτές τις 130 πινελιές.

Οι ερευνητές ανέπτυξαν έναν τρόπο για το ρομπότ να αποχωρεί περιστασιακά από τη ζωγραφική του, να μετράει πόσο κοντά ήταν στον στόχο που είχε δημιουργήσει σε pixel και στη συνέχεια να αναθεωρήσει αυτόν τον στόχο με pixel. Ένα παράξενο σημάδι θα μπορούσε να γίνει η κίνηση της μπαλαρίνας βατράχου που πηδάει ή το ανασηκωμένο φρύδι κάποιου από το κοινό της. Έτσι, κάθε μερικές δεκάδες πινελιές, η FRIDA απομακρυνόταν από τον καμβά, έβγαζε φωτογραφία τη μέχρι τώρα δουλειά της, σταματούσε και μετά επέστρεφε στη δουλειά της.

«Μπορεί να το κάνουν αυτό οι άνθρωποι καλλιτέχνες», είπε ο Oh. «Προσθέστε μερικές πινελιές και μετά επιστρέψτε και κοιτάξτε τον πλήρη καμβά και σχεδιάστε ξανά. Θέλαμε να μιμηθούμε αυτή τη διαδικασία». Μια διαδικασία καλλιτεχνικής αυτο-ανακάλυψης, κατά κάποιο τρόπο, έστω μηχανοποιημένη, αλγοριθμική και στατιστική.

Τα αποτελέσματα αυτών των μεθόδων εμφανίζονται στο εργαστήριο. Πορτρέτα καθηγητών, ιστορικές προσωπικότητες, τοπία, αστικά τοπία, αυτή η μπαλαρίνα βατράχου, όλα σε ένα ξεχωριστό, αφηρημένο στυλ – ακόμη και μια αυτοπροσωπογραφία του πρώτου ρομπότ FRIDA. Η συνέπεια των πινάκων υποδηλώνει ένα ενιαίο καλλιτεχνικό όραμα, για το οποίο οι Schaldenbrand, McCann και Oh αρνούνται να διεκδικήσουν τα εύσημα. Αποδίδουν κάθε ένα από τα έργα στην FRIDA.

Θα μπορούσε όμως η FRIDA να έχει ένα έργο χωρίς θέληση, καρδιά ή νύχια; Μπορεί ένα ρομπότ να είναι καλλιτέχνης;

Η Amy LaViers, επιστήμονας υπολογιστών και χορεύτρια που διευθύνει το Robotics, Automation and Dance Lab, μια ανεξάρτητη μη κερδοσκοπική οργάνωση, είπε ότι τέτοιες ερωτήσεις δεν θα φαινόταν τόσο τρελές ή τρομακτικές, αν οι άνθρωποι ήταν ανοιχτοί στο να διαλύσουν τη σκληρή διάκριση μεταξύ του καλλιτέχνη και του Μεσαίο. Τα πάντα – είτε πρόκειται για ακουαρέλα είτε για γεννήτριες εικόνων AI ή επιθυμία για εκφραστικότητα – είναι τυλιγμένα στην τέχνη. Ακόμη και κάτι τόσο απλό όσο το χρώμα μπορεί να φαίνεται ότι έχει το δικό του μυαλό και ένας ζωγράφος πρέπει να αντιδράσει στον τρόπο που γλιστράει στον καμβά. Ο LaViers πρότεινε να δούμε το FRIDA ως «ρομποτικό πινέλο», αντί για ένα ρομπότ ζωγραφικής.

«Υπάρχουν πράγματα που μπορείτε να κάνετε με τεχνητά σώματα που οι άνθρωποι δεν μπορούν να κάνουν», είπε. «Διευρύνει την παλέτα της ανθρώπινης έκφρασης».

Ο Oh τόνισε ότι οι άνθρωποι εξακολουθούσαν να ασχολούνται ουσιαστικά με τη ζωγραφική FRIDA. Προτρέπουν το μηχάνημα και αναμειγνύουν τα χρώματα, στήνουν τον καμβά και περιορίζουν τον αριθμό των συνολικών πινελιών σε κάθε κομμάτι. Τα σύνολα δεδομένων στα οποία εκπαιδεύονται η FRIDA και άλλες συσκευές παραγωγής εικόνων περιέχουν πίνακες και φωτογραφίες που έχουν δημιουργηθεί από άλλα άτομα. Αλλά, πρόσθεσε ο Ω, ο στόχος δεν ήταν ποτέ να φτιάξουμε κάτι που να ανταγωνιστεί ανθρώπους καλλιτέχνες. «Θέλουμε να προωθήσουμε την ανθρώπινη δημιουργικότητα», είπε. «Θέλουμε οι άνθρωποι να εκφράζουν τις σκέψεις τους με διαφορετικούς τρόπους».

Στο εργαστήριο, ο Schaldenbrand παρακολούθησε έναν πίνακα να αναδύεται αργά από τις σκόπιμες γκρι πινελιές της FRIDA: ένας ομιχλώδης δρόμος, τα σχήματα των αυτοκινήτων, τα πίσω φώτα. «Αυτό είναι δύσκολο να εξηγηθεί», είπε. «Δεν θέλω να δώσω κάποια λανθασμένη ιδέα ότι υπάρχει μια συνείδηση ​​που συμβαίνει εδώ. Αλλά μερικές φορές είναι διασκεδαστικό να προσποιείσαι».

Αυτό το άρθρο δημοσιεύθηκε αρχικά στους New York Times.

Από news