Κωδικός Προγράμματος:
D.143
Επ. Υπεύθυνος:
ΒΟΥΡΟΣ ΓΕΩΡΓΙΟΣ
Κατηγορία:
ΕΘΝΙΚΑ
Φορέας Χρηματοδότησης:
ΕΛΙΔΕΚ
Ημερομηνία Έναρξης:
20/06/2024
Ημερομηνία Λήξης:
31/08/2026
Περιγραφή
Η εργασία αυτή αποσκοπεί στην προώθηση της συνεργασίας ανθρώπου-πράκτορα (HAC), δημιουργώντας επεξηγήσιμες μεθόδους DRL που επιτρέπουν στους πράκτορες να εκτελούν εργασίες σε συνεργασία με τον άνθρωπο σε σχέση με τις ανθρώπινες προτιμήσεις, τους περιορισμούς και τους στόχους, προωθώντας την αποτελεσματικότητα και την ασφάλεια κατά την εκτέλεση εργασιών. Για να αυξήσουμε την ευθυγράμμιση των πρακτόρων με τους ανθρώπους και την αποτελεσματικότητα της ομάδας, θα διερευνήσουμε τη μοντελοποίηση της ανθρώπινης συμπεριφοράς μέσω της εκμάθησης μίμησης, της εκμάθησης προτιμήσεων και της βελτιστοποίησης των περιορισμών. Για την περαιτέρω προώθηση της ασφάλειας στο πλαίσιο της HAC, η παρούσα εργασία αποσκοπεί στη διερεύνηση μεθόδων DRL που (α) ικανοποιούν τους περιορισμούς που σχετίζονται με το πλαίσιο, την εργασία και τον άνθρωπο για την επίλυση προβλημάτων και (β) παρέχουν εξηγήσεις σχετικά με τις αποφάσεις και τις ενέργειες των πρακτόρων, επιτρέποντας στους ανθρώπους να έχουν πλήρη επίγνωση της κατάστασης και των προθέσεων των πρακτόρων ανά πάσα στιγμή και, συνεπώς, να συμμετέχουν ενεργά ως συμπαίκτες. Οι νέες μέθοδοι που θα επινοηθούν θα αξιολογηθούν επίσης από την άποψη της επεκτασιμότητας, δηλαδή της ικανότητάς τους να υποστηρίζουν μεγάλες ομάδες πρακτόρων και ανθρώπων.
Τα περιβάλλοντα στα οποία θα αξιολογηθούν οι μέθοδοι θα είναι ευαίσθητα σε διάφορους περιορισμούς που θα πρέπει να τηρούνται από κάθε συνεργαζόμενο μέρος.