Home / Santé / Aider les machines à percevoir certaines lois de la physique – Actualite-sante

Aider les machines à percevoir certaines lois de la physique – Actualite-sante

#Sante

Les humains ont très tôt compris les lois de la réalité physique. Les bébés, par exemple, ont des attentes sur la manière dont les objets doivent bouger et interagir les uns avec les autres et seront surpris de faire quelque chose d'inattendu, comme disparaître dans un tour de magie.

Les chercheurs du MIT ont maintenant conçu un modèle qui démontre une compréhension de certaines "physique intuitive" de base sur la façon dont les objets doivent se comporter. Le modèle pourrait être utilisé pour aider à construire une intelligence artificielle plus intelligente et, à son tour, fournir des informations permettant aux scientifiques de comprendre la cognition du nourrisson.

Le modèle, appelé ADEPT, observe les objets se déplaçant autour d'une scène et permet de prédire comment ils doivent se comporter. basé sur leur physique sous-jacente. Lors du suivi des objets, le modèle émet un signal à chaque image vidéo qui correspond à un niveau de "surprise" – plus le signal est gros, plus la surprise est grande. Si un objet ne correspond jamais de façon spectaculaire aux prévisions du modèle, par exemple en disparaissant ou en se téléportant sur une scène, ses niveaux de surprise vont exploser.

En réponse à des vidéos montrant des objets bougeant de manière physiquement plausible et invraisemblable, le modèle enregistre les niveaux. d’étonnement équivalent aux niveaux rapportés par les humains qui avaient visionné les mêmes vidéos.

"À l’âge de 3 mois, les nourrissons ont la notion que les objets ne disparaissent pas et ne disparaissent pas et qu’ils ne peuvent plus se déplacer. les uns aux autres ou se téléportent ", explique le premier auteur Kevin A. Smith, chercheur au Département des sciences du cerveau et de la cognition (BCS) et membre du Centre pour les cerveaux, les cerveaux et les machines (CBMM). "Nous voulions capturer et formaliser ces connaissances pour transformer la cognition infantile en agents d'intelligence artificielle. Nous nous rapprochons maintenant de la ressemblance humaine dans la façon dont les modèles peuvent séparer des scènes de base non plausibles ou plausibles."

Joining Smith sur le papier sont les co-premiers auteurs, Lingjie Mei, étudiante au département de génie électrique et informatique, et le chercheur scientifique BCS, Shunyu Yao; Jiajun Wu PhD '19; Elizabeth Spelke, enquêteuse du CBMM; Joshua B. Tenenbaum, professeur de sciences cognitives computationnelles et chercheur en CBMM, BCS et au Laboratoire d'informatique et d'intelligence artificielle (CSAIL); et chercheur du CBMM, Tomer D. Ullman, Ph.D. 15.

Réalités incompatibles

ADEPT s’appuie sur deux modules: un module "graphique inverse" qui capture des représentations d’objet à partir d’images brutes et un "moteur physique" prédictif les représentations futures des objets à partir d'une distribution de possibilités.

Les graphiques inverses extraient essentiellement les informations des objets – telles que la forme, la pose et la vitesse – à partir des entrées de pixels. Ce module capture les images vidéo en tant qu'images et utilise des graphiques inverses pour extraire ces informations des objets de la scène. Mais cela ne s’embourbe pas dans les détails. ADEPT nécessite seulement une géométrie approximative de chaque forme pour fonctionner. Cela aide en partie le modèle à généraliser les prévisions à de nouveaux objets, et pas seulement à ceux sur lesquels il est formé.

"Peu importe si un objet est rectangulaire ou circulaire, ou s'il s'agit d'un camion ou d'un canard. ADEPT voit juste qu'il y a un objet avec une certaine position, se déplaçant d'une certaine manière, pour faire des prédictions ", dit Smith. "De même, les jeunes enfants ne semblent pas trop se préoccuper de propriétés telles que la forme lorsqu'ils font des prédictions physiques."

Ces descriptions d'objet grossier sont introduites dans un moteur physique – un logiciel simulant le comportement de systèmes physiques, tels que ou corps fluidiques, et est couramment utilisé pour les films, les jeux vidéo et l’infographie. Le moteur physique des chercheurs "pousse les objets dans le temps", explique Ullman. Cela crée une gamme de prédictions, ou une "distribution de croyances", pour ce qui va arriver à ces objets dans la trame suivante.

Ensuite, le modèle observe la trame suivante. Une fois encore, il capture les représentations d'objet, qu'il aligne ensuite sur l'une des représentations d'objet prédites à partir de sa distribution de croyance. Si l'objet obéissait aux lois de la physique, il n'y aurait pas beaucoup de décalage entre les deux représentations. Par contre, si l'objet faisait quelque chose d'implausible – disons, il disparaissait derrière un mur – il y aurait un décalage important.

ADEPT ré-échantillonne alors de sa distribution de croyances et note une très faible probabilité que l'objet ait tout simplement disparu. Si la probabilité est assez faible, le modèle enregistre une grande "surprise" sous forme de pic de signal. Fondamentalement, la surprise est inversement proportionnelle à la probabilité qu'un événement se produise. Si la probabilité est très faible, la pointe du signal est très élevée.

"Si un objet passe derrière un mur, votre moteur physique maintient la conviction qu'il est toujours derrière le mur. Si le mur tombe, rien ne se produit. là, il y a un décalage, "dit Ullman. "Ensuite, le modèle dit:" Il y a un objet dans ma prédiction, mais je ne vois rien. La seule explication est qu'il a disparu, donc c'est surprenant. ""

Violation des attentes

Dans psychologie du développement, les chercheurs exécutent des tests de "violation des attentes" dans lesquels des vidéos sont présentées à des bébés. Une vidéo montre un événement plausible, avec des objets adhérant à leurs notions attendues du fonctionnement du monde. L'autre vidéo est la même à tous égards, sauf que les objets se comportent d'une manière qui viole les attentes d'une manière ou d'une autre. Les chercheurs utiliseront souvent ces tests pour mesurer la durée pendant laquelle le nourrisson regarde une scène après une action invraisemblable. Les chercheurs pensent que plus ils restent longtemps, plus ils peuvent être surpris ou intéressés par ce qui vient de se passer

Pour leurs expériences, les chercheurs ont créé plusieurs scénarios basés sur des recherches classiques sur le développement pour examiner la connaissance des objets fondamentaux du modèle. Ils ont employé 60 adultes pour regarder 64 vidéos de scénarios connus plausibles et non plausibles. Les objets, par exemple, se déplaceront derrière un mur et, quand le mur tombera, ils seront toujours là ou seront partis. Les participants ont évalué leur surprise à différents moments sur une échelle croissante allant de 0 à 100. Les chercheurs ont ensuite montré les mêmes vidéos au modèle. Plus précisément, les scénarios ont examiné la capacité du modèle à capturer les notions de permanence (les objets n'apparaissent ou ne disparaissent pas sans raison), de continuité (les objets se déplacent sur des trajectoires connectées) et de solidité (les objets ne peuvent pas se déplacer l'un à l'autre).

ADEPT apparié les humains particulièrement bien sur les vidéos où les objets se sont déplacés derrière les murs et ont disparu lorsque le mur a été enlevé. Il est intéressant de noter que le modèle correspondait également à des niveaux de surprise sur des vidéos qui n’étaient pas surprenantes mais auraient dû l'être. Par exemple, dans une vidéo où un objet se déplaçant à une certaine vitesse disparaît derrière un mur et sort immédiatement de l'autre côté, il aurait pu s'accélérer de façon spectaculaire lorsqu'il est passé derrière le mur ou s'être téléporté de l'autre côté. En général, les humains et ADEPT étaient tous deux moins sûrs de savoir si cet événement était surprenant ou non. Les chercheurs ont également découvert que les réseaux de neurones traditionnels qui apprennent la physique à partir d'observations – mais ne représentent pas explicitement les objets – sont beaucoup moins précis pour différencier les scènes surprenantes des scènes sans surprise, et leurs choix pour les scènes surprenantes ne s'alignent pas souvent sur l'homme. [19659003] Ensuite, les chercheurs envisagent d’approfondir la façon dont les nourrissons observent et découvrent le monde, dans le but d’intégrer de nouvelles découvertes dans leur modèle. Des études, par exemple, montrent que les nourrissons jusqu’à un certain âge ne sont en réalité pas très surpris lorsque des objets changent complètement d’une manière ou d’une autre, par exemple si un camion disparaît derrière un mur mais revient sous forme de canard.

"Nous voulons pour voir ce qui doit encore être construit pour comprendre le monde davantage comme des enfants en bas âge et formaliser ce que nous savons de la psychologie pour construire de meilleurs agents d'IA », dit Smith.

Source

About Actus-sante

Check Also

Les infirmières dorment moins de 7 heures avant un quart de travail – 83 minutes de moins que les jours de congé – Actualite-sante

#Sante Les infirmières dorment près d'une heure et demie de moins avant les jours de …

Laisser un commentaire