Anonim

I løbet af få uger vil fodboldspillende robotter fra hele verden konvergere på Eindhoven i Holland for at konkurrere om den prestigefyldte RoboCup 2013. Med omkring 2.500 deltagere er konkurrencen sikkert svært at se - bare se på finalen fra sidste års RoboCup i Mexico City.

Som du kan se, er de humanoide robotter ret avancerede. Så enhver teknologisk fordel, der giver et hold øverst, er et værdigt mål.

I månederne siden min sidste samtaleartikel om fodboldspilobotter har området humanoid robotik taget nogle store skridt fremad. Disse trin tager os nogensinde tættere på fremtiden, der er udstillet af Hollywood, hvor robotter er lige så almindelige som køleskabe eller bærbare computere.

Hver dag udvikler teams over hele verden humanoide robotter, der er i stand til at udføre katastrofebesøg. Langt over jorden udfører NASAs "Robonaut 2" dagligdags og farlige opgaver på den internationale rumstation, der sikrer sikkerheden for sine menneskelige kammerater.

En af de største udfordringer inden for robotik er at tage adfærd, som mennesker udfører ubevidst og at oversætte dem til maskiner og kode.

Et perfekt eksempel er udfordringen med "selvstændig lokalisering", som har været det nylige fokus i min samarbejdsforskning med University of Newcastles NUbots-gruppe.

Selv lokalisering - fra mennesker til robotter

Forestil dig at du er vågen i et tonehvidt rum, uden at du er kommet i hukommelse med, hvordan du ankom (ligesom planen for mange lavbudgettet horror-flicks).

Så snart lysene kommer på, vil du kigge rundt, behandle dine omgivelser og drage nogle konklusioner om, hvor du rent faktisk er. Måske er du midt i rummet eller i hjørnet, og måske er du lige overfor døren, der fører til din frihed.

Gennem disse observationer af funktioner i dit miljø har du bestemt din position i forhold til døren, hvilket er information, du har brug for for at kunne forlade. Dette er processen med "selv-lokalisering", og er noget, som et menneske ville gøre øjeblikkeligt og ubevidst.

For at adskille begrebet selv-lokalisering fra "kortlægning", overvej et enklere scenario, hvor du på forhånd får et kort over rummet.

Du er i stand til at inspicere kortet for at identificere nøglefunktionerne (f.eks. Døren eller telefonen), men har ingen idé om, hvor i værelset du vil vække. Ved opvågnen kan du straks søge efter disse funktioner (ignorerer alt andet), igen hjælpe med din flugt.

Løsning af dette problem uden et kort fører til et område med aktiv forskning kaldet "simultan lokalisering og kortlægning" (SLAM). Men det enklere scenario (hvor et kort er givet) er stadig utrolig komplekst at implementere på en autonom humanoid robot og involverer følgende store trin:

  1. Optagelse af billeder af miljøet ved hjælp af et kamera (ofte et simpelt webcam) og behandling af pixels for at identificere nøglefunktioner. I robotfotboldsscenariet omfatter disse statiske funktioner som målposter og feltlinjer, samt bevægelige funktioner som bolden
  2. Vurdering af afstanden og orienteringen af ​​disse nøglefunktioner i forhold til robotten
  3. Kombinere information fra den nuværende observation fra den foregående "positional belief", som indeholder information baseret på tidligere observationer, samt estimering fra robotten af, hvor langt det har flyttet i den pågældende periode. Kombinationen af ​​beviser og forudgående tro udføres af et "probabilistisk filter" og er illustreret i billedet nedenfor.

Hvert af disse store skridt har været fokus for meget forskning. Men vi indså for nylig, at et stort spørgsmål var overset: hvor skal robotten se ud? Mere konkret, hvis du vågner i et tonehvidt rum, og lysene tændes, hvad er den hurtigste og mest effektive måde at kigge rundt i rummet for at afgøre, hvor du er?

I lyset af tilstanden og fremragende resultater af moderne maskinindlæringsforskning var løsningen klar - lad robotten arbejde det ud for sig selv!

Motiveret forstærkning læring

Så hvad er den bedste måde for en robot at lære et iboende menneskeligt træk? Dette er et komplekst og uløste spørgsmål, men der er intuition i at forsøge at bedst replikere den proces, som et menneske ville lære.

Til dette arbejde blev såkaldt "motiveret forstærkningslæring" implementeret, som kombinerer traditionel forstærkningslæring med motivationsteori.

Simpelthen er forstærkningslæring en ramme, hvorved en agent (som robotten) kan bestemme en optimal politik (eller rækkefølge af handlinger) for at maksimere forventet belønning inden for nogle omgivelser (fodboldbanen). I dette scenario er problemet struktureret, så robotten bestemmer en politik med hovedbevægelser, der minimerer selv lokaliseringsfejl.

Motiveret forstærkning læring udvider denne ramme ved at have roboten søge "lignende-men-forskellige" erfaringer, når det ellers ikke kan bestemme en optimal handling. Denne adfærd er baseret på tanken om, at dyr søger "nyskabelse af fornemmelse", og er tidligere blevet anvendt til at studere udviklingen af ​​arkitektoniske design.

Tager et skridt tilbage, 2, 0

Som nævnt i min tidligere artikel favoriserer videnskaben enkelhed, og der er ofte fortjeneste at tage et skridt tilbage fra lærebogsmetoden til at løse et velkendt problem.

Problemet med selvlokalisering er ingen undtagelse, idet en optimeret hovedaktiveringspolitik viser sig at give en 11% forbedring i selvlokalisering.

Selv om dette måske ikke lyder så meget, har nyere forskning om forbedring af selvlokaliseringen ved at forbedre probabilistiske filtre (nævnt tidligere) vist, at forbedring af selv lokaliseringsnøjagtighed med kun 5 cm betyder en 14% forbedring i målene scoret (over 750 spil) .

Og det kunne bare være forskellen for at vinde os koppen.

Anbefalet Redaktørens Valg