Vigtigste Streaming Services AI lærer at snyde ved Q * bert på en måde, som intet menneske nogensinde har gjort før

AI lærer at snyde ved Q * bert på en måde, som intet menneske nogensinde har gjort før



En AI har formået at snyde med det bedste menneskeheden har at tilbyde efter at have opdaget en udnyttelse i det klassiske arkadespil Q * bert og kørt med det.

Mens tidligere iterationer af AI ville spille Q * bert korrekt, opdager det på et tidspunkt i sin læring af, hvordan spillet fungerer, en udnyttelse, der lader det samle op vanvittige point. Naturligvis gentager den processen, som enhver score-jagt-spiller, så den kan øge sin score på den mest effektive måde.

Du kan se AI arbejde rundt om platforme i videoen nedenfor. I første omgang ser det ud som om det springer uden mål mellem platforme. I stedet for at se spillet gå videre til næste runde, sidder Q * bert fast i en løkke, hvor alle dens platforme begynder at blinke - det er her, at AI derefter kan gå på en score-vanvid, der samler enorme point.

LÆS NÆSTE: En af de mest kontroversielle spilplader er endelig blevet miskrediteret

hvordan man fjerner klistermærker på snapchat

Hvordan AI vandt Q * bert-krigen

AI smadrede rekorden om titlen hele tiden og opnåede en umulig høj score takket være sin udviklingsstrategi algoritme programmering. Evolutionsstrategier (ES) adskiller sig fra den sædvanlige forstærkningslæring (RL), som traditionel AI bruger, da den ses som mere skalerbar på grund af sin generationsindlæring.

Hver læringssløjfe kaldes en generation, og den fortsætter sin opgave, indtil en bestemt betingelse er opfyldt (i dette tilfælde en høj score). Med hver efterfølgende generation absorberer AI viden fra den forrige generation og er derfor bedre til at nå det samme mål og overgå det. Fortsæt, og du ender med en AI, der er absolut uovertruffen i sin opgave. Det er præcis, hvad der skete her med Q * bert-score.

Skitseret i papiret , offentliggjort i sidste uge af forskere ved universitetet i Freiburg, Tyskland, ser det ud til, at bugten ikke var en kendt mængde. Faktisk, selvom de ikke er for overraskede over at finde fejlen, er det interessant at se, hvordan AI derefter gik videre og lærte at udnytte den hver gang den spillede for at maksimere sit scoringspotentiale.

LÆS NÆSTE: Denne kunstige intelligens har lært at mestre Super Mario Bros

For at finde fejlen måtte agenten først lære at gennemføre det første niveau næsten - dette blev ikke gjort med det samme, men ved hjælp af mange små forbedringer, forklarede forskerne til Registret . Vi formoder, at en af ​​afkomløsningerne på et eller andet tidspunkt i træningen stødte på fejlen og fik en meget bedre score sammenlignet med sine søskende, hvilket igen øgede sit bidrag til opdateringen - dens vægt var den højeste i det vægtede gennemsnit. Dette flyttede langsomt løsningen ind i rummet, hvor flere og flere afkom begyndte at støde på den samme bug.

Vi kender ikke de nøjagtige betingelser, under hvilke fejlen vises; det er muligt, at det kun vises, hvis agenten følger et mønster, der synes suboptimalt, [for eksempel når agenten spilder tid eller endda mister et liv]. Hvis det var tilfældet, ville det være ekstremt svært for standard RL at finde fejlen: Hvis du bruger inkrementelle belønninger, lærer du strategier, der hurtigt giver en vis belønning, snarere end læringsstrategier, der ikke giver mange belønninger i et stykke tid og så vind pludselig stort.

Se relaterede Dragster-mester Todd Rogers har lige mistet sin krone efter 35 år Denne kunstige intelligens har lært at mestre Super Mario Bros 1-2 i 17 dage Se denne AI lære at køre i GTA V på Twitch

På trods af botens vidunderlige resultater siger forskerne imidlertid ikke, at dette er en sag for at forkæmpe ES-læring over RL. Faktisk har begge systemer deres egne problemer, og en kombination af de to betragtes stort set som den bedste mulighed fremad.

Den samme ES-metode på andre Atari-spil skabte ikke nogenlunde nær de samme positive resultater. På den anden side er RL ansvarlig for at knuse poster til venstre, højre og center, herunder at slå verdens bedste GO-spiller. ES har dog stadig sin egen plads i tingene, og det er faktisk, hvordan Nvidia udfører meget af sin AI-træning, fordi det kræver mere beregningskraft, men opnår bedre resultater over en længere periode.

Uanset hvilken vej der bliver fremtiden for AI-udvikling, er i det mindste denne bot, der snyder systemet, ikke så slemt som dette nu vanæret videospil verdensmester .

Interessante Artikler

Redaktørens Valg

Sådan rettes, når VLC ikke kan åbne MRL
Sådan rettes, når VLC ikke kan åbne MRL
En af de mest almindeligt stødte fejl for VLC Media Player-brugere er en manglende evne til at åbne MRL-filen. Denne fejl opstår, når din computer ikke kan finde målmediefilen på lokale drev. Af og til er det pga
Hvad Voicemail er, og hvordan man konfigurerer det
Hvad Voicemail er, og hvordan man konfigurerer det
Voicemail er en digital talebesked, som en opkalder efterlader på en fastnettelefon, Android eller iPhone, når den person, der ringes op, er fraværende eller er optaget af en anden samtale.
Sådan finder du en Facebook-profil fra et billede eller et foto
Sådan finder du en Facebook-profil fra et billede eller et foto
At finde en Facebook-profil af en person kan være meget udfordrende, selvom du har et billede af dem. Faktisk kan du ikke slå en profil op på Facebook ved hjælp af billedsøgning, men der er en løsning, du kan
Aktivér live billedtekster til video og lyd i Google Chrome
Aktivér live billedtekster til video og lyd i Google Chrome
Sådan aktiveres live billedtekster til video og lyd i Google Chrome Google Chrome har modtaget muligheden for dynamisk at danne billedtekster til medieafspilning. Tidligere var denne funktion udelukkende tilgængelig på Googles helt egne Pixel-telefoner. Google gør det tilgængeligt på andre understøttede platforme i Chrome, inklusive Mac, Windows, Linux og Chrome OS.
Sådan konverteres en PDF-fil til et Google Doc
Sådan konverteres en PDF-fil til et Google Doc
Du har muligvis arbejdet med dit historie-essay i uger, og du er endelig klar til at aflevere det. Eller du har downloadet en PDF-publikation, og du vil foretage nogle ændringer i den. Nu starter spørgsmålene
To Firefox-udvidelser til finjustering af Find Bar, aktiver Highlight All, antal matches og andre tweaks
To Firefox-udvidelser til finjustering af Find Bar, aktiver Highlight All, antal matches og andre tweaks
I enhver browser er søgefeltet, der vises ved at trykke på Ctrl + F, meget nyttigt til hurtigt at finde ethvert ord eller fase på siden uden manuelt at søge efter det. Mozilla Firefox's Find Bar har manglet alvorligt nogle vigtige funktioner, især i nyere versioner af Firefox. Lad os se på to udvidelser, der tilføjer
Sådan bruges forskellige skrifttyper på Instagram
Sådan bruges forskellige skrifttyper på Instagram
Vil du tilføje nogle brugerdefinerede Instagram-skrifttyper? I så fald skal du ikke lede længere. I denne artikel vil vi vise dig, hvordan du bruger brugerdefinerede skrifttyper på Instagram-historier, indlæg og på din bio til at skabe dit indhold