Nový algoritmus MIT může předvídat lidské interakce dříve, než se dostanou do rozpaků

$config[ads_kvadrat] not found

Lana vs. Shayna Baszler: Raw, Nov. 9, 2020

Lana vs. Shayna Baszler: Raw, Nov. 9, 2020
Anonim

Naše neschopnost číst jiné lidi vedla k některým epickým neúspěšným pětinám a zmeškaným polibkům. I po celoživotní zkušenosti je těžké předvídat lidské interakce. Ale vědci z MIT Computer Science a Artificial Intelligence Laboratory si myslí, že mohou pomoci: S novým algoritmem hlubokého učení, který dokáže předvídat, kdy se dva lidé budou obejmout, políbit, potřást si rukou, nebo s vysokým pětem, udělali velký krok k budoucnosti požehnání bez těch nepříjemných okamžiků.

Doufají, že jejich nový algoritmus - vyškolený na 600 hodinách videí a televizních pořadů YouTube Kancelář, Křoviny, Teorie velkého třesku, a Zoufalé manželky - lze použít k programování méně sociálně nepříjemných robotů a vyvinout náhlavní soupravy ve stylu Google Glass, které nám navrhnou akce, než budeme mít šanci minout. V budoucnu si budou představovat, že se svým spolupracovníkem už nikdy neuberáte šanci vysílat pětici.

Uvědomit si, že roboti se učí být sociální ve stejných způsobech, jako jsme byli klíčem k úspěchu algoritmu. „Lidé se automaticky naučí předvídat akce skrze zkušenosti, což nás přimělo k tomu, abychom se pokoušeli napodobovat počítače stejným druhem zdravého rozumu,“ říká CSAIL Ph.D. student Carl Vondrick, první autor na souvisejícím papíru, který byl představen tento týden na mezinárodní konferenci o počítačovém vidění a rozpoznávání vzorů. „Chtěli jsme ukázat, že právě sledováním velkého množství videa mohou počítače získat dostatek znalostí, aby mohli důsledně předpovídat své okolí.“

Vondrick a jeho tým učili více „neuronových sítí“ algoritmu, aby analyzovali obrovské množství dat v tomto případě, hodiny pětiletého Jima a Pam a Mike a Susan skryté polibky. Když vezmeme v úvahu faktory jako např. Natažené ruce, zvednutou ruku nebo prodloužený pohled, každá z neuronových sítí odhadla, co se stane v příští sekundě, a obecný konsenzus sítí byl považován za poslední „předpověď“ studie.

Algoritmus to dostal přes 43 procent času. I když to nemusí být dostatečně vysoké, aby zaručilo, že naše každodenní interakce budou o něco méně podivné, je to velké zlepšení stávajících algoritmů, které mají přesnost pouze 36 procent.

Kromě toho mohou lidé předvídat jen 71% času. Potřebujeme veškerou pomoc, kterou můžeme získat.

V druhé části studie se algoritmus učil předpovídat, jaký objekt - domácí sitcom sešívačky, jako jsou dálkové ovladače, nádobí a popelnice - se objeví ve scéně o pět vteřin později. Pokud jsou například dveře mikrovlnné trouby otevřeny, je poměrně velká šance, že se vedle nich objeví hrnek.

Jejich algoritmus není zatím dostatečně přesný pro Google Glass, ale se spoluautorem Antonio Torralba, Ph.D. - financován z ceny fakulty Google a Vondrick s Google Ph.D. přátelství - můžeme vsadit, že se tam dostane. Budoucí verze algoritmu, Vondrick předpovídá, mohou být použity k programování robotů pro interakci s lidmi, nebo dokonce učit bezpečnostní kamery, aby se zaregistrovaly, když člověk spadne nebo se zraní.

„Video nemá rád knihu„ Vyberte si své vlastní dobrodružství “, kde můžete vidět všechny potenciální cesty,“ říká Vondrick. „Budoucnost je ve své podstatě nejednoznačná, takže je vzrušující vyzývat k tomu, abychom vyvinuli systém, který využívá těchto reprezentací k předvídání všech možností.“

$config[ads_kvadrat] not found