To je to, co se stane, když Donald Trump splňuje umělou inteligenci

$config[ads_kvadrat] not found

Twitter, Facebook flag Trump's election night post

Twitter, Facebook flag Trump's election night post
Anonim

Bradley Hayes, postdoktorandský spolupracovník na MIT, který dělá výzkum robotiky, právě obrátil Donalda „Drumpf“ Trumpa na robota. Naprogramoval rekurentní neuronovou síť - umělou inteligenci - aby studoval a emuloval projevy republikánského ish kandidáta.

Hayesova „denní práce“, říká, je „výzkum zaměřený na týmovou spolupráci mezi lidmi a roboty: navrhování algoritmů, které umožňují robotům spolupracovat s lidmi a učit se od nich, aby lidé mohli být bezpečnější, efektivnější, efektivnější při práci.“ @DeepDrumpf je „vedlejším projektem“. Částečně čerpal inspiraci z „fantastické skici“ Johna Olivera. („Snad to uvidí - doufejme, že to uvidí a ocení to.“)

Inverzní mluvil s Hayesem o tomto vlasteneckém úsilí.

Co vás ještě inspirovalo k vytvoření @Depeprum?

Vycházela z rozhovoru s některými mými kolegy z oběda, kteří také provádějí výzkum robotiky a zabývají se strojovým učením. Mluvili jsme o některých metodách statistického modelování, které byly skutečně relevantní pro náš výzkum.Ukazuje se, že stejná technika, která je za DeepDrumpf pracuje v mnoha oblastech robotiky, protože je to technika modelování, která se snaží naučit strukturu sekvenčních informací nebo sekvenčních dat. Přirozený jazyk je skvělým příkladem sekvenčních dat, kde struktura věty je poměrně konzistentní: existují pravidla a existuje základní struktura všech dat, která získáváte.

Zdědit 100 milionů? A nyní buduji po celém světě. A mám trochu cool.

- DeepDrumpf (@DeepDrumpf) 4. března 2016

Jiný výzkumník ve Stanfordu napsal kurz o neuronových sítích a zejména publikoval článek s názvem „Nepřiměřená efektivita rekurentních neuronových sítí“. lidé ukázali, že má tuto nepřiměřenou moc reprezentovat strukturu v tomto druhu volného textu textových dat.

Viděl jsem článek, který srovnával složitost řeči různých politických frontmanů. Článek říkal, jak Trump používá více zjednodušující jazyk, a je to obrovský hit s jeho hlasovací demografickou a jeho fanoušky. Z politického hlediska je to opravdu skvělé, protože to činí vaši zprávu jasnou a pochopitelnou co nejširšímu publiku; z hlediska strojového učení to znamená, že to může být nejvhodnější model, který můžeme udělat.

Slyšel jste o kódovacím jazyce nazvaném „Make Python Great Again“?

Víš, viděl jsem to včera. TrumpPython nebo něco takového? Viděl jsem to. Četl jsem o tom článek, šel jsem na jejich stránku GitHub, ale ještě jsem s ním neměl čas hrát. Ale vypadá to skvěle.

Můžeme se dozvědět něco o Trumpových lingvistických tendencích, nebo něco takového, z tvého A.I.

Jo, to je možné v tom smyslu, že když se podíváte na výstup z modelu, je to indikátor struktury, kterou se model z dat naučil. Takové druhy opakování, druhy věcí, které vycházejí z modelu, vám řeknou - potenciálně - o určitých věcech, které jsou vlastní jeho vzorům mluvení a jeho poselství.

Všichni řekli: „Nic nepotřebuju. Měli hroznou zemi a mají speciální infrastrukturu, naše země potřebuje bohatého.

- DeepDrumpf (@DeepDrumpf) 4. března 2016

Nemuseli byste to nutně dostat ze samotného účtu Twitter, hlavně proto, že Twitter vám poskytuje pouze 140 znaků. A protože tam není mnoho dat, která se dostala do modelu, a také částečně proto, že přepisy jsou z debat - kde kandidáti (a zejména Trump) mají tendenci se sami přerušovat - to je pro tyto diskontinuity ve výstupu.

Je třeba ještě trochu manuální práce, aby bylo možné z tohoto modelu v podstatě vyzkoušet stěnu textu a pak jím projít a vybrat nejlepší souvislý 140-znakový nugget, a pak to poslat.

Tohle je obchod. Naším prezidentem je Obamacare. teď, v tom je to, co to není. Děkuji mnohokrát. Nejsme roztleskávačka, kterou jsme zajímaví

- DeepDrumpf (@DeepDrumpf) 4. března 2016

Takže v tomto bodě to není příliš praktické?

Efektivně se učí jako rozdělení pravděpodobnosti a můžete z něj ochutnat. Co to znamená - máte svůj model a můžete ho požádat o dopis. A pokud se ho zeptáte na dostatek písmen v řadě, dá vám to věci, které se podobají angličtině. Nebo ještě lépe, některé z nich se podobají věcem, které Trump vlastně mohl říci - protože na něj bylo vycvičeno. Takže obecný proces, který jsem sledoval, je: Já bych z něj ochutnal, řekněme, 500 nebo 1000 znaků. Dalo by mi to jen stěnu textu s 500 nebo 1 000 postavami, myslím, ramblings, a pak z toho jen vyberu nejlepší 140-znakový blok, který dává smysl. Nebo nejlepší věta, která z toho vychází, se zdá být tak důležitá.

Například, včera v noci jsem ji používal k nějakému živému rozhovoru. A tak, jedna z věcí, které můžete udělat s modelem, jako je tento, můžete si to připravit. Jelikož vám tedy model dává pouze jednu postavu, má tuto závislost na postavách, které předcházely - písmena, která předtím vydávala. To je to, jak se učí slova, to je, jak zachycuje věty strukturu a určité prvky gramatiky.

Řekněme, že začnu s větou „Romney is“ a pak ji požádám o dalších tisíc znaků. Říkáme tomu priming. Poskytne to, co chce, ale nastaví počáteční část sekvence na „Romney je…“

Je to odkaz na ty tweety s hranatými frázemi?

Naprosto správně.

Romney je nástroj. Chci vám to říct. Nejspíš jsou to poslední, co potřebujeme v vůdci, to nemůžeme udělat.

- DeepDrumpf (@DeepDrumpf) 3. března 2016

Jednou z věcí, které doufám, že se mi to podaří, jakmile bude tento proces trochu čistší - a že to bude s více daty - je začít s ním pracovat s ostatními kandidáty. Pokud se podíváte na účet služby Twitter, následují ostatní primární kandidáti. Nakonec se na ně s nadějí začnou reagovat a možná je napadnou. Ale to je spíše víkendový projekt.

@realDonaldTrump Budou platit právě teď, a stejně jako absolutně. Jsem opravdu bohatý. Chci podporovat a mít je.

- DeepDrumpf (@DeepDrumpf) 3. března 2016

Můžete vysvětlit, co je rekurentní neuronová síť v zjednodušeném, nespecializovaném jazyce?

Jistě - zkusíme to. Obecně řečeno, neuronová síť přijímá nějaký vstup, pak to dělá nějakou matematiku uprostřed a dává vám výstup. Obecně je to jen klasifikátor. Daný nějaký vstup vám tedy řekne, která třída odpovídá vstupu. Populární příklad by byl - základní neurální síť - dáš jí obrázek kočky a chceš, aby ti to řekla - jestli je to jako kočka, pes nebo letadlo, nebo auto - chceš říci, že „Dobře - s velkou důvěrou - to je kočka, kterou jsi mi právě dal.“

Takže to je úkol klasifikace na vysoké úrovni. Jedná se o podobnou koncepci, ale místo toho, aby byla kočka, pes, auto, třídy jsou jednotlivá písmena abecedy a interpunkce. Takže je to vstup, a pak to dělá matematika na základě toho, co se dozvěděl - takže všechno učení se děje „uprostřed“, nazveme to - a na konci vám dává klasifikaci. Tak, jako, tento dopis.

Ta věc, která to dělá opakující se neuronová síť je, že výstup z předchozích kroků se dostane do dalšího kroku jako součást modelu. Skutečnost, že model mi poskytl „M“, se dostane do dalšího průchodu modelu. Tak by vám to mohlo dát „a“ a pak „k“ a pak „e“, protože se snaží dát „Udělat Ameriku znovu skvělou“, protože to je v údajích mnoho.

Jste obzvláště hrdý na všechny DeepDrumpf tweety tak daleko?

Jo, vlastně. Mám pár, který jsem ještě nezveřejnil, ale -

Výhradní.

Smích Přesně. Z těch, které jsou zveřejněny, jsem obzvláště spokojen s tím, co ISIS nepotřebuje.

ISIS nepotřebuje.

- DeepDrumpf (@DeepDrumpf) 3. března 2016

Podívejme se… Udělal jsem to s „nejsem rasistický, ale…“ a pokračování toho bylo „… věřte tomu,“ což jsem považoval za velmi vynikající. Chtěl jsem to ušetřit, když se to stalo relevantním.

Po těchto slovech nic dobrého nepřichází.

Raději byste hlasovali pro Donalda Trumpa nebo hlasovali pro @Depeprum?

Myslím, že s každou z těchto možností jsou kompromisy.

$config[ads_kvadrat] not found