DeepMind A.I. Překlenuje mezeru mezi robotem a lidskými hlasy

How Google's DeepMind is Using AI to Tackle Climate Change

Umělá inteligence zněla hlasy robotů mnohem realističtěji.

DeepMind, který dříve prokázal sílu A.I. tím, že porazí lidského hráče na Go v březnu a snížit jeho účet za elektřinu v polovině v červenci, je nyní zaměřen na syntézu řeči.

Výzkumná skupina A.I, která je součástí mateřské společnosti Google Abeceda, dnes ráno odhalila, že vytvořila novou technologii nazvanou WaveNet, která může být použita pro generování řeči, hudby a dalších zvuků přesněji než dříve.

DeepMind vysvětluje, že mnoho existujících metod syntézy řeči se spoléhá na „velmi rozsáhlou databázi fragmentů krátkých řeči, které jsou zaznamenány z jediného reproduktoru a pak rekombinovány tak, aby vytvořily úplné promluvy.“ Na druhé straně WaveNet používá „surový průběh zvukového signálu Vytvořit realističtější hlasy a zvuky.

To znamená, že WaveNet pracuje s jednotlivými zvuky vytvořenými, když člověk mluví namísto použití úplných slabik nebo celých slov. Tyto zvuky jsou pak řízeny „výpočtově nákladným“ procesem, který DeepMind zjistil, že je „nezbytný pro generování komplexního realistického zvuku“ se stroji.

Výsledkem této práce je 50% zlepšení syntetizované řeči v angličtině a čínštině. Zde je příklad řeči generované pomocí parametrického převodu textu na řeč, který je dnes běžný a který DeepMind používá k prokázání, jak tato metoda syntézy řeči chybí:

Zde je příklad stejné věty vytvořené společností WaveNet:

Vzhledem k tomu, že společnosti pokračují ve své práci na rozhraních přirozeného jazyka, bude stále důležitější nabízet realističtější odpovědi. WaveNet může tento problém vyřešit.

Jak 'Steve Irwin' zavřel mezeru na pytlácích v Indickém oceánu

Siddharth Chakravarty je uzamčen v dramatickém pronásledování s pytláky driftnet v Indickém oceánu. Jako kapitán MV Sea Steve Irwin Sea Shepherd je zatím na svém posledním cíli: Loď, která používá nelegální driftnety k lovu žraloků a tuňáků. Během posledních několika dnů skupina aktivistů sledovala flotilu o ...

Kosatky napodobují lidské hlasy a jiné velryby v podivném záznamu

Možná jste slyšeli papoušky napodobující lidská slova, ale vědci říkají, že kosatka (Orcinus orca) může napodobovat zvuky další kosatky a člověka.

Americký hororový příběh: Kdo je medovina? Bates může být nejděsivějším televizním robotem

Fanoušci viděli jen dvě epizody Season 8 'amerického hororového příběhu' zatím, ale přehlídka už nabízí nějaké šílené zvraty. Přesně, kdo nebo co je Miriam Meadová? Jestli je nějakým robotem, jak bylo naznačeno ve druhé epizodě 'Apokalypsy', může patřit mezi nejděsivější televizní roboty v historii.