DeepMind A.I. Překlenuje mezeru mezi robotem a lidskými hlasy

$config[ads_kvadrat] not found

How Google's DeepMind is Using AI to Tackle Climate Change

How Google's DeepMind is Using AI to Tackle Climate Change
Anonim

Umělá inteligence zněla hlasy robotů mnohem realističtěji.

DeepMind, který dříve prokázal sílu A.I. tím, že porazí lidského hráče na Go v březnu a snížit jeho účet za elektřinu v polovině v červenci, je nyní zaměřen na syntézu řeči.

Výzkumná skupina A.I, která je součástí mateřské společnosti Google Abeceda, dnes ráno odhalila, že vytvořila novou technologii nazvanou WaveNet, která může být použita pro generování řeči, hudby a dalších zvuků přesněji než dříve.

DeepMind vysvětluje, že mnoho existujících metod syntézy řeči se spoléhá na „velmi rozsáhlou databázi fragmentů krátkých řeči, které jsou zaznamenány z jediného reproduktoru a pak rekombinovány tak, aby vytvořily úplné promluvy.“ Na druhé straně WaveNet používá „surový průběh zvukového signálu Vytvořit realističtější hlasy a zvuky.

To znamená, že WaveNet pracuje s jednotlivými zvuky vytvořenými, když člověk mluví namísto použití úplných slabik nebo celých slov. Tyto zvuky jsou pak řízeny „výpočtově nákladným“ procesem, který DeepMind zjistil, že je „nezbytný pro generování komplexního realistického zvuku“ se stroji.

Výsledkem této práce je 50% zlepšení syntetizované řeči v angličtině a čínštině. Zde je příklad řeči generované pomocí parametrického převodu textu na řeč, který je dnes běžný a který DeepMind používá k prokázání, jak tato metoda syntézy řeči chybí:

Zde je příklad stejné věty vytvořené společností WaveNet:

Vzhledem k tomu, že společnosti pokračují ve své práci na rozhraních přirozeného jazyka, bude stále důležitější nabízet realističtější odpovědi. WaveNet může tento problém vyřešit.

$config[ads_kvadrat] not found