Машина језика: како Сири покупи свој глас?
Макрадар Од технологије / / December 19, 2019
Гоогле Аппле, Мицрософт и чак Амазон се активно развијају своје гласовне услуге. Свеже печена на иОС-у 7 је иста Сири само нове функције и... глас. Да ли се питате како је тај процес? Као рачунари уче говор? ово права уметност.
За сваки од воицес Сири - ваш глумац. Када је завршио своју улогу у артикулације, рад је тек почела... Човеков глас наставља свој пут. Прича о овом путовању, и од људи и робота - један од најкомплекснијих технолошких процеса, који не може бити извршена пре десет година.
Хајде да се упознају са директором дизајн и развој говорног Нуанце, то је једна од највећих независних компанија у свету које се баве препознавање говора и текста у говор. Брант Вард (Ј. Брант је Ворд) је некада био композитор, компонује забаву за гудачких квартета у синтисајзера, а сада га саставља помоћу синтетичких гласове. Он ради у индустрији синтезе говора у Силиконској долини већ више од деценије.
Текст у говор - веома конкурентној индустрији, и њених запослених је веома тајанствен. Иако у свету и сматра да Нуанс ствара глас Сири за Вард и његов колега Дејвид Васкес (Дејвид Васкез) избегне директан одговор. Ипак, они су се сложили да објасни, макар у општим цртама, како је процес стварања невероватних машина гласова.
Непотребно је рећи, нема потребе да артикулишу и писати сваку реч из речника. Али када је у питању апликације, који треба читати никаквих вести у билтен, или наћи нешто за тебе на Интернету, то је једноставно дужна да говори сваку реч у речнику.
Већина предлога се бирају на "богатство фонетике" - то јест, они садрже различите комбинације фонема. "Чињеница је, што више података које имамо, више реалан резултат ће бити," - каже Ворд.
Након што је текст се снима уживо гласовни глумац (напоран процес који може трајати неколико месеци), веома тежак посао почиње. Речи и реченице су анализирани, подељени по категоријама и евидентира у великој бази података. У овом сложеном послу учествовао тим посвећених лингвиста, као и користе свој језички софтвер.
Када се све ово уради, јединица Нуанце превести текст у говор ствара битне речи и фразе које глумац може Ја никада нисам изговорио, али то звучи веома сличан говор глумца, јер технички је глас глумац.
Процес говори је у несвести. Ми то радимо без размишљања о томе како настаје овај процес: ситуација у којој је наш језик, који односи се граде између фонема, и тако даље - да једноставно и ефикасно изразити сложене идеје и емоције. Али, да би се рачунар покупили звук људских гласова, сви ови фактори се морају узети у обзир. Као један професор лингвистике, је задатак "Титаника".
Не треба да мислите: "Говорим са рачунаром." Ви уопште не треба да размишља о томе.
"Моја деца Интерацт са од Сири, као да је живо биће... Они не осећају разлику," - каже Ворд.
До сада, и на пријатељству између људи и робота - као што су људи. Многи људи би желели да Сири може да препозна емоционално стање говорника, и некако реаговати на њу (на пример, укључују режим Пријатан глас). Замислите - да разговара са роботом, који вас морално Пат на глави. Можда, нуанце већ размишља о томе ...