Машина език: как Siri улавя гласа си?
Makradar От технологии / / December 19, 2019
Google, Apple, Microsoft, Amazon и дори активно се разработват свои гласови услуги. Прясно изпечени на IOS 7 е една и съща Siri, само нови функции и... гласа. Питате ли се как е този процес? С навлизането на компютрите се преподават словото? това истинско изкуство.
За всеки един от гласовете Siri - си актьор. След като приключи своята роля във формирането, работата тепърва започва... гласът на мъжа продължава своя път. Историята на това пътуване, и човек и робот - един от най-сложните технологични процеси, които не са могли да се извърши преди десет години.
Нека да се запознаят с директора на проектиране и разработване на глас Nuance, той е един от най-големите независими компании в света, които се занимават с разпознаване на реч и текст в реч. Брант Уорд (J. Брант Ward), използвани за да бъде композитор, съставяне на партията за струнни квартета на синтезатори, а сега той я композира чрез използване на синтетични гласове. Работи в речта синтез индустрия в Силиконовата долина за повече от десетилетие.
Текст в реч - много конкурентна индустрия, и нейните служители е много потаен. Въпреки, че на света и вярва, че Nuance създава гласа на Siri за Уорд и колегата му Дейвид Васкес (David Васкес) избягване на директен отговор. Независимо от това, те се съгласиха да се обясни, поне в общи линии, как процеса на създаване на невероятни машини гласове.
Излишно е да казвам, няма нужда да се формулират и пишат всяка дума от речника. Но когато става въпрос за прилагането, който следва да се чете някакви новини в бюлетина си, или да намерят нещо за вас в интернет, тя е просто длъжен да говори всяка дума в речника.
Повечето от предложенията са избрани за "богатство фонетика" - това е, те съдържат много различни комбинации от фонеми. "Факт е, че с толкова повече информация имаме, толкова по-реалистичен резултатът ще бъде", - казва Уорд.
След текста е записан на живо актьор глас (досаден процес, който може да отнеме няколко месеца), започва много упорита работа. Думи и изречения се анализират, разделени по категории и се записва в една голяма база данни. В тази сложна работа включваше екип от лингвисти, както и използването на техните собствени езикова софтуер.
Когато всичко това се прави, устройството на Nuance за превод на текст в реч създава битови думи и фрази, че актьорът може Аз всъщност никога не изрече, но това звучи много подобно на изказването на актьора, защото технически това е гласът актьор.
Процес говорене е в безсъзнание. Правим го, без да мисли за това, как се случва този процес: ситуацията, в която е нашият език, който взаимоотношения са изградени между фонеми, и така нататък - за лесно и ефективно да изразяват сложни идеи и емоции. Но, за да може компютърът вдигна звука на човешки гласове, всички тези фактори трябва да бъдат взети под внимание. Като един професор по лингвистика, е задачата на "Титаник".
Не трябва да мислите: "Аз говоря с компютър." Вие по принцип не трябва да се мисли за това.
"Моите деца взаимодействат с на Siri, като че ли е живо същество... Те не се чувстват разликата", - казва Уорд.
Досега, както и за приятелството между хората и роботите - като хора. Много хора ще го харесат, ако Siri може да разпознава емоционалното състояние на говорещия, и по някакъв начин реагират на него (например, включва режим на глас успокояващо). Представете си - да говори с робот, който се морално ви потупа по главата. Може би, Nuance вече мисли за него ...