Recenzia Microsoft Azure: Špičkové spracovanie hlasu

Microsoft Azure Speech to Text je jednou z najvyspelejších platforiem na rozpoznávanie hlasu. Ako súčasť produktovej rady Microsoft Cognitive Speech Services využíva algoritmy hlbokého učenia na prekonanie nízkej kvality zvuku a dokáže sa prispôsobiť rôznym štýlom hovorenia kvôli presným zvukovým prepisom. V tejto recenzii reči na text Microsoft Azure sa tejto službe podrobne venujeme.

Stojí za zmienku, že Microsoft Azure Speech to Text nie je tradičnou súčasťou užívateľsky prívetivého diktátového softvéru. Namiesto toho sa jedná o platformu zameranú na vývojárov, ktorá má pomôcť podnikom vytvárať, testovať a spravovať svoje vlastné produkty. Ak chcete iba prepisovať dávku zvukových súborov, lepšou voľbou môžu byť alternatívne aplikácie využívajúce reč a text. Najlepšie alternatívy nájdete v našej Sprievodcovi softvérom s najlepším prevodom reči na text.

Microsoft Azure Speech to Text: plány a ceny

Pomocou Microsoft Azure Speech to Text môžete bezplatne prepisovať až päť hodín zvuku a vytvárať jeden vlastný hlasový model mesačne. V prípade bezplatného plánu je však k dispozícii iba jedna súbežná požiadavka na zvuk, čo znamená, že táto možnosť nie je pre väčšinu firiem použiteľná.

Fakturácia rečových služieb Azure je rozdelená na prírastky jednej sekundy.

Ak chcete prepisovať viac ako jeden rečový klip naraz, budete musieť inovovať na štandardný cenový systém Azure. To stojí 1 dolár za hodinu zvuku a podporuje až 20 súbežných požiadaviek. Ďalšie poplatky sú potrebné, ak potrebujete použiť vlastný zvukový model alebo prepis viackanálových zvukových súborov. Cena týchto extra služieb je 1,40 USD za zvukovú hodinu a 2,10 USD za zvukovú hodinu.

Aj keď spoločnosť Microsoft uvádza svoje ceny vo formáte „za zvukovú hodinu“, čo je priemyselný štandard, fakturácia je v skutočnosti rozdelená na prírastky jednej sekundy, takže nebudete platiť viac času na spracovanie, ako je potrebné.

Microsoft Azure Speech to Text: funkcie

Kľúčovou funkciou Azure Speech to Text je prístup, ktorý poskytuje výkonnému systému spoločnosti Microsoft na spracovanie prirodzeného jazyka. Za posledných pár rokov dosiahla rečová AI spoločnosti Microsoft niekoľko dôležitých míľnikov. To znamená, že teraz môže dokončiť úlohy, ktoré predtým pre službu rozpoznávania reči neboli možné, napríklad presný prepis konverzácie počas konverzácií v malých skupinách.

Služba Microsoft Azure Speech to Text sa môže integrovať s Office 365 pre optimálnu presnosť.

Azure pracuje s desiatkami jazykov a dialektov a dá sa trénovať - ​​pomocou vlastných modelov rozpoznávania reči - na lepšie prispôsobenie sa štýlu rozprávania používateľa, hluku v pozadí a slovnej zásobe. Ak sa vaša organizácia už zaviazala k ekosystému produktov spoločnosti Microsoft, môžete pomocou používateľských údajov Office 365 lepšie vylepšiť presnosť rozpoznávania reči pre výrazy špecifické pre organizáciu. A čo je dôležité, je to možné dosiahnuť bez toho, aby bolo ohrozené zabezpečenie vašich údajov, pretože reč na text sa dá spustiť lokálne.

Microsoft Azure Speech to Text: nastavenie

Microsoft Azure bol navrhnutý skôr pre vývojárov ako pre spotrebiteľov. To znamená, že jeho zavedenie je zapojený a trochu náročný postup, ktorý je najlepšie nechať na niekoho, kto má veľa technického know-how.

Nastavenie Azure nie je úplne jednoduché, pokiaľ nemáte skúsenosti s programovaním.

Najrýchlejší spôsob konfigurácie Azure je použitie súpravy Azure Speech SDK v programovacom jazyku, ako je Java alebo C ++. Na tento účel sa musíte zaregistrovať na bezplatný účet Azure a vo svojom vývojovom prostredí vytvoriť prázdny projekt. Potom budete musieť použiť program Microsoft Visual Studio a napísať krátky program na inicializáciu objektu Microsoft SpeechRecognizer.

Microsoft Azure Speech to Text: Rozhranie

Rovnako ako iné platformy na hromadný prepis, aj Microsoft Azure Speech to Text je určený na spustenie ako aplikačné programové rozhranie (API), pridaný k programom Office 365 alebo integrovaný do nových platforiem a služieb. Z tohto dôvodu neexistuje jediné rozhranie Azure Speech to Text. To, čo uvidí koncový používateľ, závisí od toho, ako bola integrovaná reč na text Azure.

Online portál Azure je intuitívny a ľahko použiteľný.

Medzitým vývojár spravujúci Azure tak urobí prostredníctvom online portálu Microsoft Azure, ktorý je moderný a ľahko sa v ňom orientuje. Vyhľadanie stránky zdrojov rečových služieb trvá len pár minút a po pridaní inštancie do vášho účtu je možné zobraziť výstrahy monitorovania a využitie v jednom okne.

Microsoft Azure Speech to Text: výkon

V rámci našej kontroly Microsoft Azure Speech to Text sme sa usilovali zistiť, ako táto platforma zvládla výzvu spracovania nespracovaných hlasových nahrávok, takže keď bol náš účet Azure pripravený na spustenie, nahrali sme sériu klipov s rôznou úrovňou šumu na pozadí . Plošne Azure odviedla dobrú prácu so spracovaním našich vzoriek, pretože sme v priebehu nášho hodnotenia nevideli viac ako niekoľko chýb.

Povolenie vlastného rečového modelu Azure zlepšilo našu presnosť prepisu.

Azure spočiatku mierne bojovala pri spracovávaní neobvyklých alebo špeciálnych fráz, ako sú názvy športových tímov a vedecké výrazy, čo sa však rýchlo vyriešilo povolením možnosti výstupu vlastného modelu. Keď sme túto možnosť aktivovali, Azure sa dokázalo prispôsobiť jedinečnému slovníku a štýlu hovorenia, ktoré sme používali.

Microsoft Azure Speech to Text: podpora

Ak sa chcete dozvedieť, ako komunikovať so súpravou Azure Speech Services SDK prostredníctvom rôznych programovacích jazykov, a integrovať funkcie reči do textu Azure do svojej vlastnej platformy, budete určite potrebovať pomoc. Spoločnosť Microsoft našťastie vytvorila komplexný katalóg školiacich materiálov pre platformu Azure, v ktorom nájdete príklady kódov a užitočné tipy.

Školiaca časť webu Azure obsahuje veľa užitočných zdrojov.

Všetci zákazníci Azure tiež dostanú bezplatnú podporu fakturácie a správy predplatného, ​​ku ktorej je možné získať prístup prostredníctvom lístkového systému. K vášmu účtu je možné pridať podrobnejšiu podporu za opakujúci sa poplatok, ktorý začína na 29 USD mesačne.

Microsoft Azure Speech to Text: Konečný verdikt

Platforma Azure Speech to Text využíva najmodernejšie technológie na poskytovanie takmer dokonalej prepisovej služby. Je to najvhodnejšie pre podniky, ktoré už investujú do ekosystému Microsoft Office 365, pretože vlastné modely hlasu a slovnej zásoby je možné bezpečne generovať z vášho existujúceho archívu dokumentov. Niektoré malé podniky môžu mať problémy s Azure, pretože jeho správne nastavenie si vyžaduje pozornosť kvalifikovaného vývojára cloudových služieb spoločnosti Microsoft.

Súťaž

Amazon Transcribe, Google Cloud Speech-to-Text a Watson Speech to Text sú priamymi konkurentmi spoločnosti Microsoft Azure. Všetky tieto tri platformy sú tiež schopné presne vykonávať hromadné prepisy dávok. Google Cloud je jediný blízky konkurent schopný pracovať s viacerými jazykmi ako Azure, ale je nákladnejší, so začiatočnou sadzbou iba 0,006 USD za 15 sekúnd, v porovnaní s 0,017 USD za minútu (0,00425 USD za 15 sekúnd).

Ak chcete nájsť ďalšie alternatívy k programu Microsoft Azure Speech to Text, prečítajte si nášho Sprievodcu softvérom s najlepším prevodom reči na text.

Zaujímavé články...