Watson Speech to Text Review: Najlepšia prepisovacia služba s veľkým objemom?

Obsah:

Anonim

Watson je počítačový systém spoločnosti IBM na spracovanie prirodzeného jazyka. Je poháňaný známym superpočítačom odpovedajúcim na otázky a tiež radom podnikových produktov založených na umelej inteligencii vrátane Watson Speech to Text. V našej recenzii programu Watson Speech to Text sa pozrieme na jednu z najlepších aplikácií na prevod reči na text, ktorá je ideálna pre každého, kto chce prevádzať zvuk na text v mierke.

Platforma Watson na spracovanie reči je k dispozícii v IBM Cloud. Je to všestranný nástroj a dá sa použiť v mnohých kontextoch vrátane diktátu a prepisu konferenčného hovoru. Navyše je na rozdiel od väčšiny ostatných aplikácií s prevodom reči na text k dispozícii ako rozhranie API, ktoré vývojárom umožňuje okrem iného zabudovať ich do systémov hlasového ovládania.

Watson Speech to Text: Plány a ceny

Môžete použiť program Watson Speech to Text na spracovanie až 500 minút zvuku zadarmo mesačne. Ak chcete previesť viac než to, budete musieť zaplatiť za každú zvukovú minútu a rýchlosť sa bude meniť na základe trvania spracovaného zvuku. Náklady sa pohybujú od 0,01 USD do 0,02 USD za minútu. Ak požadujete vlastný jazykový model IBM, účtuje sa príplatok 0,03 USD za minútu. K dispozícii sú aj prémiové programy Watson určené iba na citáciu, ktoré umožňujú prístup k vylepšeným funkciám ochrany osobných údajov a zárukám nepretržitej prevádzky.

Cena služby Watson pre prevod reči na text je stanovená na základe objemu obsahu, ktorý je potrebné prepísať.

K systému Watson Speech to Text môžete získať prístup aj prostredníctvom predplatného IBM Cloud na všeobecné účely. Spracovanie prirodzeného jazyka je iba jednou aplikáciou v širokej škále služieb AI, ktoré môžete získať prostredníctvom IBM Cloud, takže je to dobrá voľba pre každú organizáciu, ktorá potrebuje prístup k vysokorýchlostným dátovým prenosom, chatbotom alebo nástrojom na prevod textu na reč.

Watson Speech to Text: Funkcie

Vďaka flexibilnej integrácii API a ďalším vopred zostaveným nástrojom IBM ide služba rozpoznávania reči Watson ďaleko nad rámec základného prepisu. Ak ho chcete použiť napríklad v kontexte služieb zákazníkom, je možné nastaviť program Watson Assistant na priame spracovanie otázok v prirodzenom jazyku alebo na telefonické odpovede.

Spoločnosť IBM vo Watson zostavila platformu na spracovanie prirodzeného jazyka bohatú na funkcie.

Watson pracuje so živým zvukom v 11 jazykoch a dokáže importovať zvuky v rôznych vopred zaznamenaných formátoch. Pri streamovaní podpora diagnostiky v reálnom čase znamená, že Watson môže vyzvať používateľov, aby sa priblížili k mikrofónu alebo zmenili svoje prostredie. Pôsobivá je tiež skutočnosť, že Watson dokáže rozlíšiť rôzne reproduktory v zdieľanej konverzácii vďaka funkcii Speaker Diarization, ktorá ešte stále prechádza beta testovaním.

Watson Speech to Text: nastavenie

Ak chcete používať Watson, je potrebné najskôr vytvoriť účet IBM Bluemix. Registrácia je bezplatná a bezbolestná a vyžaduje iba e-mailovú adresu a heslo. Po prihlásení musíte do svojho účtu pridať ustanovenie pre službu Speech to Text. V tejto fáze vám bude odovzdaných niekoľko poverení, ktoré by ste si mali uložiť do svojich vlastných záznamov.

Registrácia pre účet IBM Bluemix je nevyhnutná, aby ste získali prístup k úplnej sade funkcií Watson.

Potom sa veci výrazne skomplikujú. Ak chcete získať prístup k produktu Watson, budete musieť tieto poverenia pridať do dávky kódu klienta Uniform Resource Locator (CURL) a potom ho spustiť na svojom počítači. Ak sa chcete dozvedieť, aký príkaz chcete presne zavolať, pozrite si tohto praktického sprievodcu. Prípadne, ak sa chcete iba presvedčiť, ako dobre funguje systém Watson bez toho, aby ste museli skákať cez všetky tieto obruče, môžete to vyskúšať na ukážkovej stránke IBM.

Watson Speech to Text: Rozhranie

Na rozdiel od aplikácií hlasu na text zameraných na zákazníka sú služby spoločnosti Watson navrhnuté tak, aby k nim bol prístup cez API a kód zabudovaný do iných systémov. Z tohto dôvodu neexistuje skutočné „rozhranie“ spoločnosti Watson. Namiesto toho je k Watsonu možné získať prístup prostredníctvom troch rôznych internetových protokolov. Ide o WebSockets, REST API a Watson Developer Cloud.

Watson Speech to Text je možné spravovať prostredníctvom cloudového systému Watson Developer Cloud.

Ak chcete ovládať Watsona, budete musieť použiť nástroj príkazového riadku, ktorý sa pripája k cloudu IBM prostredníctvom jednej z týchto troch ciest. Rozhranie, ktoré vidí koncový používateľ interagujúci s Watsonom, bude musieť niekto z vášho vývojového tímu vytvoriť osobitne.

Watson Speech to Text: výkon

Celkovo na nás urobil dojem, že táto platforma na spracovanie prirodzeného jazyka zvládla skutočnú reč. Watson sme použili na prepis klipov, ktoré sme nahrali v rôznych náročných prostrediach, ako aj zvukových zvukov slávnych prejavov uvedených v niekoľkých podporovaných jazykoch Watsona.

Zistili sme, že Watson predvádzal dobre zaznamenané reči.

Aj keď chyby boli čoraz častejšie u klipov s veľkým šumom pozadia, vo všeobecnosti Watson priniesol neuveriteľne presné výsledky. Z našich testov odhadujeme, že k nevyspytaným chybám došlo v priemere iba raz za 150 slov. Ukázalo sa však, prečo funkcia Watson’s Speaker Diarization zostáva v testovaní BETA, pretože niekoľkokrát počas nášho hodnotenia bol jeden hlas nesprávne označený ako samostatný reproduktor.

Watson Speech to Text: Podpora

Centrum zdrojov IBM ponúka veľa dokumentácie na lepšie pochopenie toho, ako použiť Watson na konkrétny prípad použitia. Tiež stojí za to využiť integrácie API a SDK vytvorené komunitou vývojárov Watson a zverejnené na GitHub.

Stránka Watson API GitHub je dobrým zdrojom podpory pre službu Watson Speech to Text.

Ak tam nenájdete riešenie svojho problému, môžete sa obrátiť priamo na IBM otvorením lístka podpory alebo ich kontaktovať telefonicky. Pokiaľ ste sa rozhodli pre niektorý z prémiových balíkov Watson, bude vaše použitie Watson chránené dohodou o dobe prevádzky služby.

Watson Speech to Text: Konečný verdikt

Ak má vaša organizácia know-how a zdroje na správnu integráciu platformy IBM Watson Speech to Text do vášho systému, budete mať prospech z pokročilých funkcií, ako je diagnostika zvukového prostredia v reálnom čase a dočasné výsledky prepisu. Malé podniky a organizácie však budú zápasiť s technickou výzvou správneho nastavenia spoločnosti Watson.

Súťaž

Služba IBM Watson Speech to Text je priamym konkurentom služieb hromadného prepisu Google Cloud Speech-to-Text a Amazon Transcribe. Oba sú výrazne lacnejšie ako Watson, napríklad s prepisom Google Cloud sa začína na 0,006 USD za minútu. Všetky tri služby zdieľajú podobné funkcie, napríklad prispôsobenú slovnú zásobu, ale jednou z funkcií, ktorá IBM Watson veľmi chýba, ale je k dispozícii u oboch konkurentov, je automatické rozpoznávanie interpunkcie.

Hľadáte ďalšie riešenie typu spoeech-to-text? Prečítajte si nášho Sprievodcu softvérom s najlepším prevodom reči na text.