Balso atpažinimo programa rusų kalba. Kalbos atpažinimo programinė įranga

Bene patogiausia teksto transkribavimo priemonė, skirta Windows ir Mac OS, jungianti garso grotuvą ir teksto rengyklę. Veikimo principas labai paprastas – į programą įkelkite garso failą, klausykite jo naudodami klaviatūros karštuosius klavišus (galite juos priskirti patys) ir vienu metu įrašykite tekstą. Atkūrimo greitis ir garso garsumas taip pat valdomi klaviatūra. Taigi, jūsų rankos nuolat yra ant klaviatūros ir nereikia naudoti pelės ar perjungti skirtingų programų. Atminkite, kad įtaisytasis teksto rengyklė neatpažįsta klaidų ir neturi daug kitų žinomų funkcijų, pavyzdžiui, brūkšnelių perjungimo brūkšneliais. Tačiau kartu su „Express Scribe“ galite naudoti kitus teksto redaktorius, naudodami sparčiuosius klavišus garso atkūrimui valdyti. Programa yra shareware, visa kaina: 17-50 USD.


02. Perrašytojas pro



Rusų kalba skirta „Windows“ programa, leidžianti klausytis ne tik garso, bet ir peržiūrėti vaizdo failus. Integruota teksto rengyklė turi galimybę įrašyti laiko žymes ir pašnekovų vardus. Gautą tekstą galima importuoti į „interaktyvius nuorašus“, taip pat taisyti kaip grupės projekto dalį. Programą galima įsigyti tik su metine prenumerata, kaina yra 689 rubliai per metus.


03.RSplayer V1.4



Paprasta programa, skirta apdoroti ir perrašyti garso failus, palaikanti sparčiuosius klavišus ir galimybe įvesti tekstą Microsoft Word. Skirtingai nuo ankstesnių panašių programų, ją galima atsisiųsti nemokamai, tačiau naujose „Windows“ versijose ji yra nestabili.

04. Voco

Profesionali „Windows“ programa, skirta kalbos konvertavimui į tekstą. Palaiko rašymą balsu bet kurioje bandomojoje naršyklėje, turi didelę teminių žodynų kolekciją ir nereikalauja interneto ryšio kalbos atpažinimui. Išplėstinės versijos „Voco.Professional“ ir „Voco.Enterprise“ gali dirbti su jau paruoštais garso failais. Vienintelis trūkumas yra didelė programos kaina.


05. Drakono diktatas



Nemokama mobilioji programėlė, skirta diktuojamos kalbos atpažinimui. Programa gali atpažinti apie 40 kalbų ir jų atmainų, leidžia redaguoti tekstą ir siųsti į paštą, socialinius tinklus arba nukopijuoti į mainų sritį. Kad veiktų, reikalingas interneto ryšys.


06.RealSpeaker



Unikali programa, galinti atpažinti ne tik garso failus, bet ir į kamerą pasakytą gyvą kalbą. Dėl specialaus vaizdo plėtinio RealSpeaker nuskaito lūpų judesius, taip pagerindamas kalbos atpažinimo procesą iki 20-30%, lyginant su kitais panašiais algoritmais. Šiuo metu programa palaiko 11 kalbų: rusų, anglų (amerikiečių ir britų tarmės), prancūzų, vokiečių, kinų, korėjiečių ir japonų, turkų, ispanų, italų ir ukrainiečių. Programa platinama sąlyginai nemokamai, kaina priklauso nuo prenumeratos laiko, amžinoji versija kainuoja apie 2 tūkstančius rublių.

Mūsų šiuolaikiniame, įvykių kupiname pasaulyje darbo su informacija greitis yra vienas iš kertinių sėkmės akmenų. Tai, kaip greitai gauname, sukuriame, apdorojame informaciją, priklauso nuo mūsų darbo našumo ir produktyvumo, taigi ir nuo tiesioginės materialinės gerovės. Tarp įrankių, galinčių padidinti mūsų darbo galimybes, svarbią vietą užima kalbos vertimo į tekstą programos, kurios gali žymiai padidinti mums reikalingų tekstų įvedimo greitį. Šiame straipsnyje papasakosiu, kokios yra populiarios garso balso vertimo į tekstą programos ir kokios yra jų funkcijos.

Dauguma šiuo metu egzistuojančių balso vertimo į tekstą programų yra mokamo pobūdžio, keliančios nemažai reikalavimų mikrofonui (tuo atveju, kai programa skirta kompiuteriui). Griežtai nerekomenduojama dirbti su mikrofonu, įmontuotu internetinėje kameroje, taip pat įdėtu į standartinį nešiojamojo kompiuterio dėklą (tokių įrenginių kalbos atpažinimo kokybė yra gana žema). Be to, labai svarbu, kad aplinka būtų rami, be nereikalingo triukšmo, kuris gali tiesiogiai paveikti jūsų kalbos atpažinimo lygį.

Tuo pačiu metu dauguma šių programų gali ne tik kalbą paversti tekstu kompiuterio ekrane, bet ir balso komandomis valdyti kompiuterį (paleisti programas ir jas uždaryti, gauti ir siųsti el. laiškus, atidaryti ir uždaryti svetaines). , ir taip toliau).

Programa iš kalbos į tekstą

Pereikime prie tiesioginio programų, kurios gali padėti verčiant kalbą į tekstą, aprašymo.

Programa "Laitis"

Nemokama rusų kalba sukurta balso atpažinimo programa „Laitis“ pasižymi gera kalbos supratimo kokybe ir, pasak jos kūrėjų, gali beveik visiškai pakeisti vartotojui pažįstamą klaviatūrą. Programa taip pat gerai veikia su balso komandomis, todėl su jų pagalba galite atlikti daugybę veiksmų, kad galėtumėte valdyti kompiuterį.

Kad programa veiktų, reikalingas privalomas didelės spartos interneto ryšys kompiuteryje (programa naudoja balso atpažinimo tinklo paslaugas iš Google ir Yandex). Programos galimybės taip pat leidžia valdyti naršyklę balso komandomis, kurioms žiniatinklio naršyklėje reikia įdiegti specialų plėtinį iš Laičio (Chrome, Mozilla, Opera).

„Dragon Professional“ – garso įrašų transkripcija į tekstą

Šio rašymo metu skaitmeninis produktas anglų kalba « „Dragon Professional Individual“ yra vienas iš pasaulyje pripažintų tekstų kokybės lyderių. Programa supranta septynias kalbas (iki šiol tik „Dragon Anywhere“ mobilioji programa veikia su rusų kalba ir), turi aukštos kokybės balso atpažinimą ir gali atlikti daugybę balso komandų. Tuo pačiu šis gaminys turi išskirtinai mokamą charakterį (pagrindinės programos kaina – 300 JAV dolerių, o už „naminę“ Dragon Home produkto versiją pirkėjas turės sumokėti 75 JAV dolerius).

Kad šis „Nuance Communications“ produktas veiktų, reikia sukurti savo profilį, kuris yra skirtas pritaikyti programos galimybes prie jūsų balso specifikos. Be tiesioginio teksto diktavimo, galite išmokyti programą vykdyti daugybę komandų, todėl sąveika su kompiuteriu tampa dar nuoseklesnė ir patogesnė.

„RealSpeaker“ – itin tikslus kalbos atpažinimo įrenginys

Balso pavertimo tekstu programa „RealSpeaker“, be standartinių tokio tipo programų funkcijų, leidžia naudotis kompiuterio internetinės kameros galimybėmis. Dabar programa ne tik skaito garso garso komponentą, bet ir užfiksuoja kalbėtojo lūpų kampų judesius, taip teisingiau atpažindama jo tariamus žodžius.


„RealSpeaker“ skaito ne tik garsą, bet ir vaizdinį kalbos proceso komponentą

Programa palaiko daugiau nei dešimt kalbų (įskaitant rusų), leidžia atpažinti kalbą, atsižvelgiant į kirčius ir dialektus, leidžia perrašyti garsą ir vaizdo įrašus, suteikia prieigą prie debesies ir dar daugiau. Programa yra shareware, už mokamą versiją turėsite sumokėti gana tikrus pinigus.

„Voco“ - programa greitai išvers balsą į tekstinį dokumentą

Kitas balso į tekstą konverteris yra mokamas Voco skaitmeninis produktas, kurio „namų“ versijos kaina dabar yra apie 1700 rublių. Pažangesnės ir brangesnės šios programos versijos – „Voco.Professional“ ir „Voco.Enterprise“ turi nemažai papildomų funkcijų, iš kurių viena yra vartotojui prieinamas kalbos atpažinimas iš garso įrašų.

Tarp „Voco“ ypatybių pažymiu galimybę papildyti programos žodyną (dabar programos žodyne yra daugiau nei 85 tūkst. žodžių), taip pat jos veikimą neprisijungus iš tinklo, o tai leidžia jums nepasikliauti savo interneto ryšį.


Tarp „Voco“ privalumų yra didelis programos mokymosi gebėjimas

Programėlė įsijungia gana paprastai – tereikia du kartus spustelėti klavišą „Ctrl“ Programėlė visiškai nemokama, palaiko kelias dešimtis kalbų, įskaitant rusų.

Išvada

Aukščiau išvardijau programas, skirtas jūsų garso balso įrašui paversti tekstu, aprašiau jų bendrą funkcionalumą ir būdingas savybes. Dauguma šių produktų paprastai yra mokamo pobūdžio, o rusakalbių programų asortimentas ir kokybė yra prastesnės nei analogų anglų kalba. Dirbant su tokiomis programomis rekomenduoju ypatingą dėmesį skirti savo mikrofonui ir jo nustatymams – tai svarbu kalbos atpažinimo procese, nes blogas mikrofonas gali paneigti net aukščiausios kokybės programinę įrangą tokio tipo, kokį svarsčiau.

Yra dviejų tipų kalbos atpažinimo programos:

1. Pririštas prie garsiakalbio – šios programos nuolat mokosi ir laikui bėgant pradeda vis geriau suprasti „savo šeimininko“ balsą. Kuo dažniau vartotojas dirba programoje, tuo geriau jį supranta. Laimei, mokymasis vyksta gana greitai – maždaug po 20 minučių programa išmoks jus gana gerai suprasti.

2. nepriklausomas nuo garsiakalbio – galima iškart pradėti kalbėti – programa reaguos į balso komandas. Skirtingai nuo pirmojo tipo, šioms programoms nereikia išmokti jus suprasti. Priešingai, jūs turite išmokti kalbėti, kad programa jus suprastų.

Kam skirta kalbos atpažinimo programa, naudojama kompiuteryje?

Nemanykite, kad jei įdiegsite kalbos atpažinimo programą, jums nebereikės klaviatūros ir pelės, tačiau dirbti kompiuteriu bus daug lengviau.

1. Diktantas – kalbos atpažinimo programų pagalba daugelis vartotojų diktuoja dokumentų tekstus. Ši galimybė aktuali, pavyzdžiui, gydytojams, atliekantiems tyrimą (per kurį dažniausiai būna užimtos rankos) ir tuo pačiu fiksuojantiems jo rezultatus. Paprastam vartotojui, kuriam dėl kokių nors priežasčių sunku įvesti tekstą (arba tiesiog pernelyg tingus), tai taip pat gali būti naudinga.

2. Komandų įvedimas – kompiuterių vartotojai gali naudoti „atpažinimą“ komandoms įvesti, tai yra, ištartą žodį sistema suvoks kaip pelės paspaudimą. Vartotojas duoda komandas: „Atidaryti failą“, „Siųsti laišką“ arba „Naujas langas“ ir kompiuteris atlieka atitinkamą veiksmą. Tai ypač aktualu žmonėms su negalia – vietoj pelės ir klaviatūros jie galės valdyti kompiuterį balsu.

Ko reikia norint atpažinti kalbą?

1. Kalbos atpažinimo programa – angliškai kalbantys Windows vartotojai gali naudoti, pavyzdžiui, Dragon Naturally Speaking arba IBM Via Voice. Rusų kalbą supranta Gorynych ir Dictograph programos. Kalbos atpažinimas jau integruotas į „Windows Vista“ operacinę sistemą.

2. Mikrofonas arba ausinės (ausinės ir mikrofono hibridas) – žodžių „pataikyti“ į kompiuterį.

3. Pakankamai galingas kompiuteris – kad kalbos atpažinimo funkcija veiktų, kompiuteris nebūtinai turi būti itin greitas. Pakanka 1 GB operatyviosios atminties (Windows Vista geriau turėti 2 GB) ir procesoriaus taktinio dažnio bent 1 GHz.

Kurie įrenginiai naudoja kalbos atpažinimą?

Kalbos atpažinimo funkcija gali būti naudojama ne tik kompiuteryje, bet ir daugelyje kitų įrenginių. Tai ypač aktualu, jei „programėlė“ turi kompaktišką klaviatūrą su mažais klavišais (arba jų visai nėra).

1. Mobilieji telefonai – jau keletą metų egzistuoja modeliai su galimybe valdyti balsu. Bet tai neturi nieko bendra su balso atpažinimu - įrenginys neverčia balso į tekstą, o lygina ištartą frazę su iš anksto įrašyta (pastaroji yra „nuoroda“ ir paprastai vadinama „balso žyma“). Balso žymeklis gali atitikti adresų knygos įrašą (rinkimas balsu) arba meniu elementą (valdymas balsu). Jei telefonas iš pradžių neturi atitinkamų funkcijų, jo „išmokyti“ bus neįmanoma.

2. Mobilieji navigatoriai – naujuose navigacijos įrenginiuose, pavyzdžiui, Tom Tom Go 720T, vairuotojas gali balsu įvesti kelionės tikslą. Jei žodžius tariate aiškiai ir, jei įmanoma, tyliai, ši funkcija veikia labai gerai. Nors ši operacija užtrunka tiek pat laiko, kiek ir klaviatūros įvestis, vairuojant valdyti balsu yra saugiau ir patogiau. Tiesa, be rankų visiškai neapsieinama – norint paleisti komandą balsu, reikia paspausti ekrane esantį mygtuką.

3. Automobiliai – kai kurių naujų automobilių markių, tokių kaip Mercedes, Audi, Toyota, Ford ar BMW, galima valdyti balsu (nors komandų rinkinys ribotas). Pavyzdžiui, kai kuriuose BMW modeliuose paspaudus mygtuką, esantį ant vairo (žr. pav.), įjungiamos stereo ar navigacijos sistemos valdymo balsu funkcijos.

4. Daugialypės terpės diskai, skirti mokytis užsienio kalbų – kai kurios mokymosi programos tikrina teisingą tarimą. Programa prašo perskaityti tam tikrą sakinį ir, apdorojus rezultatą naudojant kalbos atpažinimo funkciją, praneša, ar su jūsų tarimu viskas tvarkoje.

Kokios problemos kyla dirbant su „atpažinimo“ programomis?

Įrenginių valdymas ar tekstų diktavimas atliktas pakankamai gerai, bet, deja, ne tobulai. Ir taip yra dėl kelių priežasčių:

1. Žodžiai ne visada skamba vienodai – didžiausias kalbos atpažinimo sunkumas yra tas, kad niekas to paties žodžio neištars taip pat, net jei ir labai stengsis.

2. Kiekvienas kalba skirtingai – taigi kalbos atpažinimo programa veiks aiškiau, jei naujas vartotojas pirmas šiek tiek „pasipraktikuos“. Tiesa, tai ne visada įmanoma, o kartais net ir nebūtina, pavyzdžiui, naudojant programas, kurios nesusietos su pašnekovu. Daugelis kalbos atpažinimo programų gali automatiškai prisiderinti prie naujo vartotojo.

3. Foniniai triukšmai gali gerokai iškreipti ištarto žodžio garsą. Tai labai apriboja kalbos atpažinimo funkcijas, o perpildytose ar triukšmingose ​​vietose tai visiškai neįmanoma.

4. Greita kalba – kai kurie vartotojai kalba labai greitai – žodžiai beveik susilieja. Pašnekovas nesunkiai supras tokią kalbą, tačiau programa tokiai užduočiai bus per sunki.

5. Vienodo (arba labai panašaus) skambesio žodžiai – ypač sunku kalbos atpažinimo programoms su vadinamaisiais homofonais – žodžiai, kurie tariami beveik vienodai, bet rašomi skirtingai („lez“ ir „miškas“, „burna“). ir „gentis“). Programa turi nustatyti tokių žodžių reikšmę pagal sakinio kontekstą.

Kokios yra kalbos atpažinimo funkcijos perspektyvos?

Mobiliuosiuose telefonuose kalbos atpažinimo funkcijos vaidmuo gerokai padidės, nes spausdinti tekstą mažomis mobiliųjų telefonų klaviatūromis labai vargina.

1. SMS žinučių diktavimas – greitai nebereikės rašyti žinučių telefonu – galėsite tiesiog diktuoti. Šią funkciją Samsung žada įdiegti į kai kuriuos savo telefonų modelius (prekyboje jie turėtų pasirodyti artimiausiu metu).

2. Vertimas – iki 2008 m. olimpinių žaidynių Pekine turėtų pasirodyti mobilusis telefonas su įmontuotu vertėju. Jei būdami Vidurinėje Karalystėje norite, pavyzdžiui, pavalgyti restorane, tuomet užteks užsakymą rusiškai pasakyti mobiliajame telefone – viskas bus išversta į kinų kalbą, o elektroninis balsas iš pranešėjas perduos užsakymą padavėjui.

Galima daryti prielaidą, kad laikui bėgant vis daugiau įrenginių supras žmogaus balsą. Tad nenustebkite, jei vieną rytą jūsų kavos aparatas ne tik paklaus, ką gaminti – kapučino ar espreso – bet ir supras jūsų atsakymą.

Kalbos atpažinimas sistemoje „Windows Vista“.

Windows Vista turi kalbos atpažinimo programą. Deja, šis komponentas supranta tik anglų, vokiečių, prancūzų, ispanų, japonų ir kinų kalbas. Komponentą paleidus pirmą kartą (Valdymo skydelyje reikia pasirinkti Ease of Access and Speech Recognition elementus), atsidaro mokymosi vedlio langas, kuris pusvalandį supažindins su Windows valdymo balsu principais. Atlikę keletą pratimų išmoksite diktuoti ir valdyti Windows naudojant balso komandas. Kadangi kalbos atpažinimo programinė įranga priklauso nuo garsiakalbio, ji tuo pačiu metu išmoks jūsų balsą. Sėkmingai įsisavinus įžanginę dalį, „Windows“ atsakys į jūsų skambutį: „Klausyk! ir pradėti gauti balso komandas. Trūkumas: balso įvestis veikia tik Microsoft programose (pavyzdžiui, pačiai Windows, Word ar Internet Explorer). Naudojant kitas programas (pvz., Open Office ar Firefox), kompiuteris bus „kurčias“.

Atnaujinta: pirmadienį, 2017 m. liepos 31 d

Ką pusiau fantastiška pokalbio su kompiuteriu idėja turi bendro su profesionalia fotografija? Beveik nėra, jei nesate idėjos apie begalinį visos techninės žmogaus aplinkos vystymąsi gerbėjas. Akimirką įsivaizduokite, kad duodate balso nurodymus fotoaparatui pakeisti židinio nuotolį ir padidinti ekspozicijos kompensavimą puse žingsnio. Nuotolinis kameros valdymas jau įdiegtas, bet ten reikia tyliai spausti mygtukus, o štai klausos fotikas!

Jau tapo tradicija kaip žmogaus balso komunikacijos su kompiuteriu pavyzdį paminėti kokį nors fantastinį filmą, na, bent jau Stanley Kubricko režisuotą „Kosminę odisėją 2001“. Ten borto kompiuteris ne tik veda prasmingą dialogą su astronautais, bet gali skaityti iš lūpų kaip kurčias. Kitaip tariant, mašina išmoko atpažinti žmogaus kalbą be klaidų. Galbūt kam nors bus nereikalingas nuotolinis kameros valdymas balsu, tačiau daugeliui patiktų ši frazė „Paimk mus, mažyte“ ir visos šeimos paveikslas palmės fone yra paruoštas.

Na, čia aš atidaviau duoklę tradicijoms, šiek tiek pafantazavau. Bet, kalbant iš visos širdies, šį straipsnį buvo sunku parašyti, o viskas prasidėjo nuo dovanos išmaniojo telefono su Android 4 OS forma. Šis modelis HUAWEI U8815 turi nedidelį keturių colių jutiklinį ekraną ir ekraninę klaviatūrą. Ant jo rašyti šiek tiek neįprasta, tačiau pasirodė, kad tai nėra ypač reikalinga. (vaizdas01)

1. Balso atpažinimas išmaniajame telefone su Android OS

Bandydamas naują žaislą, paieškos juostoje pastebėjau mikrofono grafiką. Google ir klaviatūroje užrašuose. Anksčiau nesidomėjau, ką reiškia šis simbolis. Turėjau pokalbių Skype ir įvedė raides klaviatūra. Taip elgiasi dauguma interneto vartotojų. Bet kaip jie vėliau man paaiškino, paieškos sistemoje Google buvo pridėta paieška balsu rusų kalba ir atsirado programos, leidžiančios diktuoti trumpąsias žinutes naudojantis naršykle Chrome.

Pasakiau trijų žodžių frazę, programa juos atpažino ir parodė langelyje mėlyname fone. Stebėtis buvo kuo, nes visi žodžiai buvo parašyti taisyklingai. Jei spustelėsite šį langelį, frazė pasirodys „Android“ užrašų knygelės teksto lauke. Tad pasakė porą frazių ir SMS žinute nusiuntė asistentei žinutę.


2. Trumpa balso atpažinimo programų istorija.

Man nebuvo atradimas, kad šiuolaikiniai pasiekimai valdymo balsu srityje leidžia duoti komandas buitinei technikai, automobiliui, robotui. Komandų režimas buvo įdiegtas ankstesnėse Windows, OS/2 ir Mac OS versijose. Esu matęs talkerių programas, bet kokia jų nauda? Galbūt tai yra mano ypatumas, kad man lengviau kalbėti nei spausdinti klaviatūra, o mobiliuoju telefonu aš išvis nieko negaliu įvesti. Turite įrašyti kontaktus į nešiojamąjį kompiuterį su įprasta klaviatūra ir perkelti per USB kabelį. Bet tiesiog kalbėti į mikrofoną, o pats kompiuteris įvedė tekstą be klaidų - tai buvo mano svajonė. Beviltiškumo atmosferą palaikė diskusijos forumuose. Visur jiems kilo tokia liūdna mintis:

„Tačiau praktikoje iki šiol realios kalbos atpažinimo programos (ir net rusų kalba) praktiškai neegzistuoja ir, aišku, greitai nebus sukurtos. Be to, iki galo neišspręsta net atvirkštinė atpažinimo užduotis – kalbos sintezė, kuri, atrodytų, daug paprastesnė už atpažinimą. (ComputerPress №12, 2004)

„Įprastų kalbos atpažinimo programų (ne tik rusiškų) iki šiol nėra, nes kompiuteriui užduotis gana sunki. O baisiausia, kad žmogaus žodžio atpažinimo mechanizmas nėra įsisąmonintas, todėl nėra kuo remtis kuriant atpažinimo programas. (Kita diskusija forume).

Tuo pačiu metu anglų kalbos teksto įvesties programų apžvalgos parodė akivaizdžią sėkmę. Pavyzdžiui, IBM ViaVoice 98 Executive Edition turėjo pagrindinį 64 000 žodžių žodyną ir galimybę pridėti tiek pat savo žodžių. Žodžių atpažinimo procentas be mokymo programos buvo apie 80%, o vėliau dirbant su konkrečiu vartotoju, jis pasiekė 95%.

Iš rusų kalbos atpažinimo programų verta paminėti „Gorynych“ - anglų kalbos „Dragon Dictate 2.5“ papildymą. Apie paieškas, o paskui „mūšį su penkiais Gorynychais“ papasakosiu antroje apžvalgos dalyje. Pirmiausia radau „Anglų drakoną“.

3. Nepertraukiamos kalbos atpažinimo programa „Dragon Naturally Speaking“

Šiuolaikinė įmonės programos versija Niuansas pasirodė su mano senu draugu iš Minsko užsienio kalbų instituto. Ji parsivežė iš kelionės į užsienį ir nusipirko, manydama, kad galėtų būti „kompiuterio sekretore“. Tačiau kažkas neveikė, o programa liko beveik pamiršta nešiojamajame kompiuteryje. Nesant jokios suprantamos patirties, teko pačiam vykti pas draugą. Visa ši ilga įžanga būtina, kad būtų galima tinkamai suprasti mano padarytas išvadas.

Visas mano pirmojo drakono vardas buvo: . Programa yra anglų kalba ir viskas joje aišku net be vadovo. Pirmiausia reikia sukurti konkretaus vartotojo profilį, kad būtų galima nustatyti žodžių skambesio ypatybes jo pasirodyme. Ką ir padariau – svarbu kalbančiojo amžius, šalis, tarimo ypatumai. Mano pasirinkimas: amžius 22-54, anglų kalba JK, standartinis tarimas. Toliau pasirodo keli langai, kuriuose nustatote mikrofoną. (vaizdas04)

Kitas rimtų kalbos atpažinimo programų etapas yra konkretaus konkretaus žmogaus tarimo mokymas. Kviečiame rinktis teksto pobūdį: mano pasirinkimas – trumpa diktanto instrukcija, bet galima „užsisakyti“ ir humoristinį pasakojimą.

Šio darbo su programa etapo esmė itin paprasta – tekstas rodomas lange, virš jo yra geltona rodyklė. Taisyklingai tarus, rodyklė juda per frazes, o apačioje yra treniruočių eigos juosta. Anglų kalbos pokalbį buvau gana pamiršęs, todėl sunkiai judau. Laikas taip pat buvo ribotas – juk kompiuteris buvo ne mano ir teko nutraukti treniruotę. Tačiau draugė sakė, kad testą atliko greičiau nei per pusvalandį. (vaizdas05)

Atsisakęs pritaikyti programą prie savo tarimo, nuėjau į pagrindinį langą ir paleidau įmontuotą teksto rengyklę. Jis pasakė atskirus žodžius iš kai kurių tekstų, kuriuos rado kompiuteryje. Tie žodžiai, kuriuos jis pasakė teisingai, programa išspausdinta, tie, kuriuos pasakė blogai, buvo pakeisti kažkuo „angliškai“. Aiškiai angliškai ištarusi komandą „ištrinti eilutę“, programa ją įvykdė. Tai reiškia, kad aš teisingai perskaičiau komandas, o programa jas atpažįsta be išankstinio mokymo.

Bet man buvo svarbu, kaip šis „drakonas“ rašo rusiškai. Kaip supratote iš ankstesnio aprašymo, mokydami programą galite pasirinkti tik anglišką tekstą, rusiško teksto ten tiesiog nėra. Akivaizdu, kad lavinti rusiškos kalbos atpažinimą nepavyks. Kitoje nuotraukoje matosi, kokią frazę programa įvedė tardama rusišką žodį „Labas“. (vaizdas06)

Bendravimo su pirmuoju drakonu rezultatas pasirodė šiek tiek komiškas. Jei atidžiai perskaitysite tekstą oficialioje svetainėje, pamatysite šio programinės įrangos produkto anglišką „specializaciją“. Be to, kraunant skaitome programos lange „anglų kalba“. Tai kam viso to reikėjo? Akivaizdu, kad kalti forumai ir gandai ...

Tačiau yra ir naudingos patirties. Mano draugas paprašė pamatyti savo nešiojamojo kompiuterio būklę. Kažkaip lėtai jis pradėjo dirbti. Tai nenuostabu - sistemos skaidinyje buvo tik 5% laisvos vietos. Trindamas nereikalingas programas pamačiau, kad oficiali versija užima daugiau nei 2,3 GB. Šio numerio mums prireiks vėliau. (07 vaizdas)



Rusų kalbos atpažinimas, kaip paaiškėjo, nebuvo menka užduotis. Minske man pavyko rasti „Gorynych“ pas draugą. Disko jis ilgai ieškojo savo senose griuvėsiuose ir, anot jo, tai yra oficialus leidinys. Programa įdiegta akimirksniu, ir aš sužinojau, kad jos žodyne yra 5000 rusiškų žodžių plius 100 komandų ir 600 angliškų žodžių plius 31 komanda.

Pirmiausia turite nustatyti mikrofoną, ką aš padariau. Tada atsidariau žodyną ir pridėjau žodį "egzaminas" nes to nebuvo programos žodyne. Stengiausi kalbėti aiškiai, monotoniškai. Galiausiai atidariau Gorynych Pro 3.0 programą, įjungiau diktavimo režimą ir gavau šį sąrašą „panašiai skambančių žodžių“. (09 vaizdas)

Rezultatas mane suglumino, nes jis aiškiai skyrėsi nuo „Android“ išmaniojo telefono darbo, todėl nusprendžiau išbandyti kitas programas iš „ „Google Chrome“ internetinė parduotuvė“. Ir jis atidėjo reikalus su „gorynych gyvatėmis“ vėlesniam laikui. Aš pagalvojau tai atidėjimas veiksmas originalia rusiška dvasia

5. Google balso galimybės

Norėdami dirbti su balsu įprastame kompiuteryje su OS Windows, turėsite įdiegti naršyklę Google Chrome. Jei joje dirbate internete, apačioje dešinėje galite spustelėti programinės įrangos parduotuvės nuorodą. Ten nemokamai radau dvi programas ir du plėtinius, skirtus balso teksto įvedimui. Programos vadinamos "Balso užrašų knygelė" Ir „Voysnot – balsas į tekstą“. Įdiegę juos galite rasti skirtuke "Programos" savo naršyklę "chromas". (10 pav.)

Plėtiniai vadinami „Google Voice Search Hotword (beta) 0.1.0.5“ Ir „Balso įvesties tekstas – Speechpad.ru 5.4“. Įdiegę juos galima išjungti arba ištrinti skirtuke "Plėtiniai".(11 pav.)

Balso pastaba. „Chrome“ naršyklės programos skirtuke dukart spustelėkite programos piktogramą. Atsidarys dialogo langas, kaip parodyta paveikslėlyje žemiau. Spustelėję mikrofono piktogramą, į mikrofoną kalbate trumpas frazes. Programa siunčia jūsų žodžius į kalbos atpažinimo serverį ir įveda tekstą lange. Visi iliustracijoje parodyti žodžiai ir frazės buvo įvesti pirmuoju bandymu. Akivaizdu, kad šis metodas veikia tik esant aktyviam interneto ryšiui. (12 pav.)

Balso bloknotas. Jei paleisite programą programų skirtuke, atsidarys naujas interneto puslapio skirtukas Speechpad.ru. Yra išsami instrukcija, kaip naudotis šia paslauga, ir kompaktiška forma. Pastarasis parodytas toliau esančioje iliustracijoje. (13 pav.)

Balso įvestis tekstas leidžia balsu užpildyti interneto puslapių teksto laukus. Pavyzdžiui, aš nuėjau į savo puslapį Google+. Naujo pranešimo įvesties lauke dešiniuoju pelės mygtuku spustelėkite ir pasirinkite "Speechpad". Rožinės spalvos įvesties laukelyje rašoma, kad galite diktuoti tekstą. (14 pav.)

„Google“ paieška balsu leidžia ieškoti balsu. Kai įdiegiate ir suaktyvinate šį plėtinį, paieškos juostoje pasirodo mikrofono simbolis. Kai paspausite, simbolis pasirodys dideliame raudoname apskritime. Tiesiog pasakykite paieškos frazę ir ji bus rodoma paieškos rezultatuose. (15 pav.)

Svarbi pastaba: kad mikrofonas veiktų su „Chrome“ plėtiniais, naršyklės nustatymuose turite leisti prieigą prie mikrofono. Pagal numatytuosius nustatymus jis išjungtas saugumo sumetimais. Įeiti Parametrai → Asmeniniai duomenys → Turinio parametrai. (Jei norite pasiekti visus sąrašo pabaigoje esančius nustatymus, spustelėkite Rodyti išplėstinius nustatymus). Atsidarys dialogo langas Puslapio turinio nustatymai. Sąraše pasirinkite elementą Multimedija → mikrofonas.

6. Darbo su rusiškomis kalbos atpažinimo programomis rezultatai

Nedidelė patirtis naudojant teksto įvesties programas balsu parodė puikų šios funkcijos įdiegimą interneto įmonės serveriuose Google. Be jokio išankstinio mokymo, žodžiai atpažįstami teisingai. Tai rodo, kad rusų kalbos atpažinimo problema išspręsta.

Dabar galime sakyti, kad vystymosi rezultatas Google bus naujas kitų gamintojų produktų vertinimo kriterijus. Norėčiau, kad atpažinimo sistema veiktų neprisijungus be kontakto su įmonės serveriais – taip patogiau ir greičiau. Tačiau kada bus išleista nepriklausoma programa, skirta dirbti su nuolatiniu rusų kalbos srautu, nežinoma. Tačiau verta manyti, kad su galimybe išmokyti šį „kūrinį“ bus tikras proveržis.

Rusijos kūrėjų programos "Gorynych", "Diktografas" Ir "Kova" Išsamiau aprašysiu antroje šios apžvalgos dalyje. Šis straipsnis buvo parašytas labai lėtai, nes dabar sunku ieškoti originalių diskų. Šiuo metu jau turiu visas rusiškos balso į tekstą atpažinimo programinės įrangos versijas, išskyrus Combat 2.52. Nė vienas iš mano draugų ar kolegų neturi šios programos, o aš pats turiu tik keletą pagiriančių atsiliepimų forumuose. Tiesa, buvo toks keistas variantas – parsisiųsti „Combat“ per SMS, bet man tai nepatinka. (16 paveikslas)


Trumpas vaizdo klipas parodys, kaip kalbos atpažinimas veikia išmaniajame telefone su Android OS. Rinkimo balsu funkcija yra būtinybė prisijungti prie „Google“ serverių. Taigi internetas turėtų jums padėti

Kaina – 199,99 USD
Kūrėjas ScanSoft
Svetainė www.scansoft.com
Dydis Nr
Atsisiuntimo puslapis Nr
+
Plačiausias funkcionalumas; dirbti visose Windows programose; galingos žodyno duomenų bazės
Auksta kaina
! Geriausia egzistuojanti kalbos atpažinimo programinė įranga

Neabejotinai geriausias kalbos atpažinimo modulis! Per savo ilgą istoriją Dragon atėjo nuo kareivio iki maršalo; ne, gal vis tiek ne iki maršalo, bet jis tikrai nusipelnė kariuomenės generolo vardo. Visas darbo su programa algoritmas itin paprastas – prie atitinkamų garso plokštės išėjimų prijungiame ausines ir mikrofoną ir paleidžiame pačią programą. Pirmiausia naudotojo bus paprašyta sukalibruoti mikrofono garso lygį ir padiktuoti kompiuteriui keletą paruoštų tekstų, kad būtų galima tiksliai sureguliuoti „Dragon Naturally Speaking“ pagal jūsų tembrą, intonaciją ir tarimą. Ir galiausiai interaktyvi pamoka, kurioje vartotojas mokomas pagrindinių balso komandų.

Verta paminėti, kad PC nėra gyvas pašnekovas ir jis negali sugalvoti „prarytų“ skiemenų ar suprasti nesuprantamo sakinio. Ne mažiau svarbus ir paties kalbėtojo akcentas – tokio lygio anglų kalba, kuri, pavyzdžiui, skamba įvairiose tarptautinėse mokslinėse konferencijose, iš principo yra netinkama darbui. Kita vertus, visada yra galimybė mokytis savarankiškai: jei Drakonas niekaip nenori atpažinti žodžio, nepatingėkite pažvelgti į Lingvo ir ištarti jį taisyklinga transkripcija. Užtikrinu, kad per savaitę ar dvi ne tik lengvai padiktuosite kilobaitus tekstų, bet ir savo pažįstamų tarpe puikuosite tikru anglišku tarimu.

Vis dar nesate patenkinti atpažinimo kokybe? Peržiūrėkite vietinį tikslumo centrą, kuris optimizuos jūsų vartotojo profilį ir išmokys, kaip į savo žodyną įtraukti populiarių neologizmų. Galimi ir egzotiškesni veiksmai, pvz., wav failo tekstinio turinio atpažinimas (įskaitant iš kišeninio kompiuterio arba tiesiai iš garso plokštės linijos išvesties). Be to, „Dragon Naturally Speaking“ gali paleisti įvairias programas, perjungti jas ir net valdyti daugybę jų funkcijų (pavyzdžiui, pradėti / pristabdyti muzikos atkūrimą medijos leistuve arba dirbti tiesiogiai su meniu). Na, o Preferred ir Pro-Fessional versijose papildomai yra atskiras Real-Speech 2 kalbos variklis, vienas iš pažangiausių šiandien.

Bet grįžkime prie kalbos. Ypač džiugina tai, kad diktuoti tekstą galite ne tik vietiniame DragonPad teksto procesoriuje, bet ir bet kurioje kitoje panašioje programoje – MS Word, Outlook Express, Internet Ex-plorer ir Corel WordPerfect. Taip pat sėkmingai programa veikia su ICQ, tinklo pokalbiais (Network Assistant) ir kitais momentiniais pasiuntiniais; tačiau tada kai kurios komandos tampa nepasiekiamos, bet net siųsti žinutę Įeikite jums nereikia spustelėti, tiesiog pasakykite: „Nauja pastraipa“ – ir ICQ tai padarys automatiškai. Labiau specializuotose programose, ypač tame pačiame „Word“, naudojamos papildomos komandos: teksto formatavimas, rašyba, redagavimas – ir visa tai tik žodžiu. Jei standartinio užsakymų rinkinio nepakako, visada galite sukurti savo ir taip dar labiau išplėsti Dragon funkcionalumą. Tai užtrunka šiek tiek pastangų ir visiškai įmanoma įvesti teksto puslapį be jokių pakeitimų. Svarbiausia yra tinkamas intonacijos ir, žinoma, tarimo derinys. Nepieškite frazių, bet nerašykite kaip kulkosvaidis, kitaip teisingai suprastos medžiagos procentas užtikrintai bus linkęs į nulį. Be to, visai nebūtina nuolat žiūrėti į žodyną - net jei neteisingai ištarėte kokią nors programai žinomą frazę (pavyzdžiui, aš labai džiaugiuosi), ji „atspės“ automatiškai ištaisys tekstą. Stulbinantis? Viskas dėl didžiulio žodyno, kuris kartu su pažangia kalbos atpažinimo technologija nepalieka jokių šansų konkurentams. Kaip neprisiminti ankstyvųjų „Dragon“ versijų, su kuriomis šių eilučių autorius praeityje daug kentėjo, tačiau iš jų nepasiekė kokybiško darbo ...

Išmanioji balso atpažinimo sistema (IVOS) 2.0.2A
Shareware (30 dienų bandomasis laikotarpis, registracija – 50 USD)
ComunX kūrėjas
Svetainė www.ivos.biz
Dydis 2,69 MB
Atsisiuntimo puslapis ftp://ftp.download.com/
pub/ppd/1007091810190380/
setup_ivos.exe
+
mikroskopinis pasiskirstymo dydis; puikus funkcionalumas
Kalbos stenografijos režimas dar nepasiekė Drakono lygio
! Viena geriausių komunalinių paslaugų šioje srityje

Kukliausia (pagal platinimo rinkinio dydį) peržiūros programa pasirodė stebėtinai verta ir iš esmės pateisino savo skambų pavadinimą. To priežastis – jos universalumas, skirtas visiškai išnaikinti „rankinio“ informacijos įvedimo priemones. Taigi, IVOS leidžia: a) atpažinti kalbą ir konvertuoti ją į tekstą bet kuriame su Windows suderinamame teksto procesoriuje; b) valdyti savo kompiuterį įvairiomis balso komandomis, taip pat sukurti savo; c) balso elektroninės knygos naudojant išorinius balso variklius. Plius, žinoma, tokios smulkmenos kaip teksto ištraukimas iš Wav failų, patogus ekrano neapkraunantis programos valdymo pultas ir prieinama (lyginant su tuo pačiu Dragon) kaina. Užsiregistravęs vartotojas turi prieigą prie VoiceTouch technologijos, leidžiančios kompiuteriui išmokyti savo žodinių komandų.

Komandų vykdymo efektyvumas yra stebėtinai didelis – galbūt net geresnis nei „Realize Voice“. Tačiau „paskaitų“ atpažinimo lygis bus žemesnis, o tai nieko keisto: viena yra suprasti porą žodžių, o visai kas kita – suprasti visą sakinį. Pažymėtina, kad IVOS, kaip ir daugelis kitų kalbos atpažinimo programų, išskyrus Dragon, tokiems tikslams naudoja Microsoft Speech API modulį, o jo veikimas šioje srityje tiesiogiai priklauso nuo šios korporacijos kūrybinės sėkmės. Nepaisant to, kokybiškai dirbti iš IVOS galima jau dabar, perskaičius į programą visus jos sandėlyje esančius mokymo tekstus. Žinoma, galiausiai ji nepasieks „Dragon Naturally Speaking“ lygio, tačiau ji puikiai sugeba rinkti ne itin sudėtingus dokumentus. Ir jei reguliariai papildysite vartotojo žodyną, su moksliniais terminais nebus jokių ypatingų problemų. Tiesa, čia iškyla dilema - per savaitę, kurią reikės praleisti mokant naudingumo visų darbo su kalba subtilybių, visiškai įmanoma įvaldyti aklo spausdinimo dešimt pirštų klaviatūra pagreitintu tempu metodą. .. Kita vertus, asmeninio kompiuterio vartotojo kvalifikacija tik padidės, jei jam priklausys keli informacijos įvedimo į kompiuterį būdai.

Realizuokite Voice 4.0

Realizuokite Voice 4.0
Shareware (15 dienų bandomasis laikotarpis, registracija – 49,00 USD)
Kūrėjas Realize Software Corporation
Svetainė www.realizesoftware.com
Dydis 55 MB
Atsisiuntimo puslapis
www.realizesoftware.com/
download/RzRV40download.exe (žiniatinklio diegimo programa)
+
Nepretenzingas vartotojo tarimui; labai platus komandų rinkinys
Darbo kokybė vis tiek galėtų būti geresnė; įdiegta tik angliškoje Windows versijoje
! Valdykite kompiuterį tik balsu

Realize Voice, skirtingai nei anksčiau apžvelgtas Dragon Naturally Speaking, nelabai geba stenografuoti (nors tokia funkcija yra jo arsenale), tačiau puikiai susidoroja su balso komandomis. Pažymėtina, kad jums nereikia išskirtinai gilių anglų kalbos žinių – dėka išmaniojo euristinio analizatoriaus modulio, programa lengvai ras bendrą kalbą su beveik bet kuriuo kalbėtoju. Realize Voice funkcijų spektras yra gana platus: nuo vykdomųjų failų ir programų nuorodų paleidimo iki darbo su korespondencija ir sudėtingomis makrokomandomis. Kaip ir kitose panašiose programose, vartotojui tereikia prijungto mikrofono ir kelių minučių, kad suprastų viską. Ir prieš pradedant faktinį ryšį su komunaliniu paslaugų teikėju, verta nurodyti jo darbo apimtį. Pagal numatytuosius nustatymus sistemos meniu spartieji klavišai patenka į šią kategoriją, darbalaukis, aplanko turinys Mėgstamiausi ir greito paleidimo juostos, taip pat neseniai atidaryti dokumentai ir programos. Visas procesas yra visiškai automatizuotas ir atliekamas tiesiogine prasme akimirksniu. Tiesa, tam tikrų nepatogumų sukelia negalėjimas komandų pavadinime naudoti skaičius – pavyzdžiui, DOOM 3 bus galima paleisti naudojant balso komandą tik pervadinus jo nuorodą į „DOOM Three“. Beje, tas pats pasakytina ir apie kirilicos abėcėlę – ne tokia smagi perspektyva, ar ne? Tačiau tokiu atveju visada galite pasinaudoti rankiniu programos konfigūravimu, tiesiogiai nurodant kelią į jus dominantį failą/dokumentą/grafinį vaizdą ir pan. Čia failo pavadinimas ir jo koordinatės neturi reikšmės – net ir jei tai abvgd.exe, taip Ir Darbalaukis tau nereikia gadinti. Taip pat buvau labai patenkintas integruotų sistemos komandų rinkiniu, skirtu darbui su „Windows“ - nors jis nėra per didelis, jis gali judėti tarp atidarytų langų, imituoti dažniausiai naudojamų klavišų veiksmus ( Tarpo klavišas, Įterpti, Pagrindinis ir tt), su jo pagalba visiškai įmanoma išjungti ir užblokuoti sistemą.

Šiek tiek apie makrokomandas. Naudingumas leidžia sujungti visą eilę operacijų pagal vieną komandą - nuo simbolių įvedimo iš klaviatūros ir sistemos komandų iki kalbos sintezės naudojant įmontuotą balso variklį. Tiesa, iki tokios idilės, kaip įrašyti kompaktinį diską vienos frazės pagalba, dar toli, bet laikas parodys... Svarbiausia, kad jau dabar galima (ir ne nesėkmingai!) „vairuoti“ savo augintinį be jokių anachronizmai kaip pelė ir klaviatūra. Išbandykite – nepasigailėsite!

Balso studija 1.4.6

Balso studija 1.4.6
Shareware (7 dienų bandomasis laikotarpis, registracija – 20,97 USD)
Kūrėjo Ultimate Interactive Desktop's
Svetainė www.voicestudio.us
Dydis 57 MB
Atsisiuntimo puslapis
ftp://ftp.voicestudio.us/
pub/dl2/vssetup.exe
+
Puikus funkcionalumas; „gyvo“ animacinio veikėjo buvimas; labai žema kaina
MS SAPI naudojama kalbos atpažinimui; gana didelis išteklių suvartojimas
! Puikus „Dragon“ priedas, skirtas kompiuterio balso valdymui

Galbūt viena iš nedaugelio, jei ne vienintelė tokia programa, kurioje mūsų virtualus pašnekovas kitoje monitoriaus pusėje pagaliau įgavo materialų pavidalą. Ir nors šiems tikslams naudojamą MS Agent technologiją vargu ar galima pavadinti dirbtinio intelekto prototipu, ji tam turi visas prielaidas. Animacinis asistentas yra ne tik apdovanotas tam tikru savarankiškumo laipsniu, bet ir žino, kaip reaguoti į daugybę standartinių frazių (pvz., „Labas!“, „Kaip jautiesi“, „Blogas kompiuteris“ ir kt.). Jei pageidaujate, nesunku papildyti jo žodyną ir frazeologines atsargas, be to, nustatyti jo veiksmus priklausomai nuo „nuotaikos“. Nors toks plepėjimas su kompiuteriu apsiribos programos žinių sfera, tačiau niekas nesivargina jos plėsti kone be galo. Ir čia jau akmuo iki liūdnai pagarsėjusio AI... Tačiau aš šiek tiek nukrypstu.

Tiesą sakant, naudojant Voice Studio funkcionalumą, viskas yra idealioje tvarkoje - stenografija (nors Dragon yra daug geresnė), įvairios balso komandos (galite jas atsispausdinti, kad būtų patogiau ir greičiau įsimintų), taip pat priimtina mašinos kalbos sintezė. . Nuo rimtesnių dalykų – makrokomandų kūrimas, kad vienu raktiniu žodžiu būtų galima atlikti eilę operacijų vienu metu, net įrašant ir atkuriant pelės judesius! Leiskite jums priminti, kad paskutinė „funkcija“ yra plačiai naudojama daugelyje alternatyvių naršyklių, tokių kaip GreenBrowser ar MyIE2, norint atlikti daugybę veiksmų (nueiti į kitą puslapį, atidaryti naują langą ir pan.). Dabar nereikia jokių nereikalingų gestų – tereikia ištarti atitinkamą komandą ir kompiuteris automatiškai atkurs anksčiau įrašytą scenarijų. Kas žino, gal netrukus žaisime žaidimus tik su mikrofonu? Laikas parodys…

Tuo tarpu „Voice Studio“ neabejotinai nusipelno aukščiausio įvertinimo dėl nuostabaus draugiškumo ir naudojimo paprastumo. Tegul teisingas kalbos įrašymas dar nėra jos galioje, tačiau kompiuterio balso valdymas čia yra tiesiog nepalyginamas. Geriausias iš šių paslaugų ir vertas Dragon papildymas!

Diktantas 2004 v.4.5.2399

Diktantas 2004 v.4.5.2399
Shareware (7 dienų bandomasis laikotarpis, registracija – 49,99 USD)
Kūrėjas United Research Labs
Svetainė www.research-lab.com
Dydis 41 MB
Atsisiuntimo puslapis
www.bandwidthsaver.com/
downloads/dict2002.zip
+
Pagrindinis kompiuterio valdymo ir kalbos įrašymo funkcijų rinkinys; puikus darbas su wav failais
Ne patys geriausi kalbos atpažinimo balai; erzinantis teksto redaktorius
! Per mažai už kainą

Nepaisant iš pažiūros visiškai standartinių pagrindinių įgūdžių, „Dictation 2004“ vis dar kažkuo gali pasigirti. Visų pirma, tai yra Point-and-Speak technologija, kuri leidžia lengvai kurti slaptažodžių įvedimo, programinės įrangos paleidimo ir diktavimo komandas beveik visose Windows programose. Deklaruojama integracija su MS Word, taip pat intelektuali technologija, skirta teisingam frazių apibrėžimui. Tiesa, ji įgyvendinta itin nepatogiai – iššokančio lango pavidalu, kuris pasirodo su kiekvienu ištartu žodžiu ir tik atbaido bet kokį norą dirbti. Gerai, kad galite jį išjungti. „Dictation 2004“ naudoja tą patį SAPI 5.1, todėl jos kokybė iš esmės nesiskiria nuo kitos programinės įrangos, pagrįstos ta pačia technologija (Voxx, IVOS, Realize Voice ir kt.). Iš papildomų funkcijų verta paminėti WAV įrašymo įrenginį, skirtą fiksuoti informaciją iš garso kasečių, mobiliųjų įrenginių, mikrofonų ir vėliau įrašyti į wav failus; tada tekstas iš jų išgaunamas naudojant atskirą Diktavimo programėlę – Wave-to-Text. Kol kas, žinoma, jis dar toli gražu nėra idealus, bet jei kalbėtojas turi aiškią kalbą ir gerą tarimą, problemų nekils.

+
Universalumas darbe; galimybių įvairovė
— Programos „mokymas“ užtruks ilgai ! Įdomus produktas, bet galėtų būti geresnis...

Dar vienas „visų amatų lizdas“, leidžiantis kalbėtis su kompiuteriu iki soties. Programos funkcijų sąrašas yra labai panašus į IVOS (trumposios / balso komandos / teksto skaitymas), išskyrus tai, kad čia yra naudingas pranašumas - kruopštus kiekvieno veiksmo įgarsinimas, nesvarbu, ar tai būtų spausdinimas, ar failo atidarymas. Programa naudoja tą pačią Microsoft Speech API kaip IVOS, todėl jos atpažinimo kokybė yra panaši. Yra geras balso komandų rinkinys naršymui naršyklėje, elementarios operacijos teksto rengyklėje (iškirpti / kopijuoti / įklijuoti ir kt.), taip pat dirbant su langais, yra nuorodų, skirtų iškviesti sistemos programėles, netgi atidaryti / uždaryti optinio disko dėklas – apskritai viskas patogiam darbui. Kalbant apie kalbos sintezę, tai tiesiogiai priklauso nuo atitinkamų sistemoje įdiegtų modulių. Nemokami „Microsoft“ varikliai, tiekiami kartu su programa, toli gražu nėra idealūs, tačiau iš esmės galite prie jų priprasti. Patogesnis pasirinkimas, deja, nemokamas, yra išbandyti trečiųjų šalių kūrimą, ypač „Digit PC“, kuriame, be to, yra labai geras rusakalbis. Atsižvelgiant į visus privalumus ir trūkumus, „Voxx“ būtų geras kandidatas pirkti. Beje, bandomąją versiją riboja tik frazių/komandų skaičius per seansą; norėdami pradėti naują seansą, tiesiog paleiskite programą iš naujo...

Išvada

Nepaisant vis dar daugybės trūkumų, kalbos atpažinimo programos iš žaislų rango jau perėjo į rimtą įrankį verslo žmogui. Jei anksčiau iš jų buvo mažai prasmės, tai dabar jie leidžia tikrai palengvinti vartotojo gyvenimą ir sugriauti iki tol nepajudinamą stereotipą, kad kompiuteris – tik geležinė dėžė, malanti skaičius. Ir, žinoma, pats maloniausias faktas – galimybė jau dabar pajusti XXI amžiaus technologinę pažangą, apie kurią taip dažnai rašė tiek daug mokslinės fantastikos rašytojų. Prisijunk dabar!