Programi i njohjes së zërit në Rusisht. Programet e njohjes së të folurit

Ndoshta programi më i përshtatshëm i transkriptimit të tekstit për Windows dhe Mac OS, i cili kombinon një riprodhues audio dhe një redaktues teksti. Parimi i funksionimit është shumë i thjeshtë - ngarkoni një skedar audio në program, dëgjoni atë duke përdorur çelësat e nxehtë në tastierë (mund t'i caktoni ato vetë) dhe në të njëjtën kohë shkruani tekst. Shpejtësia e luajtjes dhe volumi i audios rregullohen gjithashtu duke përdorur tastierën. Në këtë mënyrë, duart tuaja janë gjithmonë në tastierë dhe nuk ka nevojë të përdorni miun ose të kaloni midis programeve të ndryshme. Duhet të merret parasysh që redaktori i integruar i tekstit nuk njeh gabime dhe nuk ka shumë funksione të tjera të njohura, për shembull, ndërrimi i vizave në viza. Megjithatë, mund të përdorni redaktues të tjerë teksti paralelisht me Express Scribe duke përdorur tastet kryesore për të kontrolluar riprodhimin e audios. Programi është shareware, kosto e plotë: 17-50 dollarë.


02. Transkriptues-pro



Një program në gjuhën ruse për Windows që ju lejon të dëgjoni jo vetëm audio, por edhe të shikoni skedarë video. Redaktori i integruar i tekstit ka aftësinë të shtojë vulat kohore dhe emrat e bashkëbiseduesve. Teksti që rezulton mund të importohet në "transkriptet interaktive" dhe gjithashtu mund të rregullohet si pjesë e një projekti grupor. Aplikacioni është i disponueshëm vetëm me një abonim vjetor, kostoja është 689 rubla në vit.


03. RPlayer V1.4



Një program i thjeshtë për përpunimin dhe transkriptimin e skedarëve audio me mbështetje kryesore dhe aftësinë për të shtypur në Microsoft Word. Ndryshe nga programet e mëparshme të ngjashme, ai mund të shkarkohet falas, por është i paqëndrueshëm në versionet e reja të Windows.

04. Voco

Aplikacion profesional Windows për konvertimin e të folurit në tekst. Mbështet shtypjen e zërit në çdo shfletues provë, ka një koleksion të madh fjalorësh tematikë dhe nuk kërkon lidhje interneti për njohjen e të folurit. Versionet e zgjeruara "Voco.Professional" dhe "Voco.Enterprise" mund të punojnë me skedarë audio të gatshëm. E vetmja pengesë është kostoja e lartë e aplikacionit.


05. Diktimi i Dragoit



Aplikacion celular falas për njohjen e të folurit të diktuar. Programi mund të njohë rreth 40 gjuhë dhe varietetet e tyre, ju lejon të redaktoni tekstin dhe ta dërgoni atë në email, rrjetet sociale ose të kopjoni në clipboard. Kërkohet një lidhje interneti për të funksionuar.


06. RealSpeaker



Një aplikacion unik që jo vetëm që mund të njohë skedarët audio, por edhe fjalimin e drejtpërdrejtë të folur në kamerë. Falë një shtesë të veçantë video, "RealSpeaker" lexon lëvizjet e buzëve, duke përmirësuar kështu procesin e njohjes së të folurit deri në 20-30% në krahasim me algoritme të tjera të ngjashme. Aktualisht, aplikacioni mbështet 11 gjuhë: rusisht, anglisht (dialektet amerikane dhe britanike), frëngjisht, gjermanisht, kinezisht, koreanisht dhe japonisht, turqisht, spanjisht, italisht dhe ukrainisht. Programi shpërndahet pa pagesë, kostoja varet nga kohëzgjatja e abonimit, versioni i pakufizuar kushton rreth 2 mijë rubla.

Në botën tonë moderne, plot ngjarje, shpejtësia e punës me informacionin është një nga gurët themelorë të arritjes së suksesit. Performanca dhe produktiviteti ynë i punës, dhe rrjedhimisht pasuria jonë e menjëhershme materiale, varen nga sa shpejt marrim, krijojmë dhe përpunojmë informacionin. Ndër mjetet që mund të përmirësojnë aftësitë tona të punës, një vend të rëndësishëm zënë programet për përkthimin e fjalës në tekst, duke na lejuar të rrisim ndjeshëm shpejtësinë e shtypjes së teksteve që na nevojiten. Në këtë material do t'ju tregoj se cilat programe të njohura ekzistojnë për përkthimin e zërit audio në tekst dhe cilat janë veçoritë e tyre.

Shumica e programeve ekzistuese aktualisht për përkthimin e zërit në tekst paguhen, duke vendosur një numër kërkesash në mikrofon (në rastin kur programi është i destinuar për një kompjuter). Nuk rekomandohet shumë të punoni me një mikrofon të integruar në një kamerë në internet ose të vendosur në trupin e një laptopi standard (cilësia e njohjes së të folurit nga pajisje të tilla është mjaft e ulët). Përveç kësaj, është mjaft e rëndësishme të keni një mjedis të qetë, pa zhurmë të panevojshme që mund të ndikojnë drejtpërdrejt në nivelin tuaj të njohjes së të folurit.

Për më tepër, shumica e këtyre programeve janë të afta jo vetëm të transformojnë fjalimin në tekst në ekranin e kompjuterit, por edhe të përdorin komanda zanore për të kontrolluar kompjuterin tuaj (hapja dhe mbyllja e programeve, marrja dhe dërgimi i emailit, hapja dhe mbyllja e faqeve të internetit, etj.).

Programi nga fjalimi në tekst

Le të kalojmë në një përshkrim të drejtpërdrejtë të programeve që mund të ndihmojnë në përkthimin e fjalës në tekst.

Programi Laitis

Programi falas i njohjes së zërit në gjuhën ruse "Laitis" ka një cilësi të mirë të të kuptuarit të të folurit dhe, sipas krijuesve të tij, mund të zëvendësojë pothuajse plotësisht tastierën e zakonshme të përdoruesit. Programi gjithashtu funksionon mirë me komandat zanore, duke ju lejuar të kryeni shumë veprime për të kontrolluar kompjuterin tuaj.

Për funksionimin e tij, programi kërkon internet me shpejtësi të lartë në PC (programi përdor shërbimet e rrjetit të njohjes së zërit nga Google dhe Yandex). Aftësitë e programit ju lejojnë gjithashtu të kontrolloni shfletuesin tuaj duke përdorur komandat zanore, gjë që kërkon instalimin e një shtesë të veçantë nga "Laitis" (Chrome, Mozilla, Opera) në navigatorin tuaj të internetit.

"Dragon Professional" - duke transkriptuar regjistrimet audio në tekst

Në kohën e shkrimit të këtij materiali, një produkt dixhital në gjuhën angleze « Dragon Professional Individual” është një nga liderët botërorë në cilësinë e teksteve të njohura. Programi kupton shtatë gjuhë (vetëm aplikacionin celular Dragon Anywhere dhe funksionon deri më tani me rusisht), ka njohje zëri me cilësi të lartë dhe mund të kryejë një sërë komandash zanore. Për më tepër, ky produkt paguhet ekskluzivisht (çmimi për programin kryesor është 300 dollarë amerikanë, dhe për versionin "shtëpi" të produktit Dragon Home blerësi do të duhet të paguajë 75 dollarë amerikanë).

Për të funksionuar, ky produkt nga Nuance Communications kërkon krijimin e profilit tuaj, i cili është krijuar për të përshtatur aftësitë e programit me specifikat e zërit tuaj. Përveç diktimit të drejtpërdrejtë të tekstit, ju mund ta stërvitni programin për të kryer një sërë komandash, duke e bërë kështu ndërveprimin tuaj me kompjuterin edhe më kongruent dhe më të përshtatshëm.

"RealSpeaker" - njohës jashtëzakonisht i saktë i të folurit

Programi për shndërrimin e zërit në tekst "RealSpeaker", përveç funksioneve standarde për programe të këtij lloji, ju lejon të përdorni aftësitë e kamerës së internetit të kompjuterit tuaj. Tani programi jo vetëm që lexon komponentin audio të tingullit, por gjithashtu regjistron lëvizjen e qosheve të buzëve të folësit, duke njohur kështu më saktë fjalët që ai shqipton.


"RealSpeaker" lexon jo vetëm komponentin audio, por edhe vizual të procesit të të folurit

Aplikacioni mbështet më shumë se dhjetë gjuhë (përfshirë rusishten), lejon njohjen e të folurit duke marrë parasysh thekset dhe dialektet, ju lejon të transkriptoni audio dhe video, ju jep akses në cloud dhe shumë më tepër. Programi është shareware, por për versionin e paguar do të duhet të paguani para reale.

"Voco" - programi do ta përkthejë shpejt zërin tuaj në një dokument teksti

Një tjetër konvertues zëri në tekst është produkti dixhital me pagesë "Voco", çmimi i versionit "shtëpi" të të cilit tani është rreth 1700 rubla. Versionet më të avancuara dhe të shtrenjta të këtij programi - "Voco.Professional" dhe "Voco.Enterprise" kanë një numër karakteristikash shtesë, njëra prej të cilave është njohja e të folurit nga regjistrimet audio të përdoruesit.

Ndër veçoritë e Voco, do të doja të vëreja aftësinë për të zgjeruar fjalorin e programit (aktualisht fjalori i programit përfshin më shumë se 85 mijë fjalë), si dhe funksionimin e tij autonom nga rrjeti, duke ju lejuar të mos vareni nga lidhja juaj në internet .


Ndër avantazhet e Voco është kurba e lartë e të mësuarit të programit.

Aplikacioni ndizet mjaft thjesht - thjesht shtypni tastin "Ctrl" dy herë. Aplikacioni është absolutisht falas, mbështet disa dhjetëra gjuhë, përfshirë rusishten.

konkluzioni

Më lart, unë rendita programet për përkthimin e regjistrimit të zërit tuaj audio në tekst, përshkrova funksionalitetin e tyre të përgjithshëm dhe veçoritë karakteristike. Shumica e këtyre produkteve zakonisht paguhen, dhe gama dhe cilësia e programeve në gjuhën ruse është cilësisht inferiore ndaj homologëve të tyre në gjuhën angleze. Kur punoni me aplikacione të tilla, unë rekomandoj t'i kushtoni vëmendje të veçantë mikrofonit tuaj dhe cilësimeve të tij - kjo është e rëndësishme në procesin e njohjes së të folurit, sepse një mikrofon i keq mund të mohojë edhe softuerin me cilësi më të lartë të llojit që kam shqyrtuar.

Ekzistojnë dy lloje të programeve të njohjes së të folurit:

1. të lidhura me folësin - këto programe po mësojnë vazhdimisht dhe me kalimin e kohës fillojnë të kuptojnë gjithnjë e më mirë zërin e "pronarit të tyre". Sa më shpesh përdoruesi punon në program, aq më mirë e kupton atë. Për fat të mirë, procesi i të mësuarit ndodh mjaft shpejt - në rreth 20 minuta programi do të mësojë t'ju kuptojë mjaft mirë.

2. pavarësisht nga altoparlanti - mund të filloni të flisni menjëherë - programi do t'i përgjigjet komandave zanore. Ndryshe nga lloji i parë, këto programe nuk kanë nevojë të mësojnë t'ju kuptojnë. Përkundrazi, ju duhet të mësoni të flisni në atë mënyrë që programi t'ju kuptojë.

Pse përdoret softueri për njohjen e të folurit në një kompjuter?

Mos mendoni se nëse instaloni një program për njohjen e të folurit, nuk do të keni më nevojë për tastierë dhe maus, por puna në kompjuterin tuaj do të jetë shumë më e lehtë.

1. Diktim - duke përdorur programet e njohjes së të folurit, shumë përdorues diktojnë tekstin e dokumenteve. Kjo mundësi është e rëndësishme, për shembull, për mjekët që kryejnë një ekzaminim (gjatë të cilit duart e tyre zakonisht janë të zëna) dhe në të njëjtën kohë regjistrojnë rezultatet e tij. Për një përdorues të zakonshëm që e ka të vështirë të shtypë tekst për ndonjë arsye (ose është thjesht shumë dembel), mund të jetë gjithashtu i dobishëm.

2. Futja e komandave - Përdoruesit e PC mund të përdorin një "njohës" për të futur komanda, domethënë fjala e folur do të perceptohet nga sistemi si një klikim i mausit. Përdoruesi urdhëron: "Open file", "Send mail" ose "New window" dhe kompjuteri kryen veprimet përkatëse. Kjo është veçanërisht e vërtetë për njerëzit me aftësi të kufizuara - në vend të miut dhe tastierës, ata do të jenë në gjendje të kontrollojnë kompjuterin duke përdorur zërin e tyre.

Çfarë kërkohet për njohjen e të folurit?

1. Programi i njohjes së të folurit - Përdoruesit e Windows-it që flasin anglisht mund të përdorin, për shembull, Dragon Naturally Speaking ose IBM Via Voice. Gjuha ruse kuptohet nga programet "Gorynych" dhe "Dictograph". Softueri për njohjen e të folurit është tashmë i integruar në sistemin operativ Windows Vista.

2. Mikrofoni ose kufjet (një hibrid i një kufje dhe një mikrofoni) - për të "futur" fjalët në kompjuter.

3. Kompjuter mjaft i fuqishëm – kompjuteri nuk ka nevojë të jetë super i shpejtë që funksioni i njohjes së të folurit të funksionojë. Mjafton 1 GB RAM (për Windows Vista është më mirë të keni 2 GB) dhe një shpejtësi të orës së procesorit të paktën 1 GHz.

Cilat pajisje përdorin njohjen e të folurit?

Funksioni i njohjes së të folurit mund të përdoret jo vetëm në PC, por edhe në shumë pajisje të tjera. Kjo është veçanërisht e vërtetë nëse "vegël" ka një tastierë kompakte me çelësa të vegjël (ose aspak).

1. Telefonat celularë – modelet me kontroll zanor janë në dispozicion prej disa vitesh. Por kjo nuk ka të bëjë me njohjen e zërit - pajisja nuk e përkthen zërin në tekst, por e krahason frazën e folur me një të regjistruar paraprakisht (kjo e fundit është një "referencë" dhe zakonisht quhet "etiketë zanore"). Një etiketë zanore mund të korrespondojë me një hyrje në librin e adresave (thirrje zanore) ose një artikull të menysë (kontrolli zanor). Nëse telefoni fillimisht nuk ka funksionet e duhura, do të jetë e pamundur ta "stërvitni".

2. Navigatorë celularë - në pajisjet e reja të navigimit, për shembull, Tom Tom Go 720T, shoferi mund të fusë destinacionin me zë. Nëse i shqiptoni fjalët qartë dhe, nëse është e mundur, në heshtje, ky funksion funksionon shumë mirë. Megjithëse ky operacion kërkon të njëjtën kohë sa futja e tastierës, është akoma më i sigurt dhe më i përshtatshëm përdorimi i kontrollit zanor gjatë drejtimit të automjetit. Vërtetë, nuk mund ta bëni plotësisht pa duart tuaja - për të nisur një komandë zanore, duhet të shtypni butonin në ekran.

3. Makinat - Disa marka të reja makinash, si Mercedes, Audi, Toyota, Ford ose BMW, mund të kontrollohen duke përdorur zërin (megjithëse grupi i komandave është i kufizuar). Për shembull, në disa modele BMW, pasi shtypni butonin e vendosur në timon (shih figurën), aktivizohen funksionet e kontrollit zanor për sistemin stereo ose sistemin e navigimit.

4. Disqe multimediale për të mësuar gjuhë të huaja - disa programe arsimore kontrollojnë shqiptimin e saktë. Programi ju kërkon të lexoni një fjali të caktuar dhe, pasi të përpunoni rezultatin duke përdorur funksionin e njohjes së të folurit, ju tregon nëse gjithçka është në rregull me shqiptimin tuaj.

Çfarë problemesh lindin kur punoni me programet e njohjes?

Kontrolli i pajisjeve ose diktimi i teksteve funksionon mjaft mirë, por për fat të keq jo në mënyrë perfekte. Dhe kjo shkaktohet nga një sërë arsyesh:

1. Fjalët nuk tingëllojnë gjithmonë njësoj – Vështirësia më e madhe në njohjen e të folurit është se askush nuk do ta shqiptojë të njëjtën fjalë në të njëjtën mënyrë, edhe nëse përpiqet shumë.

2. Të gjithë flasin ndryshe - kështu që programi i njohjes së të folurit do të funksionojë më qartë nëse një përdorues i ri e "stërvit" pak më parë. Vërtetë, kjo nuk është gjithmonë e mundur, dhe ndonjëherë nuk është as e nevojshme, për shembull, kur përdorni programe që nuk janë të lidhura me bashkëbiseduesin. Shumë programe të njohjes së të folurit mund të përshtaten automatikisht me një përdorues të ri.

3. Zhurma e sfondit mund të shtrembërojë ndjeshëm tingullin e fjalës së folur. Kjo kufizon ndjeshëm funksionet e njohjes së të folurit dhe në vende të mbushura me njerëz ose me zhurmë, e bën atë plotësisht të pamundur.

4. Fjalimi i shpejtë - disa përdorues flasin shumë shpejt - fjalët pothuajse bashkohen. Bashkëbiseduesi do ta kuptojë lehtësisht një fjalim të tillë, por programi do të jetë "shumë i ashpër" për një detyrë të tillë.

5. Fjalët me të njëjtin tingull (ose shumë të ngjashëm) - është veçanërisht e vështirë për programet e njohjes së të folurit me të ashtuquajturat homofone - fjalë që shqiptohen pothuajse njësoj, por shkruhen ndryshe ("lez" dhe "les", "rot " dhe "shkopi" "). Programi duhet të përcaktojë kuptimin e fjalëve të tilla bazuar në kontekstin e fjalisë.

Cila është e ardhmja për njohjen e të folurit?

Në telefonat celularë, roli i funksionit të njohjes së të folurit do të rritet ndjeshëm, sepse shtypja e tekstit në tastierat e vogla të telefonave celularë është shumë e lodhshme.

1. Diktimi i mesazheve SMS - së shpejti nuk do të keni nevojë të shkruani mesazhe me tekst në telefonin tuaj - thjesht mund të diktoni. Samsung premton ta zbatojë këtë funksion në disa nga modelet e saj të telefonave (ata duhet të shfaqen në treg në të ardhmen e afërt).

2. Përkthimi – në kohën e Lojërave Olimpike 2008 në Pekin, pritet të shfaqet një telefon celular me një përkthyes të integruar. Nëse, ndërsa jeni në Mbretërinë e Mesme, dëshironi, për shembull, të darkoni në një restorant, atëherë do t'ju duhet vetëm të flisni porosinë tuaj në rusisht në telefonin tuaj celular - gjithçka do të përkthehet në kinezisht dhe një zë elektronik nga altoparlanti. do t'ia transmetojë porosinë kamerierit.

Mund të supozohet se me kalimin e kohës, gjithnjë e më shumë pajisje do të kuptojnë zërin e njeriut. Pra, mos u habitni nëse një mëngjes aparati juaj i kafesë jo vetëm që ju pyet nëse duhet të bëni një kapuçino apo një ekspres, por edhe kupton përgjigjen tuaj.

Njohja e të folurit në Windows Vista

Windows Vista përfshin softuer për njohjen e të folurit. Fatkeqësisht, ky komponent kupton vetëm anglisht, gjermanisht, frëngjisht, spanjisht, japonisht dhe kinezisht. Kur nisni komponentin për herë të parë (në Panelin e Kontrollit duhet të zgjidhni artikujt Lehtësia e Qasjes dhe Njohja e të folurit), hapet një dritare e magjistarit të trajnimit, e cila do t'ju marrë gjysmë ore për t'ju njohur me parimet e Windows. kontrolli i zërit. Pas përfundimit të disa ushtrimeve, do të mësoni se si të diktoni dhe kontrolloni Windows duke përdorur komandat zanore. Meqenëse softueri i njohjes së të folurit varet nga altoparlanti, ai do të mësojë zërin tuaj në të njëjtën kohë. Pas zotërimit me sukses të pjesës hyrëse, Windows do t'i përgjigjet thirrjes suaj: "Dëgjo!" dhe do të fillojë të pranojë komanda zanore. Disavantazhi: Hyrja zanore funksionon vetëm për programet e Microsoft (për shembull, vetë Windows, Word ose Internet Explorer). Kur përdorni programe të tjera (për shembull, Open Office ose Firefox), kompjuteri do të jetë "i shurdhër".

Përditësuar: e hënë, 31 korrik 2017

Çfarë lidhje ka ideja gjysmë fantastike e të folurit me një kompjuter me fotografinë profesionale? Pothuajse asnjë, përveç nëse jeni adhurues i idesë së zhvillimit të pafund të të gjithë mjedisit teknik të njeriut. Imagjinoni për një moment që po i jepni kamerës suaj urdhra zanor për të ndryshuar gjatësinë fokale dhe për të bërë një korrigjim ekspozimi prej gjysmë ndalese plus. Telekomanda e kamerës tashmë është zbatuar, por atje duhet të shtypni butonat në heshtje, por këtu është një aparat dëgjimi!

Është bërë traditë të citohen disa filma fantastiko-shkencor si shembull i komunikimit me zë midis një personi dhe një kompjuteri, për shembull "2001: Një Odisea Hapësinore" me regji të Stanley Kubrick. Atje, kompjuteri në bord jo vetëm që zhvillon një dialog kuptimplotë me astronautët, por mund të lexojë buzët si një person i shurdhër. Me fjalë të tjera, makina ka mësuar të njohë fjalën e njeriut pa gabime. Ndoshta dikujt do t'ju duket i tepërt kontrolli i zërit në distancë i kamerës, por shumë do ta donin këtë frazë "Na merr poshtë, fëmijë" dhe fotografia e të gjithë familjes në sfondin e një palme është gati.

Epo, kështu që i bëra haraç traditës dhe ëndërrova pak. Por, duke folur nga zemra, ky artikull ishte i vështirë për t'u shkruar dhe gjithçka filloi me një dhuratë në formën e një smartphone me Android 4 OS. Ky model HUAWEI U8815 ka një ekran të vogël me prekje katër inç dhe një tastierë në ekran. Është pak e pazakontë të shkruash në të, por rezulton se nuk është veçanërisht e nevojshme. (imazhi 01)

1. Njohja e zërit në një smartphone me sistem operativ Android

Ndërsa provoja një lodër të re, vura re një grafikë të një mikrofoni në shiritin e kërkimit Google dhe në tastierë në Notes. Më parë, nuk më interesonte se çfarë do të thoshte ky simbol. Kam pasur biseda në Skype, dhe shkronjat e shtypura në tastierë. Kjo është ajo që bëjnë shumica e përdoruesve të internetit. Por siç më shpjeguan më vonë, në motorin e kërkimit Google Kërkimi zanor në Rusisht u shtua dhe u shfaqën programe që ju lejojnë të diktoni mesazhe të shkurtra kur përdorni një shfletues "Chrome".

Thashë një frazë prej tre fjalësh, programi i identifikoi dhe i tregoi në një qelizë me sfond blu. Kishte diçka për t'u habitur këtu, sepse të gjitha fjalët ishin shkruar saktë. Nëse klikoni në këtë qelizë, fraza shfaqet në fushën e tekstit të bllokut të shënimeve Android. Kështu që thashë disa fraza të tjera dhe i dërgova një mesazh asistentit me SMS.


2. Një histori e shkurtër e programeve të njohjes së zërit.

Nuk ishte një zbulim për mua që përparimet moderne në fushën e kontrollit të zërit bëjnë të mundur dhënien e komandave për pajisjet shtëpiake, makinat dhe robotët. Modaliteti i komandës u prezantua në versionet e mëparshme të Windows, OS/2 dhe Mac OS. Kam hasur në programe që flasin, por çfarë dobie kanë? Ndoshta është veçoria ime që e kam më të lehtë të flas sesa të shkruaj në tastierë, por në celular nuk mund të shkruaj asgjë fare. Ju duhet të shkruani kontaktet në një laptop me një tastierë normale dhe t'i transferoni ato përmes një kabllo USB. Por të flisja thjesht në një mikrofon dhe kompjuteri të shkruante vetë tekstin pa gabime ishte një ëndërr për mua. Atmosfera e mungesës së shpresës u ruajt nga diskutimet në forume. Kishte një mendim kaq të trishtuar kudo në to:

"Sidoqoftë, në realitet, deri më sot, programet për njohjen e vërtetë të të folurit (dhe madje edhe në rusisht) praktikisht nuk ekzistojnë, dhe ato padyshim nuk do të krijohen së shpejti. Për më tepër, edhe problemi i kundërt i njohjes - sinteza e të folurit, e cila, siç duket, është shumë më e thjeshtë se njohja, nuk është zgjidhur plotësisht." (ComputerPress nr. 12, 2004)

"Nuk ka ende programe normale për njohjen e të folurit (jo vetëm rusisht), sepse detyra është mjaft e vështirë për një kompjuter. Dhe më e keqja është se mekanizmi i njohjes së fjalëve nga njerëzit ende nuk është realizuar, kështu që nuk ka asgjë për të filluar kur krijohen programe njohjeje.” (Një diskutim tjetër në forum).

Në të njëjtën kohë, rishikimet e programeve të futjes së tekstit zanor në gjuhën angleze treguan suksese të qarta. Për shembull, IBM ViaVoice 98 Executive Edition kishte një fjalor bazë prej 64,000 fjalësh dhe aftësinë për të shtuar të njëjtin numër të fjalëve tuaja. Përqindja e njohjes së fjalëve pa trajnim të programit ishte rreth 80% dhe me punën e mëvonshme me një përdorues specifik arriti në 95%.

Ndër programet e njohjes së gjuhës ruse, vlen të përmendet "Gorynych" - një shtesë e Dragon Dictate 2.5 në gjuhën angleze. Unë do t'ju tregoj për kërkimin dhe më pas "betejën me pesë Gorynychs" në pjesën e dytë të rishikimit. I pari që gjeta ishte "Dragoi anglez".

3. Programi i vazhdueshëm i njohjes së të folurit "Dragon Naturally Speaking"

Versioni modern i programit të kompanisë "Nuanca" përfundova me një mikun tim të vjetër nga Instituti i Gjuhëve të Huaja në Minsk. Ajo e solli atë nga një udhëtim jashtë vendit dhe e bleu duke menduar se mund të ishte një "sekretare kompjuteri". Por diçka nuk funksionoi dhe programi mbeti në laptop, pothuajse i harruar. Për shkak të mungesës së ndonjë eksperience të qartë, më duhej të shkoja vetë te miku im. E gjithë kjo hyrje e gjatë është e nevojshme për një kuptim të saktë të përfundimeve që kam nxjerrë.

Emri i plotë i dragoit tim të parë ishte: . Programi është në anglisht dhe gjithçka në të është e qartë edhe pa manual. Hapi i parë është krijimi i një profili të një përdoruesi specifik për të përcaktuar karakteristikat e zërit të fjalëve në performancën e tij. Kjo është ajo që bëra - mosha, shteti dhe veçoritë e shqiptimit të folësit janë të rëndësishme. Zgjedhja ime është si më poshtë: mosha 22–54 vjeç, anglisht në MB, shqiptimi standard. Më pas janë disa dritare ku konfiguroni mikrofonin tuaj. (imazhi 04)

Faza tjetër për programet serioze të njohjes së të folurit është trajnimi për tiparet e shqiptimit të një personi të caktuar. Ju kërkohet të zgjidhni natyrën e tekstit: zgjedhja ime është një udhëzim i shkurtër diktimi, por ju gjithashtu mund të "porositni" një histori humoristike.

Thelbi i kësaj faze të punës me programin është jashtëzakonisht i thjeshtë - teksti shfaqet në dritare, me një shigjetë të verdhë mbi të. Kur shqiptohet saktë, shigjeta lëviz nëpër fraza dhe në fund ka një shirit të përparimit të stërvitjes. E kisha harruar paksa anglishten time të bisedës, kështu që përparova me vështirësi. Koha ishte gjithashtu e kufizuar - kompjuteri nuk ishte i imi dhe më duhej të ndërpresja stërvitjen. Por një shoqe tha se ajo e bëri testin në më pak se gjysmë ore. (imazh 05)

Duke refuzuar që programi të përshtatte shqiptimin tim, shkova në dritaren kryesore dhe nisa redaktuesin e integruar të tekstit. Ai foli fjalë individuale nga disa tekste që i gjeti në kompjuter. Programi i shtypi ato fjalë që ai tha saktë dhe i zëvendësoi ato që tha dobët me diçka "anglisht". Pasi e shqiptoi qartë komandën "fshij linjën" në anglisht, programi e ekzekutoi atë. Kjo do të thotë që komandat i kam lexuar saktë dhe programi i njeh ato pa trajnim paraprak.

Por ishte e rëndësishme për mua se si shkruan ky "dragua" në rusisht. Siç e kuptuat nga përshkrimi i mëparshëm, kur trajnoni programin, mund të zgjidhni vetëm tekst në anglisht; thjesht nuk ka rusisht atje. Është e qartë se nuk do të jetë e mundur të trajnohet njohja ruse e të folurit. Në foton tjetër mund të shihni se çfarë fraze shtypi programi kur shqiptonte fjalën ruse "Përshëndetje". (imazh 06)

Rezultati i bisedës me dragoin e parë doli të ishte paksa komik. Nëse e lexoni me kujdes tekstin në faqen zyrtare të internetit, mund të shihni "specializimin" në anglisht të këtij produkti softuer. Përveç kësaj, kur ngarkojmë, lexojmë "Anglisht" në dritaren e programit. Pra, pse ishte e nevojshme e gjithë kjo? Është e qartë se fajin e kanë forumet dhe thashethemet...

Por ka edhe përvojë të dobishme. Një shoqja ime kërkoi të shihte gjendjen e laptopit të saj. Disi ngadalë filloi të punonte. Kjo nuk është për t'u habitur - ndarja e sistemit kishte vetëm 5% hapësirë ​​të lirë. Ndërsa fshija programet e panevojshme, pashë që versioni zyrtar merrte më shumë se 2.3 GB. Kjo shifër do të jetë e dobishme për ne më vonë. (imazh.07)



Njohja e fjalës ruse, siç doli, ishte një detyrë jo e parëndësishme. Në Minsk arrita të gjej "Gorynych" nga një mik. Ai e kërkoi diskun për një kohë të gjatë në rrënojat e tij të vjetra dhe, sipas tij, ky është publikimi zyrtar. Programi u instalua menjëherë dhe kuptova se fjalori i tij përmban 5000 fjalë ruse plus 100 komanda dhe 600 fjalë anglisht plus 31 komanda.

Së pari ju duhet të konfiguroni mikrofonin, gjë që bëra. Pastaj hapa fjalorin dhe shtova fjalën "provim" sepse nuk ishte në fjalorin e programit. U përpoqa të flisja qartë dhe monotone. Më në fund, hapa programin Gorynych Pro 3.0, aktivizova modalitetin e diktimit dhe mora këtë listë të "fjalëve që tingëllojnë afër". (imazh.09)

Rezultati më habiti, sepse dallonte qartë për keq nga puna e një smartphone Android, dhe vendosa të provoj programe të tjera nga " Dyqani në internet i Google Chrome". Dhe unë e shtyva të merrem me "gjarpërinjtë gorynych" për më vonë. Mendova se ishte shtyrje veprim në frymën origjinale ruse

5. Aftësitë e zërit të Google

Për të punuar me zë në një kompjuter të rregullt Windows, do t'ju duhet të instaloni një shfletues Google Chrome. Nëse po e përdorni në internet, mund të klikoni në lidhjen e dyqanit të softuerit në fund djathtas. Atje, plotësisht falas, gjeta dy programe dhe dy shtesa për futjen e tekstit me zë. Programet quhen "Fletorja e zërit" Dhe "Voicenot - zë në tekst". Pas instalimit, ato mund të gjenden në skedën "Aplikimet" shfletuesin tuaj "Krom". (imazh. 10)

Zgjerimet quhen "Fjala kryesore e kërkimit me zë të Google (Beta) 0.1.0.5" Dhe "Hyrja e tekstit zanor - Speechpad.ru 5.4". Pas instalimit, ato mund të fiken ose fshihen në skedë "Zgjerime".(imazh. 11)

VoiceNote. Në skedën e aplikacionit në shfletuesin Chrome, klikoni dy herë ikonën e programit. Do të hapet një kuti dialogu si në foton më poshtë. Duke klikuar në ikonën e mikrofonit, ju shqiptoni fraza të shkurtra në mikrofon. Programi transmeton fjalët tuaja në serverin e njohjes së të folurit dhe shkruan tekstin në dritare. Të gjitha fjalët dhe frazat e paraqitura në ilustrim u shtypën herën e parë. Natyrisht, kjo metodë funksionon vetëm kur ka një lidhje aktive në internet. (imazh. 12)

Fletorja e zërit. Nëse e nisni programin nga skeda e aplikacioneve, do të hapet një skedë e re faqe interneti Speechpad.ru. Ka udhëzime të hollësishme se si të përdorni këtë shërbim dhe një formë kompakte. Kjo e fundit është paraqitur në ilustrimin e mëposhtëm. (imazh. 13)

Hyrja zanore Teksti ju lejon të plotësoni fushat e tekstit në faqet e internetit duke përdorur zërin tuaj. Për shembull, unë shkova në faqen time "Google+". Në fushën e futjes së mesazhit të ri, kliko me të djathtën dhe zgjidhni "SpeechPad". Dritarja e hyrjes rozë tregon se ju mund të diktoni tekstin tuaj. (imazh. 14)

Kërkimi me zë në Google ju lejon të kërkoni me zë. Kur instaloni dhe aktivizoni këtë shtesë, një simbol i mikrofonit shfaqet në shiritin e kërkimit. Kur e shtypni, një simbol do të shfaqet në një rreth të madh të kuq. Thjesht thoni frazën tuaj të kërkimit dhe ajo do të shfaqet në rezultatet e kërkimit. (imazh. 15)

Shënim i rëndësishëm: Që mikrofoni të funksionojë me shtesat e Chrome, duhet të lejoni aksesin e mikrofonit në cilësimet e shfletuesit tuaj. Është çaktivizuar si parazgjedhje për arsye sigurie. Shkoni në Cilësimet → Të dhënat personale → Cilësimet e përmbajtjes. (Për të hyrë në të gjitha cilësimet në fund të listës, klikoni Shfaq cilësimet e avancuara). Do të hapet një kuti dialogu Cilësimet e përmbajtjes së faqes. Zgjidhni një artikull në listë Multimedia→mikrofon.

6. Rezultatet e punës me programet ruse të njohjes së të folurit

Një përvojë e vogël në përdorimin e programeve të futjes së tekstit zanor ka treguar zbatim të shkëlqyer të kësaj veçorie në serverët e një kompanie interneti Google. Pa ndonjë trajnim paraprak, fjalët njihen saktë. Kjo tregon se problemi i njohjes së të folurit rus është zgjidhur.

Tani mund të themi se rezultat i zhvillimeve Google do të jetë një kriter i ri për vlerësimin e produkteve nga prodhues të tjerë. Do të doja që sistemi i njohjes të funksiononte jashtë linje pa hyrë në serverët e kompanisë - është më i përshtatshëm dhe më i shpejtë. Por nuk dihet kur do të publikohet një program i pavarur për të punuar me një rrjedhë të vazhdueshme të fjalës ruse. Sidoqoftë, ia vlen të supozohet se me mundësinë për t'u trajnuar, ky "krijim" do të bëhet një zbulim i vërtetë.

Programet e zhvilluesve rusë "Gorynych", "Diktografi" Dhe "Betejë" Do të hyj në detaje në pjesën e dytë të këtij rishikimi. Ky artikull u shkrua shumë ngadalë për arsye se kërkimi i disqeve origjinale tani është i vështirë. Për momentin, unë tashmë i kam të gjitha versionet e motorëve rusë të njohjes së zërit në tekst, përveç "Combat 2.52". Asnjë nga miqtë apo kolegët e mi nuk e ka këtë program, dhe unë vetë kam vetëm disa komente lavdëruese në forume. Vërtetë, kishte një opsion kaq të çuditshëm - shkarkoni "Combat" përmes SMS, por nuk më pëlqen. (imazhi 16)


Një videoklip i shkurtër do t'ju tregojë se si funksionon njohja e të folurit në një smartphone me sistemin operativ Android. E veçanta e shtypjes së zërit është nevoja për t'u lidhur me serverët e Google. Kështu duhet të funksionojë interneti juaj

Çmimi: 199,99 dollarë
Zhvilluesi ScanSoft
Faqja e internetit www.scansoft.com
Madhësia nr
Faqja e shkarkimit Nr
+
Funksionaliteti më i gjerë; punoni në të gjitha aplikacionet Windows; bazat e të dhënave të fuqishme të fjalorëve
Cmim i larte
! Softueri më i mirë i disponueshëm për njohjen e të folurit

Padyshim moduli më i mirë ekzistues i njohjes së të folurit! Gjatë historisë së tij të gjatë, Dragoi ka kaluar të gjithë rrugën e vështirë nga ushtari në marshall; jo, ndoshta, ende jo deri në marshall, por ai me siguri e meritonte titullin e gjeneralit të ushtrisë. I gjithë algoritmi për të punuar me programin është jashtëzakonisht i thjeshtë - ne lidhim kufjet dhe një mikrofon me daljet përkatëse nga karta audio dhe nisim vetë programin. Së pari, përdoruesit do t'i kërkohet të kalibrojë nivelin e zërit nga mikrofoni dhe t'i diktojë kompjuterit një numër tekstesh të gatshme për të rregulluar mirë "Dragon Naturally Speaking" me timbrin, intonacionin dhe shqiptimin tuaj. Dhe së fundi, një tutorial interaktiv ku përdoruesit mësohen komandat bazë zanore.

Vlen të përmendet se PC nuk është një bashkëbisedues i gjallë dhe ai nuk mund të plotësojë rrokjet "të gëlltitura" ose të kuptojë një fjali të thënë në mënyrë të palexueshme. Vetë theksi i folësit nuk është më pak i rëndësishëm - niveli i anglishtes që, për shembull, dëgjohet në konferenca të ndryshme shkencore ndërkombëtare, është, në parim, i papërshtatshëm për punë. Nga ana tjetër, ekziston gjithmonë mundësia e vetë-mësimit: nëse Dragon nuk dëshiron të njohë një fjalë të caktuar, gjej kohë për të parë në Lingvo dhe shqiptoje atë duke marrë parasysh transkriptimin e saktë. Ju siguroj, në një maksimum prej një ose dy javësh, jo vetëm që do të diktoni lehtësisht kilobajt tekstesh, por gjithashtu do të shfaqni shqiptimin tuaj të vërtetë në anglisht midis miqve tuaj.

Ende nuk jeni të kënaqur me cilësinë e njohjes? Kontaktoni qendrën tuaj lokale të saktësisë për të optimizuar profilin tuaj të përdoruesit dhe për t'ju mësuar se si të shtoni neologjizma të njohura në fjalorin tuaj. Veprime më ekzotike janë gjithashtu të mundshme, të tilla si njohja e përmbajtjes së tekstit të një skedari wav (përfshirë nga një Pocket PC ose drejtpërdrejt nga dalja lineare e një karte audio). Përveç kësaj, Dragon Naturally Speaking mund të nisë programe të ndryshme, të kalojë mes tyre dhe madje të kontrollojë një sërë funksionesh të tyre (për shembull, të fillojë/ndalojë riprodhimin e muzikës në një media player ose të punojë drejtpërdrejt me menunë). Epo, versionet e Preferuara dhe Profesionale përfshijnë gjithashtu motorin tonë të të folurit, Real-Speech 2, një nga më të avancuarit sot.

Por le t'i kthehemi regjistrimit të fjalimit. Ajo që është veçanërisht e këndshme është se ju mund të diktoni tekst jo vetëm në procesorin e tekstit vendas DragonPad, por edhe në çdo aplikacion tjetër të ngjashëm - MS Word, Outlook Express, Internet Ex-plorer dhe Corel WordPerfect. Programi funksionon me të njëjtin sukses me ICQ, chat në rrjet (Network Assistant) dhe mesazhe të tjera të menjëhershme; megjithatë, atëherë disa komanda bëhen të padisponueshme, por edhe për të dërguar një mesazh Hyni Nuk ka nevojë të shtypni, thjesht thoni: "Paragraf i ri" - dhe ICQ do ta bëjë atë automatikisht. Në aplikacionet më të specializuara, veçanërisht në Word, përdoren komanda shtesë: formatimi i tekstit, drejtshkrimi, redaktimi - dhe të gjitha ekskluzivisht në kurriz të gjuhës së folur. Nëse grupi standard i porosive nuk ishte i mjaftueshëm, gjithmonë mund të krijoni tuajin, duke zgjeruar më tej funksionalitetin e Dragon. Me pak përpjekje, është mjaft e mundur të shtypni një faqe teksti pa asnjë modifikim. Gjëja kryesore është kombinimi i duhur i intonacionit dhe, natyrisht, shqiptimit. Mos i zgjatni frazat tuaja, por mos shkarravitni si mitraloz, përndryshe përqindja e materialit të kuptuar saktë me siguri do të priret në zero. Për më tepër, nuk është aspak e nevojshme të shikoni vazhdimisht në fjalor - edhe nëse nuk keni shqiptuar një frazë mjaft të saktë (për shembull, jam shumë i lumtur), i njohur për programin, ai do të "mendojë" që të korrigjojë automatikisht teksti. E mahnitshme? Gjithçka ka të bëjë me fjalorin e madh, i cili, së bashku me teknologjinë e avancuar të njohjes së të folurit, nuk u lë asnjë shans konkurrentëve. Si të mos kujtojmë versionet e hershme të Dragoit, me të cilat autori i këtyre rreshtave ka vuajtur shumë në të kaluarën, por nuk ka arritur kurrë punë cilësore prej tyre...

Sistemi inteligjent i njohjes së zërit (IVOS) 2.0.2A
Shareware (provë 30 ditë, regjistrim - 50 dollarë)
Zhvilluesi ComunX
Faqja e internetit www.ivos.biz
Madhësia 2.69 MB
Faqja e shkarkimit ftp://ftp.download.com/
pub/ppd/1007091810190380/
setup_ivos.exe
+
Madhësia mikroskopike e shpërndarjes; funksionalitet i shkëlqyer
Modaliteti i stenografisë së të folurit nuk është ende në nivelin e Dragoit
! Një nga shërbimet më të mira në këtë fushë

Programi më modest (përsa i përket madhësisë së shpërndarjes) në rishikim u tregua çuditërisht i denjë dhe e justifikoi kryesisht emrin e tij me zë të lartë. Arsyeja për këtë është shkathtësia e tij, e krijuar për të zhdukur plotësisht mjetet e futjes "manuale" të informacionit. Pra, IVOS ju lejon: a) të njihni fjalimin dhe ta shndërroni atë në tekst në çdo procesor teksti të pajtueshëm me Windows; b) kontrolloni kompjuterin tuaj duke përdorur një sërë komandash zanore, si dhe krijoni tuajin; c) zë mbi libra elektronikë duke përdorur motorë të jashtëm zanor. Plus, natyrisht, gjëra të tilla të vogla si nxjerrja e tekstit nga skedarët Wav, një panel kontrolli i përshtatshëm programi që nuk rëndon ekranin dhe një çmim i përballueshëm (krahasuar me të njëjtin Dragon). Pas regjistrimit, përdoruesi ka akses në teknologjinë VoiceTouch, e cila ju lejon të mësoni PC-në porositë tuaja verbale.

Efikasiteti i ekzekutimit të komandës është çuditërisht i lartë - ndoshta edhe më i mirë se Realize Voice. Por niveli i njohjes së "leksioneve" do të jetë më i ulët, gjë që nuk është e çuditshme: është një gjë të kuptosh disa fjalë dhe krejt tjetër të kuptosh një fjali të tërë. Duhet të theksohet se IVOS, si shumë programe të tjera të njohjes së të folurit, përveç Dragon, përdor modulin Speech API nga Microsoft për qëllime të tilla, dhe efektiviteti i tij në këtë fushë varet drejtpërdrejt nga suksesi krijues i kësaj korporate. Megjithatë, ju mund të arrini punë me cilësi të lartë nga IVOS tani duke i lexuar programit të gjitha tekstet e trajnimit në stokun e tij. Sigurisht, në fund ajo nuk do të arrijë nivelin e Dragon Naturally Speaking, por ajo është mjaft e aftë të shtypë dokumente jo shumë komplekse. Dhe nëse përditësoni rregullisht fjalorin e përdoruesit, atëherë nuk do të ketë probleme të veçanta me termat shkencorë. Vërtetë, këtu lind një dilemë - në javën që do të duhet të shpenzohet duke mësuar programin të gjitha ndërlikimet e punës me të folurin, është mjaft e mundur të zotëroni shpejt metodën e shtypjes me prekje me dhjetë gishta në tastierë ... Nga ana tjetër Pra, kualifikimet e një përdoruesi të PC-së do të rriten vetëm nëse ai zotëron disa metoda të futjes së informacionit në një kompjuter.

Realize Voice 4.0

Realize Voice 4.0
Shareware (provë 15 ditë, regjistrim - 49,00 dollarë)
Zhvilluesi Realize Software Corporation
Faqja e internetit www.realizesoftware.com
Madhësia 55 MB
Faqja e shkarkimit
www.realizesoftware.com/
shkarko/RzRV40download.exe (instalues ​​në ueb)
+
Jo modest ndaj shqiptimit të përdoruesit; gamë shumë e gjerë komandash
Cilësia e punës mund të jetë akoma më e mirë; instalohet vetëm në versionin anglisht të Windows
! Kontrolloni kompjuterin tuaj vetëm me zërin tuaj

Realize Voice, ndryshe nga Dragon Naturally Speaking i rishikuar më parë, nuk është shumë i aftë për stenografi (megjithëse e ka një funksion të tillë në arsenalin e tij), por i përballon shkëlqyeshëm komandat zanore. Ajo që është e jashtëzakonshme është se nuk keni nevojë për njohuri jashtëzakonisht të thella të anglishtes - falë modulit të analizuesit inteligjent heuristik, programi do të gjejë lehtësisht një gjuhë të përbashkët me pothuajse çdo folës. Gama e funksioneve Realize Voice është mjaft e gjerë: nga hapja e skedarëve të ekzekutueshëm dhe shkurtoreve të programit deri te puna me korrespondencë dhe makro komplekse. Ashtu si në programe të tjera të ngjashme, përdoruesi ka nevojë vetëm për një mikrofon të lidhur dhe disa minuta për t'u marrë me gjërat. Dhe para se të filloni të komunikoni në të vërtetë me shërbimin, ia vlen të përcaktoni fushën e punës për të. Si parazgjedhje, shkurtoret e menusë së sistemit bien në këtë kategori, Desktop, përmbajtja e dosjes Të preferuarat dhe panelet e nisjes së shpejtë, si dhe dokumentet dhe programet e hapura së fundmi. I gjithë procesi është plotësisht i automatizuar dhe përfundon fjalë për fjalë menjëherë. Vërtetë, disa shqetësime shkaktohen nga pamundësia për të përdorur numrat në emrat e komandave - për shembull, mund të nisni DOOM 3 duke përdorur një komandë zanore vetëm duke riemëruar shkurtoren e saj në "DOOM Three". E njëjta gjë, nga rruga, vlen edhe për alfabetin cirilik - jo një perspektivë kaq e gëzuar, apo jo? Megjithatë, në një rast të tillë, gjithmonë mund të përdorni konfigurimin manual të programit duke specifikuar drejtpërdrejt shtegun drejt skedarit/dokumentit/imazhit grafik që ju intereson, etj. Këtu emri i skedarit dhe koordinatat e tij nuk kanë rëndësi në të gjitha - edhe nëse është abvgd.exe, po Dhe Desktop nuk do t'ju duhet ta gjymtoni. Unë gjithashtu isha shumë i kënaqur me grupin e komandave të integruara të sistemit për të punuar me Windows - megjithëse nuk është shumë i madh, ai mund të lëvizë midis dritareve të hapura dhe të imitojë veprimet e çelësave më të zakonshëm ( Spacebar, Insert, Home etj.), Fikja dhe bllokimi i sistemit me ndihmën e tij është mjaft i mundur.

Pak rreth makrove. Shërbimi ju lejon të kombinoni një seri të tërë operacionesh nën një komandë - nga futja e karaktereve nga tastiera dhe komandat e sistemit deri te sinteza e të folurit duke përdorur motorin e integruar të zërit. Vërtetë, një idil i tillë si regjistrimi i një CD duke përdorur një frazë të vetme është ende larg, por koha do ta tregojë ... Gjëja kryesore është që tani ju mund (dhe jo pa sukses!) "të drejtoni" kafshën tuaj pa ndonjë anakronizëm si miu. dhe tastierë. Provojeni - nuk do të pendoheni!

Voice Studio 1.4.6

Voice Studio 1.4.6
Shareware (provë 7 ditë, regjistrim - 20,97 dollarë)
Zhvilluesi i Desktopit Ultimate Interactive
Faqja e internetit www.voicestudio.us
Madhësia 57 MB
Faqja e shkarkimit
ftp://ftp.voicestudio.us/
pub/dl2/vssetup.exe
+
Funksionalitet i shkëlqyer; prania e një personazhi të animuar "të gjallë"; çmim shumë i ulët
MS SAPI përdoret për njohjen e të folurit; intensitet mjaft i lartë i burimeve
! Një shtesë e shkëlqyer për Dragon për të kontrolluar kompjuterin tuaj me zërin tuaj

Ndoshta ky është një nga të paktët, nëse jo i vetmi, programe të tilla ku bashkëbiseduesi ynë virtual në anën tjetër të monitorit ka marrë më në fund një formë materiale. Dhe megjithëse teknologjia MS Agent, e cila përdoret për këto qëllime, vështirë se mund të quhet një prototip i inteligjencës artificiale, ajo ka të gjitha parakushtet për këtë. Asistenti i animuar jo vetëm që është i pajisur me një shkallë të caktuar pavarësie, por gjithashtu di të përgjigjet ndaj një numri frazash standarde (si "Përshëndetje!", "Si ndihesh", "Kompjuter i keq", etj.). Nëse dëshironi, fjalori dhe stoku i tij frazeologjik mund të plotësohen lehtësisht, dhe përveç kësaj, veprimet e tij mund të vendosen në varësi të "humorit" të tij. Megjithëse një bisedë e tillë me një PC do të kufizohet nga fusha e njohurive të programit, askush nuk shqetësohet ta zgjerojë atë pothuajse pafundësisht. Dhe ja ku është vetëm një hedhje guri nga AI famëkeq... Megjithatë, dal pak.

Në fakt, gjithçka është në rregull me funksionalitetin e Voice Studio - stenografi (megjithëse Dragon është shumë më i mirë), një shumëllojshmëri komandash zanore (për lehtësi më të madhe dhe memorizim më të shpejtë, ato mund të printohen), si dhe sinteza e pranueshme e të folurit në makinë. Gjëra më serioze përfshijnë krijimin e makrove për të nisur një seri operacionesh menjëherë duke përdorur një fjalë kyçe, madje edhe regjistrimin dhe luajtjen e lëvizjeve të miut! Më lejoni t'ju kujtoj se "funksioni" i fundit përdoret gjerësisht në shumë shfletues alternativë si GreenBrowser ose MyIE2 për të kryer një sërë veprimesh (duke shkuar në një faqe tjetër, duke hapur një dritare të re, etj.). Tani nuk keni nevojë për ndonjë gjest të panevojshëm - thjesht thoni komandën e duhur dhe kompjuteri automatikisht do të rikrijojë skriptin e regjistruar më parë. Kush e di, ndoshta së shpejti do të jemi në gjendje të luajmë lojëra duke përdorur vetëm një mikrofon? Koha do të tregojë…

Ndërkohë, Voice Studio meriton padyshim vlerësimin më të lartë për mirëdashësinë dhe lehtësinë e tij të mahnitshme. Mund të mos jetë ende në gjendje të regjistrojë siç duhet fjalimin, por kontrolli i një kompjuteri me zë është thjesht i pakrahasueshëm. Më e mira nga këto shërbime dhe një shtesë e denjë për Dragon!

Diktim 2004 v.4.5.2399

Diktim 2004 v.4.5.2399
Shareware (provë 7 ditë, regjistrim - 49,99 dollarë)
Zhvilluesi i Laboratorëve të Bashkuar të Kërkimit
Faqja e internetit www.research-lab.com
Madhësia 41 MB
Faqja e shkarkimit
www.bandwidthsaver.com/
shkarkime/dict2002.zip
+
Kompleti bazë i funksioneve për kontrollin e kompjuterit dhe regjistrimin e të folurit; punë e shkëlqyer me skedarët wav
Jo performanca më e mirë e njohjes së të folurit; modul i bezdisshëm i redaktimit të tekstit
! Shumë pak për këtë çmim

Pavarësisht nga aftësitë themelore në dukje plotësisht standarde, Dictation 2004 ende mund të mburret me diçka. Para së gjithash, është teknologjia Point-and-Speak, e cila ju lejon të krijoni lehtësisht komanda për futjen e fjalëkalimeve, lëshimin e softuerit dhe diktim në pothuajse të gjitha aplikacionet e Windows. Njoftohet integrimi me MS Word, si dhe teknologji inteligjente për identifikimin e saktë të frazave. Vërtetë, ajo zbatohet në një mënyrë jashtëzakonisht të papërshtatshme - në formën e një dritareje që shfaqet me çdo fjalë të folur dhe vetëm dekurajon çdo dëshirë për të punuar. Është mirë që mund ta fikni. Dictation 2004 përdor të njëjtin SAPI 5.1, kështu që cilësia e tij nuk është thelbësisht e ndryshme nga programet e tjera të bazuara në të njëjtën teknologji (Voxx, IVOS, Realize Voice, etj.). Ndër funksionet shtesë, vlen të përmendet WAV Recorder për kapjen e informacionit nga kasetat audio, pajisjet celulare, mikrofonat dhe më pas regjistrimin e tij në skedarë wav; pastaj teksti nxirret prej tyre duke përdorur një aplikacion të veçantë Diktimi - Vala në Tekst. Deri më tani, natyrisht, është ende larg idealit, por nëse spikeri ka të folur të qartë dhe shqiptim të mirë, atëherë nuk do të ketë probleme.

+
Shkathtësi në punë; shumëllojshmëri mundësish
— "Trajnimi" i programit do të marrë shumë kohë ! Produkt interesant, por mund të jetë më i mirë...

Një tjetër "jack i të gjitha tregtive" që ju lejon të bisedoni me kompjuterin tuaj me kënaqësinë e zemrës suaj. Lista e veçorive të programit është shumë e ngjashme me atë të IVOS (stenografi/komanda zanore/lexim teksti), përveç që ka një bonus të dobishëm - veprim skrupuloz me zë të çdo veprimi tuaj, qoftë duke shtypur apo duke hapur një skedar. Programi përdor të njëjtin API të të folurit të Microsoft si IVOS, kështu që cilësia e tij e njohjes është e ngjashme. Ekziston një grup i mirë komandash zanore për lundrimin në shfletues, operacionet bazë në një redaktues teksti (prerje/kopjoni/ngjit, etj.), si dhe për të punuar me Windows, ka shkurtore për thirrjen e aplikacioneve të sistemit, madje edhe hapjen/mbylljen e tabaka me makinë optike - në përgjithësi, gjithçka për punë të rehatshme. Sa i përket sintezës së të folurit, ajo varet drejtpërdrejt nga modulet përkatëse të instaluara në sistem. Motorët falas nga Microsoft që vijnë me programin janë larg idealit, por, në parim, mund të mësoheni me ta. Një opsion më i përshtatshëm, mjerisht, jo pa pagesë, është të provoni zhvillime të palëve të treta, në veçanti Digit PC, i cili gjithashtu ka një lajmërues shumë të mirë në gjuhën ruse. Duke marrë parasysh të gjitha të mirat dhe të këqijat, Voxx do të ishte një kandidat i mirë për të blerë. Nga rruga, versioni i provës është i kufizuar vetëm nga numri i frazave / komandave për seancë; Për të nisur një sesion të ri, thjesht rinisni programin...

konkluzioni

Megjithë mangësitë ende të shumta, programet e njohjes së të folurit tashmë janë zhvendosur nga radha e lodrave në një mjet serioz për një person biznesi. Nëse më parë ata kishin pak përdorim, tani ata mund ta bëjnë vërtet jetën më të lehtë për përdoruesin dhe të shkatërrojnë stereotipin e patundur më parë se një kompjuter është thjesht një kuti hekuri që shtyp numrat. Dhe sigurisht, fakti më i këndshëm është mundësia për të përjetuar përparimin teknologjik të shekullit të 21-të, për të cilin shumë shkrimtarë të trillimeve shkencore kanë shkruar kaq shpesh, pikërisht tani. Bashkohu me ne!