Səsin tanınması proqramı rus dilində. Nitqin tanınması proqramları

Audio pleyer və mətn redaktorunu birləşdirən Windows və Mac OS üçün bəlkə də ən rahat mətn transkripsiya proqramıdır. Əməliyyat prinsipi çox sadədir - proqrama audio faylı yükləyin, klaviaturada isti düymələrdən istifadə edərək dinləyin (onları özünüz təyin edə bilərsiniz) və eyni zamanda mətni yazın. Oxutma sürəti və səs səviyyəsi də klaviaturadan istifadə etməklə tənzimlənir. Beləliklə, əlləriniz həmişə klaviaturadadır və mausdan istifadə etməyə və müxtəlif proqramlar arasında keçid etməyə ehtiyac qalmır. Nəzərə almaq lazımdır ki, quraşdırılmış mətn redaktoru səhvləri tanımır və bir çox başqa tanış funksiyalara malik deyil, məsələn, tire içərisində defislərin dəyişdirilməsi. Bununla belə, siz səsin səsləndirilməsini idarə etmək üçün isti düymələrdən istifadə edərək Express Scribe ilə paralel olaraq digər mətn redaktorlarından istifadə edə bilərsiniz. Proqram paylaşılan proqramdır, tam dəyəri: $17-50.


02. Transscriber-pro



Windows üçün yalnız audioya deyil, həm də video fayllarına baxmağa imkan verən rusdilli proqram. Daxili mətn redaktoru vaxt ştamplarını və həmsöhbətlərin adlarını əlavə etmək imkanına malikdir. Nəticədə mətn "interaktiv transkriptlərə" idxal edilə bilər və qrup layihəsinin bir hissəsi kimi də tənzimlənə bilər. Tətbiq yalnız illik abunə ilə mövcuddur, dəyəri ildə 689 rubl təşkil edir.


03. Rplayer V1.4



İsti düymə dəstəyi və Microsoft Word-də yazmaq imkanı olan audio faylları emal etmək və köçürmək üçün sadə proqram. Əvvəlki oxşar proqramlardan fərqli olaraq, onu pulsuz yükləmək olar, lakin Windows-un yeni versiyalarında qeyri-sabitdir.

04. Voco

Nitqi mətnə ​​çevirmək üçün peşəkar Windows proqramı. İstənilən test brauzerində səslə yazmağı dəstəkləyir, tematik lüğətlərin böyük kolleksiyasına malikdir və nitqin tanınması üçün İnternet bağlantısı tələb etmir. "Voco.Professional" və "Voco.Enterprise" genişləndirilmiş versiyaları hazır audio faylları ilə işləyə bilər. Yeganə çatışmazlıq tətbiqin yüksək qiymətidir.


05. Əjdaha imlası



Diktasiya edilmiş nitqin tanınması üçün pulsuz mobil proqram. Proqram 40-a yaxın dili və onların növlərini tanıya bilir, mətni redaktə etməyə və onu e-poçta, sosial şəbəkələrə göndərməyə və ya buferə köçürməyə imkan verir. İşləmək üçün İnternet bağlantısı tələb olunur.


06. RealSpeaker



Təkcə audio faylları deyil, həm də kameraya danışılan canlı nitqi tanıya bilən unikal proqram. Xüsusi video uzantısı sayəsində “RealSpeaker” dodaq hərəkətlərini oxuyur və bununla da digər oxşar alqoritmlərlə müqayisədə nitqin tanınması prosesini 20-30%-ə qədər təkmilləşdirir. Hazırda proqram 11 dili dəstəkləyir: rus, ingilis (Amerika və Britaniya ləhcələri), fransız, alman, çin, koreya və yapon, türk, ispan, italyan və ukrayna. Proqram pulsuz paylanır, dəyəri abunə müddətindən asılıdır, limitsiz versiya təxminən 2 min rubla başa gəlir.

Müasir, hadisələrlə zəngin dünyamızda informasiya ilə işləmək sürəti uğur qazanmağın təməl daşlarından biridir. Bizim iş performansımız və məhsuldarlığımız və deməli, bilavasitə maddi sərvətimiz məlumatı nə qədər tez qəbul etməyimizdən, yaratmağımızdan və emal etməyimizdən asılıdır. İş imkanlarımızı təkmilləşdirə bilən alətlər arasında nitqi mətnə ​​çevirmək üçün proqramlar mühüm yer tutur və bizə lazım olan mətnləri yazmaq sürətini əhəmiyyətli dərəcədə artırmağa imkan verir. Bu materialda sizə audio səsi mətnə ​​çevirmək üçün hansı populyar proqramların mövcud olduğunu və onların xüsusiyyətlərinin nə olduğunu söyləyəcəyəm.

Səsi mətnə ​​çevirmək üçün hazırda mövcud olan proqramların əksəriyyəti mikrofona bir sıra tələblər qoyan pulludur (proqram kompüter üçün nəzərdə tutulduqda). Veb kameraya quraşdırılmış və ya standart noutbukun korpusunda yerləşən mikrofonla işləmək çox tövsiyə edilmir (belə cihazlardan nitqin tanınması keyfiyyəti olduqca aşağıdır). Bundan əlavə, nitqinizi tanıma səviyyənizi birbaşa təsir edə biləcək lazımsız səs-küy olmadan sakit bir mühitə sahib olmaq olduqca vacibdir.

Üstəlik, bu proqramların əksəriyyəti təkcə nitqi kompüter ekranında mətnə ​​çevirmək deyil, həm də kompüterinizi idarə etmək üçün səs əmrlərindən istifadə etmək (proqramları işə salmaq və bağlamaq, elektron poçtu qəbul etmək və göndərmək, veb saytları açmaq və bağlamaq və s.)

Danışıqdan mətnə ​​proqram

Gəlin nitqi mətnə ​​çevirməyə kömək edə biləcək proqramların birbaşa təsvirinə keçək.

Laitis proqramı

Pulsuz rus dilində səs tanıma proqramı "Laitis" yaxşı nitq anlayışına malikdir və yaradıcılarına görə istifadəçinin adi klaviaturasını demək olar ki, tamamilə əvəz edə bilər. Proqram həm də səs əmrləri ilə yaxşı işləyir, kompüterinizi idarə etmək üçün bir çox hərəkətləri yerinə yetirməyə imkan verir.

Proqramın işləməsi üçün kompüterdə yüksək sürətli İnternet tələb olunur (proqram Google və Yandex-in şəbəkə səs tanıma xidmətlərindən istifadə edir). Proqramın imkanları həmçinin veb naviqatorunuzda "Laitis" (Chrome, Mozilla, Opera)-dan xüsusi genişləndirmə quraşdırmağı tələb edən səs əmrlərindən istifadə edərək brauzerinizi idarə etməyə imkan verir.

"Dragon Professional" - səs yazılarının mətnə ​​köçürülməsi

Bu materialı yazarkən rəqəmsal ingilis dilli məhsul « Dragon Professional Individual" tanınmış mətnlərin keyfiyyətinə görə dünya liderlərindən biridir. Proqram yeddi dili başa düşür (yalnız Dragon Anywhere mobil proqramı indiyə qədər rus dilində işləyir və rus dilində işləyir), yüksək keyfiyyətli səs tanınmasına malikdir və bir sıra səs əmrlərini yerinə yetirə bilir. Üstəlik, bu məhsul müstəsna olaraq ödənilir (əsas proqramın qiyməti 300 ABŞ dollarıdır və Dragon Home məhsulunun "ev" versiyası üçün alıcı 75 ABŞ dolları ödəməlidir).

Nuance Communications-dan olan bu məhsulun işləməsi üçün proqramın imkanlarını səsinizin xüsusiyyətlərinə uyğunlaşdırmaq üçün nəzərdə tutulmuş şəxsi profilinizin yaradılması tələb olunur. Mətni birbaşa diktə etməklə yanaşı, siz proqramı bir sıra əmrləri yerinə yetirməyə öyrədə bilərsiniz və bununla da kompüterlə qarşılıqlı əlaqənizi daha da uyğun və rahat edə bilərsiniz.

"RealSpeaker" - ultra dəqiq nitq tanıyıcı

Səsi mətnə ​​çevirmək üçün proqram "RealSpeaker" bu cür proqramlar üçün standart funksiyalara əlavə olaraq, kompüterinizin veb kamerasının imkanlarından istifadə etməyə imkan verir. İndi proqram yalnız səsin audio komponentini oxumur, həm də natiqin dodaqlarının künclərinin hərəkətini qeyd edir və bununla da onun tələffüz etdiyi sözləri daha düzgün tanıyır.


“RealSpeaker” təkcə audio deyil, həm də nitq prosesinin vizual komponentini oxuyur

Tətbiq ondan çox dili (rus dili də daxil olmaqla) dəstəkləyir, vurğu və ləhcələri nəzərə alaraq nitqin tanınmasına imkan verir, audio və videoları transkripsiya etməyə imkan verir, buludlara giriş imkanı verir və s. Proqram paylaşılan proqramdır, lakin pullu versiya üçün real pul ödəməli olacaqsınız.

"Voco" - proqram tez bir zamanda səsinizi mətn sənədinə çevirəcəkdir

Başqa bir səsdən mətnə ​​çevirən pullu rəqəmsal məhsul olan "Voco"dur, "ev" versiyasının qiyməti hazırda təxminən 1700 rubl təşkil edir. Bu proqramın daha təkmil və bahalı versiyaları - "Voco.Professional" və "Voco.Enterprise" bir sıra əlavə xüsusiyyətlərə malikdir, bunlardan biri də istifadəçinin səs yazılarından nitqin tanınmasıdır.

Voco-nun xüsusiyyətləri arasında proqramın lüğətini genişləndirmək qabiliyyətini (hazırda proqramın lüğətində 85 mindən çox söz var), həmçinin İnternet bağlantınızdan asılı olmamağa imkan verən şəbəkədən avtonom işləməsini qeyd etmək istərdim. .


Voco-nun üstünlükləri arasında proqramın yüksək öyrənmə əyrisidir.

Tətbiq olduqca sadədir - sadəcə iki dəfə "Ctrl" düyməsini sıxmaq kifayətdir. Tətbiq tamamilə pulsuzdur, bir neçə onlarla dili, o cümlədən rus dilini dəstəkləyir.

Nəticə

Yuxarıda, səsli səs yazınızı mətnə ​​çevirmək üçün proqramları sadaladım, onların ümumi funksionallığını və xarakterik xüsusiyyətlərini təsvir etdim. Bu məhsulların əksəriyyəti adətən ödənişlidir və rusdilli proqramların çeşidi və keyfiyyəti ingilisdilli analoqlarından keyfiyyətcə aşağıdır. Bu cür proqramlarla işləyərkən mikrofonunuza və onun parametrlərinə xüsusi diqqət yetirməyi məsləhət görürəm - bu, nitqin tanınması prosesində vacibdir, çünki pis mikrofon hətta nəzərdən keçirdiyim ən yüksək keyfiyyətli proqram təminatını da inkar edə bilər.

Nitqin tanınması proqramlarının iki növü var:

1. natiqə bağlıdır - bu proqramlar daim öyrənir və zaman keçdikcə “öz sahibinin” səsini daha yaxşı və daha yaxşı başa düşməyə başlayırlar. İstifadəçi proqramda nə qədər tez-tez işləsə, onu bir o qədər yaxşı başa düşür. Xoşbəxtlikdən, öyrənmə prosesi olduqca tez baş verir - təxminən 20 dəqiqə ərzində proqram sizi çox yaxşı başa düşməyi öyrənəcəkdir.

2. natiqdən asılı olmayaraq - dərhal danışmağa başlaya bilərsiniz - proqram səs əmrlərinə cavab verəcəkdir. Birinci növdən fərqli olaraq, bu proqramlar sizi başa düşməyi öyrənməyə ehtiyac duymur. Əksinə, elə danışmağı öyrənməlisən ki, proqram səni başa düşsün.

Nitqin tanınması proqramı kompüterdə niyə istifadə olunur?

Düşünməyin ki, nitqin tanınması proqramı quraşdırsanız, artıq klaviatura və siçana ehtiyacınız olmayacaq, lakin kompüterinizdə işləmək xeyli asanlaşacaq.

1. Diktasiya - nitqin tanınması proqramlarından istifadə edərək, bir çox istifadəçi sənədlərin mətnini diktə edir. Bu fürsət, məsələn, müayinə keçirən (əlləri adətən məşğul olan) və eyni zamanda nəticələrini qeyd edən həkimlər üçün aktualdır. Nədənsə mətni yazmaqda çətinlik çəkən (və ya sadəcə olaraq çox tənbəl olan) adi istifadəçi üçün bu da faydalı ola bilər.

2. Əmrlərin daxil edilməsi - PC istifadəçiləri əmrləri daxil etmək üçün “tanıyıcı”dan istifadə edə bilərlər, yəni danışılan söz sistem tərəfindən siçan tıklaması kimi qəbul ediləcək. İstifadəçi əmr verir: "Fayl aç", "poçt göndər" və ya "Yeni pəncərə" və kompüter müvafiq hərəkətləri yerinə yetirir. Bu xüsusilə əlillər üçün doğrudur - onlar siçan və klaviatura əvəzinə öz səslərindən istifadə edərək kompüteri idarə edə biləcəklər.

Nitqin tanınması üçün nə tələb olunur?

1. Nitqin tanınması proqramı - İngilis dilli Windows istifadəçiləri, məsələn, Dragon Naturally Speaking və ya IBM Via Voice proqramlarından istifadə edə bilərlər. Rus dili “Qorınıç” və “Diktoqraf” proqramları ilə başa düşülür. Nitqin tanınması proqramı artıq Windows Vista əməliyyat sistemində quraşdırılmışdır.

2. Mikrofon və ya qulaqlıq (qulaqlıq və mikrofonun hibridi) - sözləri kompüterə “daxil etmək” üçün.

3. Kifayət qədər güclü kompüter – nitqin tanınması funksiyasının işləməsi üçün kompüterin super sürətli olmasına ehtiyac yoxdur. 1 GB RAM kifayətdir (Windows Vista üçün 2 GB olması daha yaxşıdır) və prosessorun takt tezliyi ən azı 1 GHz.

Hansı cihazlar nitqin tanınmasından istifadə edir?

Nitqin tanınması funksiyası təkcə fərdi kompüterlərdə deyil, bir çox başqa cihazlarda da istifadə oluna bilər. Bu, xüsusilə "gadget" in kiçik düymələri olan (və ya heç biri olmayan) yığcam klaviaturası varsa doğrudur.

1. Mobil telefonlar - səslə idarə olunan modellər bir neçə ildir ki, mövcuddur. Ancaq bunun səsin tanınması ilə heç bir əlaqəsi yoxdur - cihaz səsi mətnə ​​çevirmir, lakin danışıq ifadəsini əvvəlcədən yazılmış bir ifadə ilə müqayisə edir (sonuncu "istinaddır" və adətən "səs etiketi" adlanır). Səs etiketi ünvan kitabçasındakı qeydə (səslə yığma) və ya menyu elementinə (səslə nəzarət) uyğun ola bilər. Telefonun əvvəlcə müvafiq funksiyaları yoxdursa, onu "məşq etmək" mümkün olmayacaq.

2. Mobil naviqatorlar - yeni naviqasiya cihazlarında, məsələn, Tom Tom Go 720T-də sürücü təyinat yerinə səslə daxil ola bilər. Əgər sözləri aydın və mümkünsə sükutla tələffüz edirsinizsə, bu funksiya çox yaxşı işləyir. Bu əməliyyat klaviatura girişi ilə eyni vaxt tələb etsə də, maşın sürərkən səslə idarəetmədən istifadə etmək yenə də daha təhlükəsiz və rahatdır. Düzdür, bunu əlləriniz olmadan tamamilə edə bilməzsiniz - səs əmrini işə salmaq üçün ekrandakı düyməni basmalısınız.

3. Avtomobillər - Mercedes, Audi, Toyota, Ford və ya BMW kimi bəzi yeni avtomobil markaları səslə idarə oluna bilər (baxmayaraq ki, əmrlər dəsti məhduddur). Məsələn, bəzi BMW modellərində sükan çarxında yerləşən düyməni basdıqdan sonra (şəklə bax) stereo sistem və ya naviqasiya sistemi üçün səslə idarəetmə funksiyaları işə salınır.

4. Xarici dilləri öyrənmək üçün multimedia diskləri - bəzi təhsil proqramları düzgün tələffüzü yoxlayır. Proqram sizdən müəyyən cümləni oxumağınızı xahiş edir və nitqin tanınması funksiyasından istifadə edərək nəticəni emal etdikdən sonra tələffüzünüzlə hər şeyin qaydasında olub-olmadığını sizə bildirir.

Tanınma proqramları ilə işləyərkən hansı problemlər yaranır?

Cihazları idarə etmək və ya mətnləri diktə etmək kifayət qədər yaxşı işləyir, lakin təəssüf ki, mükəmməl deyil. Və bu bir sıra səbəblərdən qaynaqlanır:

1. Sözlər həmişə eyni səslənmir - Nitqin tanınmasında ən böyük çətinlik odur ki, heç kim çox çalışsa belə, eyni sözü eyni şəkildə tələffüz etməyəcək.

2. Hər kəs fərqli danışır - ona görə də nitqin tanınması proqramı yeni istifadəçi onu bir az əvvəl “məşq etdirsə” daha aydın işləyəcək. Düzdür, bu, həmişə mümkün deyil və bəzən, məsələn, həmsöhbətə bağlı olmayan proqramlardan istifadə edərkən belə lazım deyil. Bir çox nitqin tanınması proqramı avtomatik olaraq yeni istifadəçiyə uyğunlaşa bilər.

3. Fon səs-küyü danışılan sözün səsini əhəmiyyətli dərəcədə təhrif edə bilər. Bu, nitqin tanınması funksiyalarını əhəmiyyətli dərəcədə məhdudlaşdırır və izdihamlı və ya səs-küylü yerlərdə bunu tamamilə qeyri-mümkün edir.

4. Sürətli nitq - bəzi istifadəçilər çox tez danışır - sözlər demək olar ki, birləşir. Həmsöhbət belə nitqi asanlıqla başa düşəcək, lakin proqram belə bir tapşırıq üçün "çox sərt" olacaq.

5. Eyni (və ya çox oxşar) səsli sözlər - sözdə homofonlu nitqin tanınması proqramları üçün xüsusilə çətindir - demək olar ki, eyni tələffüz olunan, lakin fərqli yazılış (“lez” və “les”, “rot”) ” və “çubuq” "). Proqram belə sözlərin mənasını cümlənin kontekstindən asılı olaraq müəyyən etməlidir.

Nitqin tanınması üçün gələcək nə olacaq?

Mobil telefonlarda nitqin tanınması funksiyasının rolu xeyli artacaq, çünki mobil telefonların kiçik klaviaturalarında mətn yazmaq çox yorucudur.

1. SMS mesajlarının diktəsi - tezliklə telefonunuzda mətn mesajları yazmağa ehtiyac qalmayacaq - sadəcə olaraq diktə edə bilərsiniz. Samsung bu funksiyanı bəzi telefon modellərində tətbiq edəcəyini vəd edir (onlar yaxın gələcəkdə bazarda görünməlidir).

2. Tərcümə – 2008-ci ildə Pekində keçirilən Olimpiya Oyunları zamanı daxili tərcüməçi ilə mobil telefonun meydana çıxacağı gözlənilir. Əgər siz Orta Krallıqda olarkən, məsələn, bir restoranda nahar etmək istəyirsinizsə, o zaman sifarişinizi yalnız rus dilində cib telefonunuza söyləməlisiniz - hər şey Çin dilinə tərcümə olunacaq və dinamikdən elektron səs sifarişi ofisiona çatdıracaq.

Güman etmək olar ki, zaman keçdikcə daha çox cihaz insan səsini anlayacaq. Odur ki, bir səhər qəhvə maşınınız nəinki kapuçino, yoxsa espresso hazırlayacağınızı soruşsa, həm də cavabınızı anlasa, təəccüblənməyin.

Windows Vista-da nitqin tanınması

Windows Vista nitqin tanınması proqramına daxildir. Təəssüf ki, bu komponent yalnız ingilis, alman, fransız, ispan, yapon və çin dillərini başa düşür. Komponenti ilk dəfə işə saldığınız zaman (İdarəetmə Panelində Siz Giriş Asanlığı və Nitqin tanınması elementlərini seçməlisiniz), sizi Windows prinsipləri ilə tanış etmək üçün sizə yarım saat vaxt aparacaq təlim ustası pəncərəsi açılır. səs nəzarəti. Bir neçə məşqi tamamladıqdan sonra siz səsli əmrlərdən istifadə edərək Windows-u necə diktə etməyi və idarə etməyi öyrənəcəksiniz. Nitqin tanınması proqramı dinamikdən asılı olduğundan, səsinizi eyni zamanda öyrənəcək. Giriş hissəsini uğurla mənimsədikdən sonra Windows zənginizə cavab verəcək: "Qulaq asın!" və səsli əmrləri qəbul etməyə başlayacaq. Dezavantaj: Səslə daxiletmə yalnız Microsoft proqramları üçün işləyir (məsələn, Windows-un özü, Word və ya Internet Explorer). Digər proqramlardan (məsələn, Open Office və ya Firefox) istifadə edərkən kompüter “kar” olacaq.

Yenilənib: Bazar ertəsi, 31 iyul 2017-ci il

Kompüterlə danışmağın yarı fantastik ideyasının peşəkar fotoqrafiya ilə nə əlaqəsi var? İnsanın bütün texniki mühitinin sonsuz inkişafı ideyasının tərəfdarı olmasanız, demək olar ki, heç biri. Bir anlıq təsəvvür edin ki, siz kameranıza fokus uzunluğunu dəyişmək və yarım stop plus ekspozisiya korreksiyası etmək üçün səsli əmrlər verirsiniz. Kameranın uzaqdan idarə edilməsi artıq həyata keçirilib, ancaq orada düymələri səssizcə basmaq lazımdır, amma burada eşitmə kamerası var!

İnsanla kompüter arasında səsli ünsiyyət nümunəsi kimi bəzi elmi fantastika filmlərini göstərmək ənənə halını alıb, məsələn, Stenli Kubrikin rejissoru olduğu “2001: Kosmik Odissey”. Orada bort kompüteri təkcə astronavtlarla mənalı dialoq aparmır, həm də kar kimi dodaqları oxuya bilir. Başqa sözlə, maşın insan nitqini səhvsiz tanımağı öyrənib. Ola bilsin ki, kameranın uzaqdan səslə idarə olunması bəziləri üçün lazımsız görünəcək, amma çoxları bu ifadəni istər "Bizi aşağı sal, balam" və xurma ağacının fonunda bütün ailənin fotoşəkili hazırdır.

Yaxşı, mən ənənəyə hörmət etdim və bir az xəyal qurdum. Ancaq ürəkdən danışsaq, bu məqaləni yazmaq çətin idi və hər şey Android 4 OS ilə smartfon şəklində hədiyyə ilə başladı. Bu HUAWEI U8815 modeli dörd düymlük kiçik sensor ekrana və ekran klaviaturasına malikdir. Onu yazmaq bir az qeyri-adidir, lakin məlum olur ki, bu, xüsusilə də lazım deyil. (şəkil 01)

1. Android ƏS ilə işləyən smartfonda səsin tanınması

Yeni oyuncaq sınayarkən axtarış çubuğunda mikrofonun qrafikini gördüm Google və Notes-da klaviaturada. Əvvəllər bu simvolun nə demək olduğu mənə maraqlı deyildi. Söhbətlərim oldu Skype, və klaviaturada yazılmış hərflər. İnternet istifadəçilərinin əksəriyyəti bunu edir. Ancaq sonradan mənə izah etdikləri kimi, axtarış sistemində Google rus dilində səsli axtarış əlavə edildi və brauzerdən istifadə edərkən qısa mesajları diktə etməyə imkan verən proqramlar meydana çıxdı "Chrome".

Üç sözdən ibarət bir cümlə dedim, proqram onları müəyyənləşdirdi və mavi fonlu bir kamerada göstərdi. Burada təəccüblənməli bir şey var idi, çünki bütün sözlər düzgün yazılmışdır. Bu xananı klikləsəniz, söz Android bloknotunun mətn sahəsində görünür. Ona görə də bir-iki cümlə daha dedim və köməkçiyə SMS vasitəsilə mesaj göndərdim.


2. Səsin tanınması proqramlarının qısa tarixi.

Səslə idarəetmə sahəsində müasir nailiyyətlərin məişət texnikasına, avtomobillərə və robotlara əmrlər verməyə imkan verməsi mənim üçün kəşf deyildi. Komanda rejimi Windows, OS/2 və Mac OS-in əvvəlki versiyalarında təqdim edilmişdir. Danışan proqramlara rast gəldim, bəs onların nə faydası var? Bəlkə də mənim özəlliyim odur ki, danışmaq mənim üçün klaviaturada yazmaqdan daha asandır, amma mobil telefonda ümumiyyətlə heç nə yaza bilmirəm. Kontaktları adi klaviatura ilə noutbukda yazmaq və USB kabel vasitəsilə köçürmək lazımdır. Amma sadəcə mikrofona danışmaq və mətni səhvsiz yazmaq mənim üçün bir xəyal idi. Ümidsizlik mühiti forumlarda müzakirələrlə qorunub saxlanıldı. Onların hər yerində belə bir kədərli fikir var idi:

“Lakin reallıqda bu günə qədər real nitqin tanınması üçün proqramlar (hətta rus dilində də) praktiki olaraq mövcud deyil və açıq şəkildə tezliklə yaradılmayacaq. Üstəlik, hətta tanınmanın tərs problemi - nitqin sintezi, belə görünür ki, tanınmaqdan qat-qat sadədir, tam həllini tapmayıb”. (ComputerPress No. 12, 2004)

“Hələ də normal nitqin tanınması proqramları yoxdur (təkcə rus dilində deyil), çünki kompüter üçün tapşırıq olduqca çətindir. Ən dəhşətlisi isə odur ki, sözün insanlar tərəfindən tanınması mexanizmi hələ reallaşdırılmayıb, ona görə də tanınma proqramları yaradanda ondan başlamağa heç nə yoxdur”. (Forumda başqa bir müzakirə).

Eyni zamanda, ingilis dilli səsli mətn daxiletmə proqramlarının nəzərdən keçirilməsi aydın uğurları göstərdi. Misal üçün, IBM ViaVoice 98 Executive Edition 64.000 sözdən ibarət əsas lüğətə və eyni sayda öz sözlərinizi əlavə etmək qabiliyyətinə malik idi. Proqramı öyrətmədən sözlərin tanınma faizi təxminən 80% təşkil etdi və müəyyən bir istifadəçi ilə sonrakı iş ilə 95% -ə çatdı.

Rus dilinin tanınması proqramları arasında ingilis dilli Dragon Dictate 2.5-ə əlavə olan “Qorynych”i qeyd etmək lazımdır. Axtarış, sonra isə baxışın ikinci hissəsində “beş Gorynich ilə döyüş” haqqında sizə məlumat verəcəyəm. İlk tapdığım "İngilis Əjdahası" oldu.

3. Davamlı nitqin tanınması proqramı “Təbii danışan əjdaha”

Şirkətin proqramının müasir versiyası "Nüans" Minsk Xarici Dillər İnstitutundan köhnə dostumla başa çatdı. Onu xaricə səfərdən gətirdi və “kompüter katibi” ola biləcəyini düşünərək aldı. Ancaq bir şey alınmadı və proqram laptopda qaldı, demək olar ki, unudulmuşdu. Heç bir aydın təcrübə olmadığına görə özüm dostumun yanına getməli oldum. Bütün bu uzun giriş mənim çıxardığım nəticələrin düzgün başa düşülməsi üçün lazımdır.

İlk əjdahamın tam adı belə idi: . Proqram ingilis dilindədir və içindəki hər şey hətta təlimat olmadan da aydındır. İlk addım onun ifasında sözlərin səs xüsusiyyətlərini müəyyən etmək üçün konkret istifadəçinin profilini yaratmaqdır. Mən bunu etdim - danışanın yaşı, ölkəsi və tələffüz xüsusiyyətləri vacibdir. Seçimim belədir: yaş 22–54 yaş, Böyük Britaniya İngilis dili, standart tələffüz. Sonra mikrofonunuzu konfiqurasiya etdiyiniz bir neçə pəncərə var. (şəkil 04)

Ciddi nitqin tanınması proqramlarının növbəti mərhələsi müəyyən bir insanın tələffüz xüsusiyyətlərinə dair təlimdir. Sizdən mətnin xarakterini seçmək xahiş olunur: mənim seçimim qısa imla təlimatıdır, lakin siz yumoristik hekayəni də “sifariş edə” bilərsiniz.

Proqramla işləməyin bu mərhələsinin mahiyyəti son dərəcə sadədir - mətn pəncərədə yuxarıda sarı ox ilə göstərilir. Düzgün tələffüz edildikdə, ox ifadələr arasında hərəkət edir və aşağıda məşq tərəqqi çubuğu var. Danışıq ingiliscəmi demək olar ki, unutmuşdum, ona görə də çətinliklə irəlilədim. Vaxt da məhdud idi - kompüter mənim deyildi və mən məşqi yarımçıq qoymalı oldum. Amma bir dostu dedi ki, o, yarım saatdan az vaxt ərzində testi verib. (şəkil 05)

Proqramın tələffüzümə uyğunlaşmasına icazə verməkdən imtina edərək, əsas pəncərəyə keçdim və daxili mətn redaktorunu işə saldım. O, kompüterdən tapdığı bəzi mətnlərdən ayrı-ayrılıqda sözlər danışırdı. Proqram onun düzgün dediyi sözləri çap etdi və zəif söylədiyi sözləri “İngilis dili” ilə əvəz etdi. İngilis dilində “sətir sil” əmrini aydın şəkildə tələffüz edən proqram onu ​​icra etdi. Bu o deməkdir ki, mən əmrləri düzgün oxuyuram və proqram onları əvvəlcədən məşq etmədən tanıyır.

Amma mənim üçün bu “əjdaha”nın rus dilində necə yazması vacib idi. Əvvəlki təsvirdən başa düşdüyünüz kimi, proqramı öyrədərkən yalnız ingilis dilini seçə bilərsiniz, orada rus dili yoxdur. Aydındır ki, rus dilində nitqin tanınmasını öyrətmək mümkün olmayacaq. Növbəti fotoda proqramın rusca “Salam” sözünü tələffüz edərkən hansı ifadəni yazdığını görə bilərsiniz. (şəkil 06)

İlk əjdaha ilə söhbətin nəticəsi bir qədər komik oldu. Rəsmi veb saytındakı mətni diqqətlə oxusanız, bu proqram məhsulunun ingilis dilində "ixtisaslaşmasını" görə bilərsiniz. Bundan əlavə, yükləyərkən proqram pəncərəsində "İngilis dili" oxuyuruq. Bəs bütün bunlar niyə lazım idi? Aydındır ki, forumlar və şayiələr günahkardır...

Amma faydalı təcrübə də var. Bir dostum laptopunun vəziyyətini görmək istədi. Nə isə yavaş-yavaş işə başladı. Bu təəccüblü deyil - sistem bölməsində yalnız 5% boş yer var idi. Lazımsız proqramları silərkən rəsmi versiyanın 2,3 GB-dan çox yer tutduğunu gördüm. Bu rəqəm sonradan bizə faydalı olacaq. (şəkil.07)



Rus nitqinin tanınması, göründüyü kimi, qeyri-ciddi bir iş idi. Minskdə bir dostumdan “Qorınıç” tapmağı bacardım. O, uzun müddət köhnə dağıntılarında diski axtarıb və onun sözlərinə görə, bu, rəsmi nəşrdir. Proqram dərhal quraşdırıldı və mən bildim ki, onun lüğətində 5000 rus sözü, üstəgəl 100 əmr və 600 ingilis sözü və 31 əmr var.

Əvvəlcə mikrofonu qurmalısınız, mən bunu etdim. Sonra lüğəti açıb sözü əlavə etdim "imtahan"çünki proqram lüğətində yox idi. Aydın və monoton danışmağa çalışdım. Nəhayət, Gorynych Pro 3.0 proqramını açdım, diktə rejimini yandırdım və bu “yaxın səslənən sözlər” siyahısını aldım. (şəkil.09)

Nəticə məni çaşdırdı, çünki o, Android smartfonunun işindən açıq şəkildə fərqlənirdi və mən ""-dan digər proqramları sınamaq qərarına gəldim. Google Chrome onlayn mağazası". Mən isə “qoriniç ilanları” ilə məşğul olmağı sonraya qədər təxirə saldım. Mən elə bilirdim təxirə salınma orijinal rus ruhunda hərəkət

5. Google-un səs imkanları

Adi Windows kompüterində səslə işləmək üçün brauzer quraşdırmalı olacaqsınız Google Chrome. Onlayn istifadə edirsinizsə, sağ altdakı proqram mağazası linkinə klikləyə bilərsiniz. Orada, tamamilə pulsuz olaraq, səsli mətn daxil etmək üçün iki proqram və iki uzantı tapdım. Proqramlar adlanır "Səs bloknot""Voicenot - səsdən mətnə". Quraşdırıldıqdan sonra onları sekmədə tapa bilərsiniz "Tətbiqlər" brauzeriniz "Xrom". (şəkil. 10)

Genişləndiricilər adlanır "Google Voice Search Hotword (Beta) 0.1.0.5""Səsli mətn daxiletmə - Speechpad.ru 5.4". Quraşdırıldıqdan sonra onlar nişanda söndürülə və ya silinə bilər "Uzantılar".(şəkil. 11)

VoiceNote. Chrome brauzerindəki proqram nişanında proqram simgesini iki dəfə klikləyin. Aşağıdakı şəkildəki kimi bir dialoq qutusu açılacaq. Mikrofon işarəsinə klikləməklə siz mikrofona qısa ifadələr danışırsınız. Proqram sözlərinizi nitqin tanınması serverinə ötürür və mətni pəncərədə yazır. Şəkildə göstərilən bütün sözlər və ifadələr ilk dəfə yığılmışdır. Aydındır ki, bu üsul yalnız aktiv İnternet bağlantısı olduqda işləyir. (şəkil. 12)

Səs bloknot. Proqramı proqramlar sekmesinden işə salsanız, yeni İnternet səhifəsi nişanı açılacaq Speechpad.ru. Bu xidmətdən necə istifadə etmək barədə ətraflı təlimat və kompakt forma var. Sonuncu aşağıdakı şəkildə göstərilmişdir. (şəkil. 13)

Səs daxiletmə Mətn sizə səsinizlə İnternet səhifələrində mətn sahələrini doldurmağa imkan verir. Məsələn, mən öz səhifəmə girdim "Google+". Yeni mesaj daxiletmə sahəsində, sağ klikləyin və seçin "Speechpad". Çəhrayı daxiletmə pəncərəsi mətninizi diktə edə biləcəyinizi göstərir. (şəkil. 14)

Google Səs Axtarışı səslə axtarış etməyə imkan verir. Bu uzantıyı quraşdırıb aktivləşdirdiyiniz zaman axtarış çubuğunda mikrofon simvolu görünür. Onu basdığınız zaman böyük qırmızı dairədə simvol görünəcək. Sadəcə axtarış sözünüzü deyin və o, axtarış nəticələrində görünəcək. (şəkil. 15)

Vacib qeyd: Mikrofonun Chrome genişləndirmələri ilə işləməsi üçün brauzerinizin parametrlərində mikrofona girişə icazə verməlisiniz. Təhlükəsizlik səbəbi ilə defolt olaraq söndürülür. Getmək Parametrlər → Şəxsi məlumat → Məzmun parametrləri. (Siyahının sonundakı bütün parametrlərə daxil olmaq üçün klikləyin Qabaqcıl parametrləri göstərin). Dialoq qutusu açılacaq Səhifə məzmunu parametrləri. Siyahının aşağısında bir element seçin Multimedia→mikrofon.

6. Rus nitqinin tanınması proqramları ilə işin nəticələri

Səsli mətn daxiletmə proqramlarından istifadədə kiçik bir təcrübə bu funksiyanın İnternet şirkətinin serverlərində əla tətbiqini göstərdi Google. Heç bir ilkin təlim olmadan sözlər düzgün tanınır. Bu, rus nitqinin tanınması probleminin həll olunduğunu göstərir.

İndi inkişafların nəticəsi deyə bilərik Google digər istehsalçıların məhsullarının qiymətləndirilməsi üçün yeni meyar olacaq. Mən istərdim ki, tanınma sistemi şirkətin serverlərinə daxil olmadan oflayn rejimdə işləsin - bu, daha rahat və daha sürətlidir. Ancaq rus nitqinin davamlı axını ilə işləmək üçün müstəqil proqramın nə vaxt buraxılacağı məlum deyil. Bununla belə, məşq etmək imkanı ilə bu "yaradılışın" əsl sıçrayış olacağını düşünməyə dəyər.

Rus tərtibatçılarının proqramları "Qorınıç", "Diktoqraf""Döyüş" Bu araşdırmanın ikinci hissəsində ətraflı məlumat verəcəyəm. Bu məqalə çox yavaş yazılmışdır ki, indi orijinal diskləri axtarmaq çətindir. Hal-hazırda məndə “Combat 2.52” istisna olmaqla, rus dilində səsin mətnin tanınması mühərriklərinin bütün versiyaları var. Dostlarımın və ya həmkarlarımın heç birinin bu proqramı yoxdur və mənim özüm də forumlarda yalnız bir neçə tərifli rəyim var. Düzdür, belə qəribə bir seçim var idi - SMS vasitəsilə "Mübarizə" yükləyin, amma xoşuma gəlmir. (şəkil 16)


Qısa videoçarx sizə nitqin tanınmasının Android əməliyyat sistemi ilə işləyən smartfonda necə işlədiyini göstərəcək. Səslə yazmanın özəlliyi Google serverlərinə qoşulma ehtiyacıdır. İnternetiniz belə işləməlidir

Qiymət: $199.99
Tərtibatçı ScanSoft
Veb sayt www.scansoft.com
Ölçü No
Yükləmə səhifəsi Yox
+
Ən geniş funksionallıq; bütün Windows proqramlarında işləmək; güclü lüğət verilənlər bazası
Yüksək qiymət
! Ən yaxşı nitqin tanınması proqramı mövcuddur

Mütləq ən yaxşı mövcud nitqin tanınması modulu! Əjdaha uzun tarixi ərzində əsgərdən marşala qədər bütün çətin yolu keçmişdir; yox, bəlkə də, hələ də marşala qədər deyil, amma o, şübhəsiz ki, ordu generalı adına layiq idi. Proqramla işləmək üçün bütün alqoritm olduqca sadədir - qulaqlıqları və mikrofonu audio kartdan müvafiq çıxışlara qoşuruq və yardım proqramının özünü işə salırıq. Əvvəlcə istifadəçidən mikrofondan səs səviyyəsini kalibrləməsi və sizin tembrinizə, intonasiyanıza və tələffüzünüzə uyğun olaraq Dragon Naturally Speaking-i dəqiq tənzimləmək üçün bir sıra hazır mətnləri kompüterə diktə etməsi tələb olunacaq. Və nəhayət, istifadəçiyə əsas səs əmrlərinin öyrədildiyi interaktiv dərslik.

Qeyd etmək lazımdır ki, PC canlı həmsöhbət deyil və o, "udulmuş" hecaları tamamlaya bilməz və ya oxunmayan bir cümləni başa düşə bilməz. Natiqin öz ləhcəsi də az əhəmiyyət kəsb etmir - məsələn, müxtəlif beynəlxalq elmi konfranslarda eşidilən ingilis dilinin səviyyəsi, prinsipcə, iş üçün yararsızdır. Digər tərəfdən, öz-özünə öyrənmə imkanı həmişə var: əgər Dragon müəyyən bir sözü tanımaq istəmirsə, Lingvo-ya baxmaq üçün vaxt ayırın və düzgün transkripsiyanı nəzərə alaraq onu tələffüz edin. Sizi əmin edirəm ki, maksimum bir və ya iki həftə ərzində siz nəinki kilobayt mətnləri asanlıqla diktə edəcəksiniz, həm də dostlarınız arasında əsl ingiliscə tələffüzünüzü nümayiş etdirəcəksiniz.

Hələ də tanınma keyfiyyətindən razı deyilsiniz? İstifadəçi profilinizi optimallaşdırmaq və populyar neologizmləri lüğətinizə necə əlavə etməyi sizə öyrətmək üçün yerli Dəqiqlik Mərkəzi ilə əlaqə saxlayın. Wav faylının mətn məzmununu (o cümlədən Cib PC-dən və ya birbaşa audio kartın xətti çıxışından) tanımaq kimi daha ekzotik hərəkətlər də mümkündür. Bundan əlavə, Dragon Naturally Speaking müxtəlif proqramları işə sala, onlar arasında keçid edə və hətta onların bir sıra funksiyalarına nəzarət edə bilər (məsələn, media pleyerində musiqinin səsləndirilməsini başlat/pauza və ya birbaşa menyu ilə işləyə bilər). Yaxşı, üstünlük verilən və peşəkar versiyalara əlavə olaraq öz nitq mühərrikimiz, bu gün ən qabaqcıllardan biri olan Real-Speech 2 daxildir.

Ancaq gəlin nitqin yazılmasına qayıdaq. Xüsusilə sevindirici olan odur ki, mətni təkcə DragonPad yerli mətn prosessorunda deyil, həm də istənilən digər oxşar proqramda - MS Word, Outlook Express, Internet Ex-plorer və Corel WordPerfect-də diktə edə bilərsiniz. Proqram ICQ, şəbəkə söhbəti (Network Assistant) və digər ani mesajlaşma proqramları ilə eyni müvəffəqiyyətlə işləyir; lakin, sonra bəzi əmrlər əlçatmaz olur, lakin hətta mesaj göndərmək üçün Daxil edin Basmağa ehtiyac yoxdur, sadəcə deyin: "Yeni paraqraf" - və ICQ bunu avtomatik edəcək. Daha ixtisaslaşmış tətbiqlərdə, xüsusən Word-də əlavə əmrlərdən istifadə olunur: mətnin formatlaşdırılması, orfoqrafiya, redaktə - və hamısı yalnız danışıq dili hesabına. Standart sifarişlər dəsti kifayət deyilsə, siz həmişə öz sifarişinizi yarada bilərsiniz və bununla da Dragon-un funksionallığını daha da genişləndirə bilərsiniz. Bir az səylə mətnin bir səhifəsini heç bir redaktə etmədən yazmaq olduqca mümkündür. Əsas odur ki, intonasiya və təbii ki, tələffüzün düzgün birləşməsidir. İfadələrinizi uzatmayın, ancaq pulemyot kimi cızma-qara etməyin, əks halda düzgün başa düşülən materialın faizi mütləq sıfıra düşəcək. Üstəlik, daim lüğətə baxmaq lazım deyil - proqrama məlum olan bəzi ifadəni düzgün tələffüz etməsəniz də (məsələn, mən çox xoşbəxtəm), o, avtomatik olaraq düzəltməyi "təxmin edəcək". mətn. Heyrətamiz? Söhbət qabaqcıl nitqin tanınması texnologiyası ilə yanaşı, rəqiblərə heç bir şans qoymayan nəhəng lüğətdən gedir. Bu sətirlərin müəllifinin keçmişdə çox əziyyət çəkdiyi, lakin onlardan heç vaxt yüksək keyfiyyətli iş əldə etmədiyi Əjdahanın ilk versiyalarını necə xatırlamayaq...

Ağıllı Səsin Tanınması Sistemi (IVOS) 2.0.2A
Shareware (30 günlük sınaq, qeydiyyat - $50)
Tərtibatçı ComunX
Veb sayt www.ivos.biz
Ölçü 2.69 MB
Yükləmə səhifəsi ftp://ftp.download.com/
pub/ppd/1007091810190380/
setup_ivos.exe
+
Mikroskopik paylanma ölçüsü; əla funksionallıq
Nitq stenoqramı rejimi hələ Dragon səviyyəsinə çatmayıb
! Bu sahədə ən yaxşı kommunal xidmətlərdən biridir

İcmaldakı ən təvazökar (paylama ölçüsü baxımından) proqram təəccüblü dərəcədə layiqli olduğunu sübut etdi və yüksək səsli adını əsaslandırdı. Bunun səbəbi, məlumatların "əl ilə" daxil edilməsi vasitələrini tamamilə aradan qaldırmaq üçün nəzərdə tutulmuş çox yönlü olmasıdır. Beləliklə, IVOS sizə imkan verir: a) nitqi tanımaq və onu istənilən Windows-a uyğun mətn prosessorunda mətnə ​​çevirmək; b) müxtəlif səsli əmrlərdən istifadə edərək kompüterinizi idarə edin, həmçinin öz kompüterinizi yaradın; c) xarici səs mühərriklərindən istifadə edərək elektron kitablar üzərində səs. Üstəlik, əlbəttə ki, Wav fayllarından mətn çıxarmaq, ekrana yük verməyən rahat proqram idarəetmə paneli və əlverişli (eyni Dragon ilə müqayisədə) qiymət kimi kiçik şeylər. Qeydiyyatdan keçdikdən sonra istifadəçi öz şifahi əmrlərinizi PC-yə öyrətməyə imkan verən VoiceTouch texnologiyasına çıxış əldə edir.

Komanda icrasının səmərəliliyi təəccüblü dərəcədə yüksəkdir - bəlkə də Realize Voice-dan daha yaxşıdır. Amma “mühazirələr”in tanınma səviyyəsi daha aşağı olacaq, bu da qəribə deyil: bir neçə sözü başa düşmək bir şeydir, bütöv bir cümləni başa düşmək tamam başqa şeydir. Qeyd edək ki, “Dragon”dan başqa bir çox digər nitqin tanınması proqramları kimi “IVOS” da belə məqsədlər üçün “Microsoft”un “Speech API” modulundan istifadə edir və onun bu sahədə effektivliyi birbaşa olaraq bu korporasiyanın yaradıcılıq uğurundan asılıdır. Buna baxmayaraq, siz indi IVOS-un ehtiyatında olan bütün təlim mətnlərini proqrama oxumaqla yüksək keyfiyyətli işə nail ola bilərsiniz. Əlbətdə ki, sonda o, Dragon Naturally Speaking səviyyəsinə çatmayacaq, lakin o, çox mürəkkəb olmayan sənədləri yazmağı bacarır. İstifadəçi lüğətini mütəmadi olaraq yeniləsəniz, elmi terminlərlə bağlı heç bir xüsusi problem olmayacaqdır. Düzdür, burada dilemma yaranır - kommunal proqramına nitqlə işləməyin bütün incəliklərini öyrətməyə sərf edilməli olan həftədə klaviaturada on barmaq toxunuşla yazmaq üsulunu tez mənimsəmək olduqca mümkündür... Digər tərəfdən Əlbətdə ki, bir kompüter istifadəçisinin ixtisasları yalnız kompüterə məlumat daxil etmək üçün bir neçə üsula sahib olduqda artacaq.

Realize Voice 4.0

Realize Voice 4.0
Shareware (15 günlük sınaq, qeydiyyat - $49.00)
Developer Realize Software Corporation
Veb sayt www.realizesoftware.com
Ölçü 55 MB
Yükləmə səhifəsi
www.realizesoftware.com/
download/RzRV40download.exe (Veb quraşdırıcı)
+
İstifadəçinin tələffüzünə iddiasız; əmrlərin çox geniş spektri
İşin keyfiyyəti hələ də daha yaxşı ola bilərdi; yalnız Windows-un ingilis versiyasında quraşdırılır
! Yalnız səsinizlə kompüterinizi idarə edin

Realize Voice, əvvəllər nəzərdən keçirilmiş Dragon Naturally Speaking-dən fərqli olaraq, stenoqrafiya qabiliyyətinə malik deyil (baxmayaraq ki, onun arsenalında belə bir funksiya var), lakin səs əmrləri ilə mükəmməl şəkildə öhdəsindən gəlir. Maraqlısı odur ki, ingilis dilini fövqəladə dərin biliyə ehtiyacınız yoxdur - ağıllı evristik analizator modulu sayəsində proqram demək olar ki, hər bir natiqlə asanlıqla ümumi dil tapacaq. Realize Voice funksiyalarının diapazonu kifayət qədər genişdir: icra olunan faylları və proqram qısa yollarını işə salmaqdan yazışmalar və mürəkkəb makrolarla işləməyə qədər. Digər oxşar proqramlarda olduğu kimi, istifadəçiyə sadəcə qoşulmuş mikrofona və hər şeyi başa düşmək üçün bir neçə dəqiqəyə ehtiyac var. Kommunal ilə həqiqətən əlaqə qurmağa başlamazdan əvvəl, bunun üçün işin həcmini müəyyənləşdirməyə dəyər. Varsayılan olaraq, sistem menyusu qısa yolları bu kateqoriyaya aiddir, İş masası, qovluq məzmunu Sevimlilər və Quick Launch panelləri, həmçinin bu yaxınlarda açılmış sənədlər və proqramlar. Bütün proses tam avtomatlaşdırılmışdır və sözün əsl mənasında dərhal tamamlanır. Düzdür, bəzi narahatlıqlar əmrlərin adlarında nömrələrdən istifadə edə bilməməkdən qaynaqlanır - məsələn, DOOM 3-ü səsli əmrdən istifadə edərək yalnız qısa yolunu "DOOM Three" olaraq dəyişdirməklə işə sala bilərsiniz. Eyni şey, yeri gəlmişkən, kiril əlifbasına da aiddir - o qədər də şən perspektiv deyil, elə deyilmi? Bununla belə, belə bir halda, siz həmişə maraqlandığınız fayl/sənəd/qrafik təsvirin yolunu və s.-ni birbaşa göstərərək proqramı əl ilə qurmağa müraciət edə bilərsiniz. Burada faylın adı və onun koordinatlarının heç bir əhəmiyyəti yoxdur. hamısı - abvgd.exe olsa belə, bəli Və İş masası onu sındırmaq məcburiyyətində olmayacaqsınız. Windows ilə işləmək üçün daxili sistem əmrləri dəstindən də çox məmnun oldum - çox böyük olmasa da, açıq pəncərələr arasında hərəkət edə və ən çox yayılmış düymələrin hərəkətlərini təqlid edə bilər ( Boşluq çubuğu, Daxil et, Əsas səhifə və s.), onun köməyi ilə sistemi söndürmək və bloklamaq olduqca mümkündür.

Bir az makrolar haqqında. Faydalı proqram bütün əməliyyatları bir komanda altında birləşdirməyə imkan verir - klaviatura və sistem əmrlərindən simvolların daxil edilməsindən tutmuş daxili səs mühərrikindən istifadə edərək nitq sintezinə qədər. Düzdür, tək bir cümlə ilə CD yazmaq kimi idil hələ çox uzaqdadır, amma bunu zaman göstərəcək... Əsas odur ki, indi siçan kimi heç bir anaxronizm olmadan ev heyvanınızı “idarə edə” (və uğursuz deyil!) və klaviatura. Sınayın - peşman olmayacaqsınız!

Voice Studio 1.4.6

Voice Studio 1.4.6
Shareware (7 günlük sınaq, qeydiyyat - $20.97)
Developer Ultimate Interactive Desktop's
Veb sayt www.voicestudio.us
Ölçü 57 MB
Yükləmə səhifəsi
ftp://ftp.voicestudio.us/
pub/dl2/vssetup.exe
+
Əla funksionallıq; "canlı" cizgi personajının olması; çox aşağı qiymət
MS SAPI nitqin tanınması üçün istifadə olunur; kifayət qədər yüksək resurs intensivliyi
! Səsinizlə kompüterinizi idarə etmək üçün Dragon-a əla əlavə

Ola bilsin ki, bu, monitorun o biri tərəfindəki virtual həmsöhbətimizin nəhayət maddi formaya sahib olduğu azsaylı, hətta tək belə proqramlardan biridir. Və bu məqsədlər üçün istifadə edilən MS Agent texnologiyasını süni intellektin prototipi adlandırmaq çətin olsa da, bunun üçün bütün ilkin şərtlər var. Animasiyalı köməkçi təkcə müəyyən dərəcədə müstəqillik qazanmır, həm də bir sıra standart ifadələrə (“Salam!”, “Özünü necə hiss edirsən”, “Pis kompüter” və s.) necə cavab verməyi bilir. İstəyirsinizsə, onun lüğət və frazeoloji ehtiyatı asanlıqla doldurula bilər və əlavə olaraq, onun "əhval-ruhiyyəsindən" asılı olaraq hərəkətləri təyin edilə bilər. Bir PC ilə belə söhbət proqramın bilik dairəsi ilə məhdudlaşsa da, heç kim onu ​​demək olar ki, qeyri-müəyyən müddətə genişləndirməkdən narahat deyil. Və orada bədnam süni intellektdən bir daş atma məsafəsi var... Bununla belə, mən bir az kənara çəkilirəm.

Əslində, hər şey Voice Studio-nun funksionallığına uyğundur - stenoqrafiya (Dragon daha yaxşı olsa da), müxtəlif səs əmrləri (daha rahatlıq və daha sürətli yadda saxlamaq üçün onları çap etmək olar), eləcə də məqbul maşın nitq sintezi. Daha ciddi şeylərə bir açar sözdən istifadə edərək bir anda bir sıra əməliyyatları başlamaq üçün makrolar yaratmaq, hətta siçan hərəkətlərini yazmaq və oxutmaq daxildir! Nəzərinizə çatdırım ki, sonuncu “xüsusiyyət” GreenBrowser və ya MyIE2 kimi bir çox alternativ brauzerlərdə bir sıra hərəkətləri yerinə yetirmək üçün (başqa səhifəyə keçmək, yeni pəncərə açmaq və s.) geniş istifadə olunur. İndi lazımsız jestlərə ehtiyacınız yoxdur - sadəcə müvafiq əmri deyin və kompüter avtomatik olaraq əvvəllər yazılmış skripti yenidən yaradacaq. Kim bilir, bəlkə tezliklə biz sadəcə mikrofondan istifadə edərək oyun oynaya biləcəyik? Zaman göstərəcək...

Bu arada, Voice Studio, şübhəsiz ki, heyrətamiz dostluğu və istifadə rahatlığı üçün ən yüksək reytinqə layiqdir. O, hələ nitqi düzgün yaza bilməyə bilər, lakin səslə kompüteri idarə etmək sadəcə müqayisə olunmazdır. Bu kommunalların ən yaxşısı və Dragon-a layiqli əlavə!

Diktasiya 2004 v.4.5.2399

Diktasiya 2004 v.4.5.2399
Shareware (7 günlük sınaq, qeydiyyat - $49.99)
Developer United Research Labs
Veb sayt www.research-lab.com
Ölçü 41 MB
Yükləmə səhifəsi
www.bandwidthsaver.com/
downloads/dict2002.zip
+
PC-yə nəzarət və nitqin qeydi üçün əsas funksiyalar dəsti; wav faylları ilə əla iş
Ən yaxşı nitqin tanınması performansı deyil; zəhlətökən mətn redaktə modulu
! Bu qiymətə çox azdır

Tamamilə standart görünən əsas bacarıqlara baxmayaraq, Dictation 2004 hələ də bir şeylə öyünə bilər. Əvvəla, bu, demək olar ki, bütün Windows proqramlarında parolların daxil edilməsi, proqram təminatının işə salınması və diktə etmək üçün asanlıqla əmrlər yaratmağa imkan verən Point-and-Speak texnologiyasıdır. MS Word ilə inteqrasiya elan edilir, həmçinin ifadələrin düzgün müəyyən edilməsi üçün intellektual texnologiya. Doğrudur, bu, son dərəcə əlverişsiz bir şəkildə həyata keçirilir - hər deyilən sözlə görünən və yalnız işləmək istəyini azaldan bir pop-up pəncərəsi şəklində. Onu söndürə bilsən yaxşıdır. Dictation 2004 eyni SAPI 5.1-dən istifadə edir, ona görə də onun keyfiyyəti eyni texnologiyaya əsaslanan digər proqram təminatından (Voxx, IVOS, Realize Voice və s.) əsaslı şəkildə fərqlənmir. Əlavə funksiyalar arasında audio kasetlərdən, mobil cihazlardan, mikrofonlardan məlumat almaq və sonra wav fayllarına yazmaq üçün WAV Recorder-i qeyd etmək lazımdır; sonra mətn ayrıca Dictation appletindən istifadə edərək onlardan çıxarılır - Wave-to-Text. Hələlik, təbii ki, hələ idealdan uzaqdır, amma diktorun aydın nitqi və yaxşı tələffüzü varsa, o zaman heç bir problem olmayacaq.

+
İşdə çox yönlülük; müxtəlif imkanlar
— Proqramı "təlim" etmək çox vaxt aparacaq ! Maraqlı məhsuldur, amma daha yaxşı ola bilərdi...

PC ilə ürəyinizə çatmaq üçün söhbət etməyə imkan verən başqa bir "bütün ticarətin yuvası". Proqram xüsusiyyətlərinin siyahısı IVOS (stenoqrafiya/səs əmrləri/mətn oxunması) ilə çox oxşardır, istisna olmaqla, faydalı bir bonus var - faylın yazılması və ya açılmasından asılı olmayaraq, hər bir hərəkətinizin ciddi səslə hərəkət etməsi. Proqram IVOS ilə eyni Microsoft Speech API istifadə edir, ona görə də onun tanınma keyfiyyəti oxşardır. Brauzerdə naviqasiya üçün yaxşı səs əmrləri dəsti, mətn redaktorunda əsas əməliyyatlar (kəsmək/kopyalamaq/yapışdırmaq və s.), həmçinin pəncərələrlə işləmək, sistem proqramlarına zəng etmək, hətta açmaq/bağlamaq üçün qısa yollar mövcuddur. optik sürücü tepsisi - ümumiyyətlə, rahat iş üçün hər şey. Nitq sintezinə gəldikdə, bu, birbaşa sistemdə quraşdırılmış müvafiq modullardan asılıdır. Proqramla birlikdə gələn Microsoft-dan pulsuz mühərriklər idealdan uzaqdır, lakin prinsipcə, onlara öyrəşə bilərsiniz. Təəssüf ki, pulsuz deyil, daha rahat bir seçim üçüncü tərəfin inkişaflarını, xüsusən də çox yaxşı rus dilində diktoru olan Digit PC-ni sınamaqdır. Bütün müsbət və mənfi cəhətləri nəzərə alsaq, Voxx almaq üçün yaxşı bir namizəd olardı. Yeri gəlmişkən, sınaq versiyası yalnız bir seansdakı ifadələrin/əmrlərin sayı ilə məhdudlaşır; Yeni sessiyaya başlamaq üçün proqramı yenidən başladın...

Nəticə

Hələ də çoxsaylı çatışmazlıqlara baxmayaraq, nitqin tanınması proqramları artıq oyuncaqlar səviyyəsindən iş adamı üçün ciddi bir vasitəyə çevrilmişdir. Əgər əvvəllər onların az faydası var idisə, indi həqiqətən də istifadəçinin həyatını asanlaşdıra və kompüterin sadəcə ədədləri döyəcləyən dəmir qutu olması kimi əvvəllər sarsılmaz olan stereotipi məhv edə bilər. Və əlbəttə ki, ən xoş fakt, çoxsaylı elmi fantastika yazıçılarının tez-tez yazdıqları 21-ci əsrin texnoloji tərəqqisini yaşamaq imkanıdır. Bizə qoşul!