Rusça ses tanıma programı. Konuşma tanıma yazılımı

Bir müzik çaları ve bir metin düzenleyiciyi birleştiren, Windows ve Mac OS için belki de en uygun metin kopyalayıcı. Çalışma prensibi çok basittir - programa bir ses dosyası yükleyin, klavyedeki kısayol tuşlarını kullanarak dinleyin (bunları kendiniz atayabilirsiniz) ve aynı anda metin yazın. Oynatma hızı ve ses seviyesi de klavye kullanılarak kontrol edilir. Böylece elleriniz sürekli klavyede oluyor ve fareyi kullanmanıza ya da farklı programlar arasında geçiş yapmanıza gerek kalmıyor. Yerleşik metin düzenleyicinin hataları tanımadığını ve kısa çizgilerdeki kısa çizgileri değiştirmek gibi diğer pek çok tanıdık özelliğe sahip olmadığını unutmayın. Ancak, ses çalmayı kontrol etmek için klavye kısayollarını kullanarak Express Scribe'ın yanı sıra diğer metin düzenleyicileri de kullanabilirsiniz. Program shareware, tam maliyet: 17-50 dolar.


02. Transcriber yanlısı



Yalnızca ses dinlemenizi değil, aynı zamanda video dosyalarını da görüntülemenizi sağlayan, Windows için Rusça bir program. Yerleşik metin düzenleyici, muhatapların zaman damgalarını ve adlarını yazma yeteneğine sahiptir. Ortaya çıkan metin, bir grup projesinin parçası olarak düzeltilebileceği gibi, "etkileşimli transkriptlere" aktarılabilir. Uygulama yalnızca yıllık abonelikle kullanılabilir, maliyeti yılda 689 ruble.


03.RSplayer V1.4



Kısayol tuşları desteği ve Microsoft Word'de metin yazma yeteneği ile ses dosyalarını işlemek ve yazıya dökmek için basit bir program. Önceki benzer programların aksine, ücretsiz olarak indirilebilir, ancak Windows'un yeni sürümlerinde kararsızdır.

04. ses

Konuşmadan metne dönüştürme için profesyonel bir Windows uygulaması. Herhangi bir test tarayıcısında sesle yazmayı destekler, geniş bir tematik sözlük koleksiyonuna sahiptir ve konuşma tanıma için İnternet bağlantısı gerektirmez. "Voco.Professional" ve "Voco.Enterprise" genişletilmiş sürümleri, hazır ses dosyalarıyla çalışabilir. Tek dezavantajı, uygulamanın yüksek maliyetidir.


05. Ejderha Diktesi



Dikte edilen konuşma tanıma için ücretsiz mobil uygulama. Program yaklaşık 40 dili ve çeşitlerini tanıyabilir, metni düzenlemenize ve postaya, sosyal ağlara göndermenize veya panoya kopyalamanıza olanak tanır. Çalışmak için internet bağlantısı gereklidir.


06.Gerçek Konuşmacı



Yalnızca ses dosyalarını değil, aynı zamanda kameraya konuşulan canlı konuşmayı da tanıyabilen benzersiz bir uygulama. RealSpeaker, özel bir video uzantısı sayesinde dudak hareketlerini okur ve böylece konuşma tanıma sürecini diğer benzer algoritmalara kıyasla %20-30'a kadar iyileştirir. Şu anda uygulama 11 dili desteklemektedir: Rusça, İngilizce (Amerikan ve İngiliz lehçeleri), Fransızca, Almanca, Çince, Korece ve Japonca, Türkçe, İspanyolca, İtalyanca ve Ukraynaca. Program şartlı olarak ücretsiz olarak dağıtılır, maliyet abonelik süresine bağlıdır, kalıcı sürüm yaklaşık 2 bin rubleye mal olur.

Modern, olaylarla dolu dünyamızda, bilgiyle çalışma hızı başarının mihenk taşlarından biridir. Bilgileri ne kadar hızlı aldığımız, yarattığımız, işlediğimiz, çalışma üretkenliğimize ve üretkenliğimize ve dolayısıyla anlık maddi zenginliğimize bağlıdır. Çalışma yeteneklerimizi artırabilen araçlar arasında, konuşmayı metne çevirme programları, ihtiyacımız olan metinleri yazma hızını önemli ölçüde artırabilen önemli bir yer tutar. Bu yazıda size sesi metne çevirmek için popüler programların neler olduğunu ve özelliklerinin neler olduğunu anlatacağım.

Sesi metne çevirmek için şu anda mevcut olan programların çoğu ücretlidir ve bir mikrofon için bir takım gereksinimler sunar (programın bir bilgisayar için tasarlanması durumunda). Bir web kamerasına yerleştirilmiş ve standart bir dizüstü bilgisayar kasasına yerleştirilmiş bir mikrofonla çalışmanız kesinlikle önerilmez (bu tür cihazlardan konuşma tanıma kalitesi oldukça düşüktür). Ayrıca, konuşmanızın tanınma düzeyini doğrudan etkileyebilecek gereksiz gürültünün olmadığı, sessiz bir ortamın olması da oldukça önemlidir.

Aynı zamanda, bu programların çoğu, yalnızca bilgisayar ekranındaki konuşmayı metne dönüştürmekle kalmayıp, aynı zamanda bilgisayarınızı kontrol etmek için sesli komutlar kullanma (programları başlatma ve kapatma, e-posta alma ve gönderme, web sitelerini açma ve kapatma) yeteneğine sahiptir. , ve benzeri).

Konuşmadan metne programı

Konuşmayı metne çevirmeye yardımcı olabilecek programların doğrudan açıklamasına geçelim.

"Laitis" Programı

Ses tanıma için ücretsiz Rusça program "Laitis", konuşmayı anlama konusunda iyi bir kaliteye sahiptir ve yaratıcılarına göre, kullanıcının tanıdık klavyesini neredeyse tamamen değiştirebilir. Program ayrıca sesli komutlarla da iyi çalışır ve onların yardımıyla bilgisayarınızı yönetmek için birçok eylemi gerçekleştirmenize olanak tanır.

Programın çalışması için bilgisayarda zorunlu olarak yüksek hızlı İnternet bulunması gerekir (program, Google ve Yandex'in ses tanıma ağ hizmetlerini kullanır). Programın yetenekleri, web tarayıcınıza Laitis'ten (Chrome, Mozilla, Opera) özel bir uzantı yüklemeniz gereken sesli komutları kullanarak tarayıcınızı kontrol etmenize de olanak tanır.

"Dragon Professional" - ses kayıtlarının metne dönüştürülmesi

Bu yazının yazıldığı sırada, bir dijital İngilizce ürünü « Dragon Professional Individual "tanınmış metinlerin kalitesinde dünya liderlerinden biridir. Program yedi dili anlıyor (şimdiye kadar yalnızca Dragon Anywhere mobil uygulaması ve üzerinde Rusça ile çalışıyor), yüksek kaliteli ses tanıma özelliğine sahip ve bir dizi sesli komut gerçekleştirebiliyor. Aynı zamanda, bu ürün yalnızca ücretli bir karaktere sahiptir (ana programın fiyatı 300 ABD dolarıdır ve Dragon Home ürününün "ev" versiyonu için alıcının 75 ABD doları ödemesi gerekecektir).

Çalışması için, Nuance Communications'ın bu ürünü, programın özelliklerini sesinizin özelliklerine uyarlamak için tasarlanmış kendi profilinin oluşturulmasını gerektirir. Metni doğrudan dikte etmeye ek olarak, programı bir dizi komutu yürütmesi için eğitebilir, böylece bilgisayarla etkileşiminizi daha uyumlu ve kullanışlı hale getirebilirsiniz.

"RealSpeaker" - ultra hassas konuşma tanıyıcı

Sesi metne dönüştürme programı " RealSpeaker", bu tür programlar için standart işlevlere ek olarak, PC'nizin web kamerasının özelliklerini kullanmanıza olanak tanır. Artık program sadece sesin ses bileşenini okumakla kalmıyor, aynı zamanda konuşmacının dudaklarının köşelerinin hareketini de yakalayarak telaffuz ettiği kelimeleri daha doğru bir şekilde tanıyor.


"RealSpeaker" yalnızca sesi değil, aynı zamanda konuşma sürecinin görsel bileşenini de okur

Uygulama ondan fazla dili (Rusça dahil) destekler, aksanları ve lehçeleri dikkate alarak konuşmayı tanımanıza olanak tanır, ses ve videoyu yazıya dökmenize olanak tanır, buluta erişim sağlar ve çok daha fazlasını sağlar. Program bir shareware, ücretli sürüm için oldukça gerçek para ödemeniz gerekecek.

"Voco" - program sesi hızlı bir şekilde bir metin belgesine çevirecektir

Bir başka sesten metne dönüştürücü, "ev" sürümünün fiyatı şu anda yaklaşık 1.700 ruble olan ücretli Voco dijital ürünüdür. Bu programın daha gelişmiş ve pahalı sürümleri - "Voco.Professional" ve "Voco.Enterprise", bir dizi ek özelliğe sahiptir; bunlardan biri, kullanıcının kullanabileceği ses kayıtlarından konuşma tanımadır.

"Voco" özellikleri arasında, programın kelime dağarcığını (şu anda programın kelime dağarcığı 85 binden fazla kelime içeriyor) ve ayrıca ağdan çevrimdışı çalışmasını sağlayarak bağımlı olmamanızı sağlıyor. İnternet bağlantınız.


"Voco" nun avantajları arasında programın yüksek öğrenme yeteneği vardır.

Uygulama oldukça basit bir şekilde açılır - "Ctrl" tuşuna çift tıklamanız yeterlidir Uygulama tamamen ücretsizdir, Rusça dahil birkaç düzine dili destekler.

Çözüm

Yukarıda, sesli ses kaydınızı metne çevirmek için programları listeledim, genel işlevlerini ve karakteristik özelliklerini açıkladım. Bu ürünlerin çoğu genellikle ücretlidir, oysa Rusça programların kapsamı ve kalitesi, İngilizce dilindeki benzerlerinden nitelik olarak daha düşüktür. Bu tür uygulamalarla çalışırken, mikrofonunuza ve ayarlarına özellikle dikkat etmenizi öneririm - bu, konuşma tanıma sürecinde önemlidir, çünkü kötü bir mikrofon, düşündüğüm türdeki en yüksek kaliteli yazılımı bile geçersiz kılabilir.

İki tür konuşma tanıma programı vardır:

1. Konuşmacıya bağlı - bu programlar sürekli olarak öğreniyor ve zamanla "ustalarının" sesini giderek daha iyi anlamaya başlıyor. Kullanıcı programda ne kadar sık ​​çalışırsa, onu o kadar iyi anlar. Neyse ki, öğrenme oldukça hızlı gerçekleşir - yaklaşık 20 dakika sonra program sizi oldukça iyi anlamayı öğrenecektir.

2. konuşmacıdan bağımsız - hemen konuşmaya başlayabilirsiniz - program sesli komutlara cevap verecektir. İlk türden farklı olarak, bu programların sizi anlamayı öğrenmesi gerekmez. Aksine programın sizi anlaması için konuşmayı öğrenmeniz gerekiyor.

PC'de kullanılan konuşma tanıma programı ne için kullanılır?

Bir konuşma tanıma programı kurarsanız, artık bir klavyeye ve fareye ihtiyacınız olmayacağını, ancak bir bilgisayarda çalışmanın çok daha kolay olacağını düşünmeyin.

1. Dikte - konuşma tanıma programlarının yardımıyla birçok kullanıcı belgelerin metinlerini dikte eder. Bu olasılık, örneğin muayeneyi yürüten (ellerinin genellikle meşgul olduğu) ve aynı zamanda sonuçlarını kaydeden doktorlar için geçerlidir. Herhangi bir nedenle metin yazmayı zor bulan (veya çok tembel olan) sıradan bir kullanıcı için de yararlı olabilir.

2. Komutları girme - PC kullanıcıları komutları girmek için "tanıma"yı kullanabilirler, yani konuşulan sözcük sistem tarafından bir fare tıklaması olarak algılanacaktır. Kullanıcı komutları: "Dosya aç", "Posta gönder" veya "Yeni pencere" ve bilgisayar uygun eylemi gerçekleştirir. Bu özellikle engelli insanlar için geçerlidir - fare ve klavye yerine bilgisayarı sesleriyle kontrol edebileceklerdir.

Konuşma tanıma için ne gereklidir?

1. Konuşma tanıma programı - İngilizce konuşan Windows kullanıcıları, örneğin Dragon Naturally Speaking veya IBM Via Voice'u kullanabilir. Rus dili, Gorynych ve Dictograph programları tarafından anlaşılmaktadır. Konuşma tanıma zaten Windows Vista işletim sisteminde yerleşiktir.

2. Mikrofon veya kulaklık (kulaklık ve mikrofondan oluşan bir melez) - sözcükleri bilgisayara "vurmak" için.

3. Yeterince güçlü bilgisayar - konuşma tanıma işlevinin çalışması için bilgisayarın ultra hızlı olması gerekmez. 1 GB RAM yeterlidir (Windows Vista için 2 GB olması daha iyidir) ve işlemci saat hızı en az 1 GHz'dir.

Hangi cihazlar konuşma tanımayı kullanır?

Konuşma tanıma işlevi yalnızca bir PC'de değil, diğer birçok cihazda da kullanılabilir. Bu, özellikle "gadget" küçük tuşlara sahip (veya hiç olmayan) kompakt bir klavyeye sahipse doğrudur.

1. Cep telefonları - birkaç yıldır sesle kontrol edilebilen modeller var. Ancak bunun ses tanıma ile hiçbir ilgisi yoktur - cihaz sesi metne çevirmez, ancak konuşulan ifadeyi önceden kaydedilmiş olanla karşılaştırır (ikincisi bir "referanstır" ve genellikle "ses etiketi" olarak adlandırılır). Bir ses etiketi, bir adres defteri girişine (sesle arama) veya bir menü öğesine (sesle kontrol) karşılık gelebilir. Telefon başlangıçta uygun işlevlere sahip değilse, onu "eğitmek" imkansız olacaktır.

2. Mobil gezginler - örneğin Tom Tom Go 720T gibi yeni navigasyon cihazlarında, sürücü hedefi sesle girebilir. Kelimeleri net bir şekilde ve mümkünse sessizce telaffuz ederseniz, bu işlev çok iyi çalışır. Bu işlem, klavye girişi ile aynı süreyi alsa da, sürüş sırasında ses kontrolünü kullanmak daha güvenli ve daha uygundur. Doğru, eller olmadan kimse yapamaz - sesli komutu başlatmak için ekran düğmesine basmanız gerekir.

3. Arabalar - Mercedes, Audi, Toyota, Ford veya BMW gibi bazı yeni otomobil markaları sesle kontrol edilebilir (komut dizisi sınırlı olsa da). Örneğin, bazı BMW modellerinde, direksiyon simidinde bulunan düğmeye basıldıktan sonra (şekle bakın), stereo veya navigasyon sisteminin sesle kontrol işlevleri etkinleştirilir.

4. Yabancı dil öğrenmek için multimedya diskler - bazı öğrenme programları doğru telaffuzu kontrol eder. Program sizden belirli bir cümleyi okumanızı ister ve konuşma tanıma işlevini kullanarak sonucu işledikten sonra telaffuzunuzla her şeyin yolunda olup olmadığını bildirir.

"Tanıma" programlarıyla çalışırken ne gibi sorunlar ortaya çıkıyor?

Cihazları kontrol etmek veya metinleri dikte etmek yeterince iyi yapılır, ancak ne yazık ki mükemmel değildir. Ve bunun birkaç nedeni var:

1. Kelimeler her zaman aynı şekilde ses çıkarmaz - konuşma tanımadaki en büyük zorluk, çok uğraşsalar bile kimsenin aynı kelimeyi aynı şekilde telaffuz etmemesidir.

2. Herkes farklı konuşur - bu nedenle, yeni bir kullanıcı onu biraz önce "pratik yaparsa" bir konuşma tanıma programı daha net çalışacaktır. Doğru, bu her zaman mümkün değildir ve bazen, örneğin muhatapla bağlantılı olmayan programları kullanırken gerekli bile değildir. Birçok konuşma tanıma programı, yeni bir kullanıcıya otomatik olarak uyum sağlayabilir.

3. Arka plan sesleri, konuşulan kelimenin sesini önemli ölçüde bozabilir. Bu, konuşma tanımanın işlevlerini büyük ölçüde sınırlar ve kalabalık veya gürültülü yerlerde bunu tamamen imkansız hale getirir.

4. Hızlı konuşma - bazı kullanıcılar çok hızlı konuşur - kelimeler neredeyse birleşir. Muhatap böyle bir konuşmayı kolayca anlayacaktır, ancak program böyle bir görev için çok zor olacaktır.

5. Aynı (veya çok benzer) sese sahip kelimeler - sözde sesteş sözcüklere sahip konuşma tanıma programları için özellikle zordur - neredeyse aynı şekilde telaffuz edilen ancak farklı hecelenen kelimeler ("lez" ve "orman", "ağız") ve "cins"). Program, bu tür kelimelerin anlamlarını cümlenin bağlamına göre belirlemelidir.

Konuşma tanıma işlevinin beklentileri nelerdir?

Cep telefonlarında konuşma tanıma işlevinin rolü önemli ölçüde artacaktır çünkü küçük cep telefonu klavyelerinde metin yazmak çok yorucudur.

1. SMS mesajlarının dikte edilmesi - yakında telefonunuzda mesaj yazmanıza gerek kalmayacak - sadece dikte edebilirsiniz. Samsung, bu işlevi telefonlarının bazı modellerine getirmeyi vaat ediyor (yakın gelecekte piyasada görünmeleri gerekiyor).

2. Tercüme - Pekin'deki 2008 Olimpiyat Oyunları sırasında, dahili tercümana sahip bir cep telefonunun ortaya çıkması bekleniyor. Orta Krallık'tayken, örneğin bir restoranda yemek yemek istiyorsanız, siparişinizi cep telefonunuzda Rusça olarak söylemeniz yeterli olacaktır - her şey Çince'ye çevrilecek ve elektronik bir ses konuşmacı siparişi garsona aktaracaktır.

Zamanla artan sayıda cihazın insan sesini anlayacağı varsayılabilir. Bu nedenle, bir sabah kahve makineniz size ne yapacağınızı - kapuçino veya espresso - sormakla kalmaz, aynı zamanda cevabınızı da anlarsa şaşırmayın.

Windows Vista'da konuşma tanıma

Windows Vista'da bir konuşma tanıma programı vardır. Ne yazık ki, bu bileşen yalnızca İngilizce, Almanca, Fransızca, İspanyolca, Japonca ve Çince'yi anlamaktadır. Bileşen ilk kez başlatıldığında (Kontrol Panelinde Erişim Kolaylığı ve Konuşma Tanıma öğelerini seçmeniz gerekir), sizi yarım saat boyunca Windows sesli kontrol ilkeleriyle tanıştıracak olan öğrenme sihirbazı penceresi açılır. Birkaç alıştırmayı tamamladıktan sonra, sesli komutları kullanarak Windows'u nasıl dikte edeceğinizi ve kontrol edeceğinizi öğreneceksiniz. Konuşma tanıma yazılımı konuşmacıya bağımlı olduğu için aynı zamanda sesinizi de öğrenecektir. Giriş bölümünde başarılı bir şekilde ustalaştıktan sonra, Windows aramanıza yanıt verecektir: "Dinle!" ve sesli komutları almaya başlayın. Dezavantaj: sesli giriş yalnızca Microsoft programlarında çalışır (örneğin, Windows'un kendisi, Word veya Internet Explorer için). Diğer programları (Open Office veya Firefox gibi) kullanırken, bilgisayar "sağır" olacaktır.

Güncelleme: 31 Temmuz 2017 Pazartesi

Bir bilgisayarla konuşmanın yarı fantastik fikrinin profesyonel fotoğrafçılıkla ne ilgisi var? İnsanın tüm teknik ortamının sonsuz gelişimi fikrinin hayranı değilseniz, neredeyse hiçbiri. Bir an için kameranıza odak uzaklığını değiştirmesi ve poz telafisini yarım adım artı yapması için sesli komutlar verdiğinizi hayal edin. Kameranın uzaktan kumandası zaten uygulandı, ancak orada düğmelere sessizce basmanız gerekiyor ve işte bir işitme fotiği!

Bir bilgisayarla insan sesi iletişiminin bir örneği olarak fantastik bir filmden alıntı yapmak bir gelenek haline geldi, en azından Stanley Kubrick'in yönettiği "Space Odyssey 2001". Orada, yerleşik bilgisayar astronotlarla anlamlı bir diyalog yürütmekle kalmıyor, aynı zamanda sağır bir insan gibi dudak okuyabiliyor. Başka bir deyişle, makine insan konuşmasını hatasız olarak tanımayı öğrendi. Belki birisi kameranın uzaktan sesli kontrolünü gereksiz bulacaktır, ancak çoğu kişi bu ifadeyi beğenecektir. "Bizi Çıkar Bebeğim" ve bir palmiye ağacının fonunda tüm ailenin bir resmi hazır.

Pekala, burada biraz hayal kurarak geleneğe saygı duruşunda bulundum. Ancak, kalbimin derinliklerinden konuşursak, bu makaleyi yazmak zordu ve her şey Android 4 işletim sistemine sahip bir akıllı telefon şeklinde bir hediye ile başladı. Bu model HUAWEI U8815, küçük bir dört inçlik dokunmatik ekrana ve bir ekran klavyesine sahiptir. Üzerine yazmak biraz sıra dışı, ancak özellikle gerekli olmadığı ortaya çıktı. (resim01)

1. Android işletim sistemindeki bir akıllı telefonda ses tanıma

Yeni bir oyuncak denerken arama çubuğunda bir mikrofon grafiği dikkatimi çekti. Google ve Notes'ta klavyede. Önceden, bu sembolün ne anlama geldiğiyle ilgilenmiyordum. konuşmalarım oldu Skype ve klavyedeki harfleri yazdı. Bu, çoğu İnternet kullanıcısının yaptığı şeydir. Ama daha sonra bana açıkladıkları gibi, bir arama motorunda Google Rusça sesli arama eklendi ve bir tarayıcı kullanırken kısa mesajları dikte etmenize izin veren programlar ortaya çıktı. Krom.

Üç kelimelik bir cümle söyledim, program onları tanımladı ve mavi arka plana sahip bir hücrede gösterdi. Şaşıracak bir şey vardı çünkü tüm kelimeler doğru yazılmıştı. Bu hücreye tıklarsanız, ifade android not defterinin metin alanında görünür. Bu yüzden birkaç cümle söyledi ve asistana SMS ile bir mesaj gönderdi.


2. Ses tanıma programlarının kısa tarihçesi.

Ses kontrolü alanındaki modern başarıların ev aletlerine, arabaya, robota komut vermenize izin verdiği benim için bir keşif değildi. Komut modu, Windows, OS/2 ve Mac OS'nin eski sürümlerinde tanıtıldı. Talker programları gördüm ama bunların ne faydası var? Belki de konuşmanın klavyede yazmaktan daha kolay olması benim tuhaflığımdır ve cep telefonunda hiçbir şey yazamıyorum. Kişileri normal klavyeli bir dizüstü bilgisayara kaydetmeniz ve USB kablosuyla aktarmanız gerekir. Ama sadece mikrofona konuşmak ve bilgisayarın kendisi metni hatasız yazmak - bu benim için bir rüyaydı. Umutsuzluk atmosferi forumlardaki tartışmalarla desteklendi. Her yerde çok üzücü bir düşünceleri vardı:

“Ancak, pratikte, şimdiye kadar, gerçek konuşma tanıma programları (ve hatta Rusça) pratikte mevcut değil ve yakında oluşturulmayacakları da açık. Dahası, tanımanın tersi görevi - tanımadan çok daha basit görünen konuşma sentezi bile tam olarak çözülmedi. (ComputerPress №12, 2004)

“Görev bir bilgisayar için oldukça zor olduğundan, bugüne kadar normal konuşma tanıma programları (yalnızca Rusça değil) yok. Ve en kötüsü, bir kişi tarafından kelime tanıma mekanizmasının gerçekleştirilememesidir, bu nedenle tanıma programları oluştururken üzerine inşa edilecek hiçbir şey yoktur. (Forumda başka bir tartışma).

Aynı zamanda, İngilizce metin giriş programlarının incelemeleri, açık başarılar gösterdi. Örneğin, IBM ViaVoice 98 Yönetici Sürümü 64.000 kelimelik temel bir sözlüğe ve aynı sayıda kendi kelimesini ekleme yeteneğine sahipti. Program eğitimi olmadan kelime tanıma yüzdesi yaklaşık %80'di ve ardından belirli bir kullanıcıyla yapılan çalışmayla %95'e ulaştı.

Rus dilini tanımaya yönelik programlardan, İngilizce Dragon Dictate 2.5'e bir ek olan "Gorynych" i belirtmekte fayda var. İncelemenin ikinci bölümünde arama ve ardından "beş Gorynych ile savaş" hakkında anlatacağım. Önce "İngiliz Ejderhası"nı buldum.

3. Sürekli konuşmayı tanıma programı "Dragon Naturally Speaking"

Şirketin programının modern versiyonu nüans Minsk Yabancı Diller Enstitüsü'nden eski arkadaşımla olduğu ortaya çıktı. Yurtdışı gezisinden getirmiş ve "bilgisayar sekreteri" olabileceğini düşünerek satın almış. Ancak bir şey işe yaramadı ve program dizüstü bilgisayarda neredeyse unutulmuş durumda kaldı. Anlaşılır bir deneyim olmadığı için arkadaşıma kendim gitmek zorunda kaldım. Tüm bu uzun giriş, çıkardığım sonuçların doğru bir şekilde anlaşılması için gereklidir.

İlk ejderhamın tam adı şuydu: . Program İngilizce'dir ve içindeki her şey bir kılavuz olmadan bile açıktır. İlk adım, performansındaki kelimelerin ses özelliklerini belirlemek için belirli bir kullanıcının profilini oluşturmaktır. Hangisini yaptım - konuşmacının yaşı, ülke, telaffuzun özellikleri önemlidir. Benim seçimim: 22-54 yaş, İngiltere İngilizcesi, standart telaffuz. Ardından, mikrofonunuzu ayarladığınız birkaç pencere gelir. (resim04)

Ciddi konuşma tanıma programlarında bir sonraki aşama, belirli bir kişinin özel telaffuzu için eğitimdir. Metnin doğasını seçmeye davetlisiniz: benim seçimim dikte üzerine kısa bir talimat, ama aynı zamanda mizahi bir hikaye "sipariş edebilirsiniz".

Programla çalışmanın bu aşamasının özü son derece basittir - metin pencerede görüntülenir, üzerinde sarı bir ok vardır. Doğru telaffuz ile ok, tümceler arasında hareket eder ve alt kısımda bir eğitim ilerleme çubuğu bulunur. İngilizce konuşma benim tarafımdan oldukça unutulmuştu, bu yüzden güçlükle hareket ettim. Zaman da sınırlıydı - sonuçta bilgisayar benim değildi ve eğitimi yarıda kesmek zorunda kaldım. Ancak bir arkadaşı, testi yarım saatten daha kısa sürede yaptığını söyledi. (resim05)

Programı telaffuzuma uyarlamayı reddederek ana pencereye gittim ve yerleşik metin düzenleyiciyi çalıştırdım. Bilgisayarda bulduğu bazı metinlerden ayrı kelimeler söyledi. Doğru söylediği sözler, program yazdırdı, kötü söylediği sözler "İngilizce" bir şeyle değiştirildi. “Çizgiyi sil” komutunu İngilizce olarak açık bir şekilde telaffuz eden program, onu yerine getirdi. Bu, komutları doğru okuduğum ve programın önceden eğitim almadan bunları tanıdığı anlamına gelir.

Ama bu "ejderhanın" Rusça'da nasıl yazdığı benim için önemliydi. Önceki açıklamadan anladığınız gibi, programı eğitirken yalnızca İngilizce metni seçebilirsiniz, orada Rusça metin yoktur. Rusça konuşmanın tanınmasını eğitmenin işe yaramayacağı açıktır. Bir sonraki fotoğrafta, programın Rusça "Merhaba" kelimesini telaffuz ederken hangi cümleyi yazdığını görebilirsiniz. (resim06)

İlk ejderha ile iletişimin sonucu biraz komik çıktı. Resmi web sitesindeki metni dikkatlice okursanız, bu yazılım ürününün İngilizce "uzmanlığını" görebilirsiniz. Ayrıca yüklerken program penceresinde "İngilizce" okuyoruz. Peki tüm bunlar neden gerekliydi? Forumların ve söylentilerin suçlanacağı açık ...

Ancak yararlı bir deneyim de var. Arkadaşım dizüstü bilgisayarının durumunu görmek istedi. Her nasılsa yavaş yavaş çalışmaya başladı. Bu şaşırtıcı değil - sistem bölümünde yalnızca% 5 boş alan vardı. Gereksiz programları silerken resmi sürümün 2.3 GB'tan fazla yer kapladığını gördüm. Bu numaraya daha sonra ihtiyacımız olacak. (resim.07)



Görünüşe göre Rusça konuşmanın tanınması önemsiz bir görev değildi. Minsk'te bir arkadaşımdan "Gorynych" bulmayı başardım. Diski eski molozunda uzun süre aradı ve ona göre bu resmi bir yayın. Program anında yüklendi ve sözlüğünün 5000 Rusça kelime artı 100 komut ve 600 İngilizce kelime artı 31 komut içerdiğini öğrendim.

Öncelikle benim yaptığım gibi mikrofonu ayarlamanız gerekiyor. Sonra sözlüğü açtım ve kelimeyi ekledim. "inceleme"çünkü programın sözlüğünde yoktu. Tekdüze bir tonda net konuşmaya çalıştım. Son olarak, Gorynych Pro 3.0 programını açtım, dikte modunu açtım ve bu "ses olarak benzer kelimeler" listesini aldım. (resim.09)

Sonuç beni şaşırttı, çünkü bir android akıllı telefonun çalışmasından açıkça daha kötüsü farklıydı ve diğer programları denemeye karar verdim " Google Chrome Web Mağazası". Ve "gorynych yılanları" ile uğraşmayı sonraya erteledi. bunu düşündüm erteleme orijinal Rus ruhunda eylem

5. Google'ın ses yetenekleri

Windows işletim sistemine sahip normal bir bilgisayarda sesle çalışmak için bir tarayıcı yüklemeniz gerekir Google Chrome. İçinde internette çalışıyorsanız, sağ alttaki yazılım mağazası bağlantısına tıklayabilirsiniz. Orada ücretsiz olarak sesli metin girişi için iki program ve iki uzantı buldum. programlar denir "Ses Defteri" Ve "Voysnot - sesten metne". Kurulumdan sonra, sekmede bulunabilirler. "Uygulamalar" senin tarayıcın "Krom". (resim.10)

Uzantılar denir "Google Sesli Arama Özel Sözcüğü (Beta) 0.1.0.5" Ve "Ses girişi metni - Speechpad.ru 5.4". Kurulumdan sonra, sekmede kapatılabilir veya silinebilirler. "Uzantılar".(resim.11)

Sesli not. Chrome tarayıcıdaki uygulama sekmesinde, program simgesini çift tıklayın. Aşağıdaki resimde gösterildiği gibi bir iletişim kutusu açılacaktır. Mikrofon simgesine tıklayarak kısa cümleleri mikrofona söylersiniz. Program, kelimelerinizi konuşma tanıma sunucusuna gönderir ve metni pencereye yazar. Resimde gösterilen tüm kelimeler ve ifadeler ilk denemede yazıldı. Açıkçası, bu yöntem yalnızca etkin bir İnternet bağlantısıyla çalışır. (resim.12)

sesli not defteri. Programı uygulamalar sekmesinde çalıştırırsanız, İnternet sayfasının yeni bir sekmesi açılacaktır. Speechpad.ru. Bu hizmetin nasıl kullanılacağına ilişkin ayrıntılı bir talimat ve kompakt bir form bulunmaktadır. İkincisi aşağıdaki şekilde gösterilmiştir. (resim.13)

Ses girişi metin, İnternet sayfalarının metin alanlarını sesinizle doldurmanıza olanak tanır. Örneğin, sayfama gittim Google+. Yeni mesaj giriş alanında sağ tıklayın ve seçin "Konuşma Paneli". Pembe renkli giriş kutusu, metninizi dikte edebileceğinizi söylüyor. (resim.14)

Google Sesli Arama sesle arama yapmanızı sağlar. Bu uzantıyı kurup etkinleştirdiğinizde, arama çubuğunda bir mikrofon simgesi görünür. Bastığınızda, büyük kırmızı bir daire içinde bir sembol görünecektir. Sadece arama ifadesini söyleyin ve arama sonuçlarında görünsün. (resim.15)

Önemli not: Mikrofonun Chrome uzantılarıyla çalışabilmesi için tarayıcı ayarlarından mikrofona erişime izin vermeniz gerekmektedir. Güvenlik nedeniyle varsayılan olarak devre dışıdır. geçmek Ayarlar→Kişisel veriler→İçerik ayarları. (Listenin sonundaki tüm ayarlara erişmek için tıklayın. Gelişmiş ayarları göster). Bir iletişim kutusu açılacak Sayfa içeriği ayarları. Listeden bir öğe seçin Multimedya → mikrofon.

6. Rusça konuşma tanıma programlarıyla çalışmanın sonuçları

Metin giriş programlarını sesle kullanma konusunda biraz deneyim, bu özelliğin bir İnternet şirketinin sunucularında mükemmel bir şekilde uygulandığını gösterdi. Google. Herhangi bir ön eğitim olmaksızın, kelimeler doğru bir şekilde tanınır. Bu, Rusça konuşma tanıma sorununun çözüldüğünü gösterir.

Artık gelişimin sonucu olduğunu söyleyebiliriz. Google diğer üreticilerin ürünlerini değerlendirmek için yeni bir kriter olacaktır. Tanıma sisteminin şirketin sunucularıyla bağlantı kurmadan çevrimdışı çalışmasını istiyorum - bu daha rahat ve daha hızlı. Ancak sürekli bir Rusça konuşma akışıyla çalışmak için bağımsız bir programın ne zaman yayınlanacağı bilinmiyor. Bununla birlikte, bu "yaratılışın" eğitim fırsatı ile gerçek bir atılım olacağını varsaymaya değer.

Rus geliştiricilerin programları "Gorynych", "Diktograf" Ve "Savaş" Bu incelemenin ikinci bölümünde detaylandıracağım. Bu makale, orijinal diskleri aramanın artık zor olması nedeniyle çok yavaş yazılmıştır. Şu anda, Combat 2.52 hariç, Rusça sesten metne tanıma yazılımının tüm sürümlerine zaten sahibim. Arkadaşlarımdan veya meslektaşlarımdan hiçbiri bu programa sahip değil ve benim de forumlarda yalnızca birkaç övgü dolu eleştirim var. Doğru, çok garip bir seçenek vardı - "Savaş" ı SMS ile indirin, ama hoşuma gitmedi. (resim16)


Kısa bir video klip, Android işletim sistemine sahip bir akıllı telefonda konuşma tanımanın nasıl çalıştığını size gösterecektir. Sesle aramanın bir özelliği de Google sunucularına bağlanma ihtiyacıdır. Bu nedenle, İnternet sizin için çalışmalıdır

Fiyat — 199,99$
Geliştirici ScanSoft
Web sitesi www.scansoft.com
Beden Hayır
İndirme sayfası HAYIR
+
En geniş işlevsellik; tüm Windows uygulamalarında çalışın; güçlü kelime veritabanları
Yüksek fiyat
! Var olan en iyi konuşma tanıma yazılımı

Kesinlikle piyasadaki en iyi konuşma tanıma modülü! Dragon, uzun tarihi boyunca askerden mareşale kadar çok yol kat etti; hayır, belki hala mareşale kadar değil, ama kesinlikle ordunun generali unvanını hak etti. Programla çalışmanın tüm algoritması son derece basittir - ses kartının karşılık gelen çıkışlarına kulaklık ve mikrofon bağlarız ve yardımcı programın kendisini çalıştırırız. İlk olarak, kullanıcıdan mikrofondan ses seviyesini ayarlaması ve Dragon Naturally Speaking'in tınınıza, tonlamanıza ve telaffuzunuza göre ince ayar yapması için bir dizi hazır metni bilgisayara dikte etmesi istenecektir. Ve son olarak, kullanıcıya temel sesli komutların öğretildiği etkileşimli bir öğretici.

PC'nin canlı bir muhatap olmadığını ve "yutulan" heceleri düşünemediğini veya anlaşılmaz bir cümleyi anlayamadığını belirtmekte fayda var. Konuşmacının kendi aksanı daha az önemli değildir - örneğin, çeşitli uluslararası bilimsel konferanslarda kulağa gelen böyle bir İngilizce seviyesi, prensipte çalışmak için uygun değildir. Öte yandan, her zaman kendi kendine öğrenme olasılığı vardır: Dragon hiçbir şekilde bir kelimeyi tanımak istemiyorsa, Lingvo'ya bakıp onu doğru transkripsiyonla telaffuz etmek için çok tembel olmayın. Sizi temin ederim ki en fazla bir veya iki hafta içinde kilobaytlarca metni kolaylıkla dikte etmekle kalmayacak, aynı zamanda tanıdıklarınız arasında gerçek İngilizce telaffuzunu da sergileyeceksiniz.

Tanıma kalitesinden hâlâ memnun değil misiniz? Kullanıcı profilinizi optimize edecek ve size popüler ne-lojizmleri kelime dağarcığınıza nasıl ekleyeceğinizi öğretecek olan yerel Doğruluk Merkezinize göz atın. Bir wav dosyasının metin içeriğini (Cep PC'den veya doğrudan bir ses kartının hat çıkışından dahil olmak üzere) tanımak gibi daha sıra dışı eylemler de mümkündür. Ek olarak, Dragon Naturally Speaking çeşitli programları başlatabilir, aralarında geçiş yapabilir ve hatta bazı işlevlerini kontrol edebilir (örneğin, medya oynatıcıda müzik çalmayı başlat / duraklat veya doğrudan menü ile çalış). Tercih Edilen ve Profesyonel sürümler ayrıca günümüzün en gelişmişlerinden biri olan kendi Real-Speech 2 konuşma motorunu içerir.

Ama konuşmaya geri dönelim. Metni yalnızca yerel DragonPad metin işlemcisinde değil, aynı zamanda benzer herhangi bir uygulamada da dikte edebilmeniz özellikle sevindirici - MS Word, Outlook Express, Internet Ex-plorer ve Corel WordPerfect. Program aynı başarı ile ICQ, ağ sohbeti (Network Assistant) ve diğer anlık mesajlaşma programları ile çalışır; ancak, o zaman bazı komutlar kullanılamaz hale gelir, ancak bir mesaj göndermek için bile Girmek tıklamanıza gerek yok, sadece "Yeni paragraf" deyin - ve ICQ bunu otomatik olarak yapacaktır. Daha özel uygulamalarda, özellikle aynı Word'de ek komutlar kullanılır: metin biçimlendirme, imla, düzenleme - ve bunların tümü yalnızca sözlü konuşma yoluyla. Standart sipariş seti yeterli değilse, her zaman kendi siparişinizi oluşturabilir, böylece Dragon'un işlevselliğini daha da genişletebilirsiniz. Biraz çaba gerektirir ve herhangi bir düzenleme yapmadan bir sayfa metin yazmak oldukça mümkündür. Ana şey, tonlamanın ve tabii ki telaffuzun doğru kombinasyonudur. Cümleler çizmeyin, ancak makineli tüfek gibi karalamayın, aksi takdirde doğru anlaşılan malzemenin yüzdesi güvenle sıfıra düşecektir. Ayrıca, sürekli olarak sözlüğe bakmak gerekli değildir - program tarafından bilinen bir cümleyi doğru telaffuz etmemiş olsanız bile (örneğin, çok mutluyum), metni otomatik olarak "tahmin edecektir". Dikkat çekici? Her şey, gelişmiş konuşma tanıma teknolojisiyle birlikte rakiplere hiç şans bırakmayan devasa kelime dağarcığıyla ilgili. Bu satırların yazarının geçmişte çok acı çektiği, ancak onlardan yüksek kaliteli işler elde edemediği Dragon'un ilk sürümlerini nasıl hatırlayamazsınız ...

Akıllı Ses Tanıma Sistemi (IVOS) 2.0.2A
Shareware (30 günlük deneme, kayıt - 50 USD)
ComunX geliştiricisi
Web sitesi www.ivos.biz
Boyut 2.69 MB
İndirme sayfası ftp://ftp.download.com/
yayın/ppd/1007091810190380/
setup_ivos.exe
+
Dağılımın mikroskobik boyutu; harika işlevsellik
Kısa konuşma modu henüz Dragon seviyesine ulaşmadı
! Bu alandaki en iyi araçlardan biri

İncelemedeki en mütevazı (dağıtım kitinin boyutuna göre) program, şaşırtıcı derecede değerli olduğunu kanıtladı ve yüksek sesli adını büyük ölçüde haklı çıkardı. Bunun nedeni, "manuel" bilgi girişi araçlarını tamamen ortadan kaldırmak için tasarlanmış evrenselliğidir. Böylece, IVOS şunları yapmanızı sağlar: a) herhangi bir Windows uyumlu metin işlemcisinde konuşmayı tanıma ve metne dönüştürme; b) PC'nizi çeşitli sesli komutlarla yönetin ve kendinizinkini oluşturun; c) harici ses motorlarını kullanan sesli e-kitaplar. Ayrıca, elbette, Wav dosyalarından metin çıkarmak, ekranı zorlamayan kullanışlı bir program kontrol paneli ve uygun fiyatlı (aynı Dragon ile karşılaştırıldığında) fiyat gibi önemsiz şeyler. Kaydolduktan sonra kullanıcı, PC'ye kendi sözlü komutlarınızın öğretilmesine izin veren VoiceTouch teknolojisine erişebilir.

Komut yürütme verimliliği şaşırtıcı derecede yüksek - belki de Realize Voice'tan bile daha iyi. Ancak "derslerin" tanınma düzeyi daha düşük olacaktır ki bu garip değildir: birkaç kelimeyi anlamak bir şeydir ve tüm bir cümleyi anlamak tamamen başka bir şeydir. Dragon dışındaki diğer birçok konuşma tanıma programı gibi IVOS'un da bu tür amaçlar için Microsoft'un Speech API modülünü kullandığına ve bu alandaki performansının doğrudan bu şirketin yaratıcı başarısına bağlı olduğuna dikkat edilmelidir. Bununla birlikte, stokunda bulunan tüm eğitim metinlerini programa okuyarak IVOS'tan yüksek kaliteli işler elde etmek şimdiden mümkündür. Elbette sonunda Dragon Naturally Speaking seviyesine ulaşamayacak, ancak çok karmaşık olmayan belgeleri yazma konusunda oldukça yetenekli. Ve kullanıcı sözlüğünü düzenli olarak doldurursanız, bilimsel terimlerle ilgili belirli bir sorun olmayacaktır. Doğru, burada bir ikilem ortaya çıkıyor - yardımcı programa konuşmayla çalışmanın tüm inceliklerini öğretmek için harcanması gereken haftada, klavyede on parmakla kör yazma yönteminde hızlandırılmış bir hızda ustalaşmak oldukça mümkün. .. Öte yandan, bir PC kullanıcısının niteliği, yalnızca bir bilgisayara bilgi girmenin birkaç yöntemine sahipse artacaktır.

Voice 4.0'ı Gerçekleştirin

Voice 4.0'ı Gerçekleştirin
Shareware (15 günlük deneme, kayıt - 49,00$)
Geliştirici Realize Software Corporation
Web sitesi www.realizesoftware.com
Boyut 55 MB
İndirme sayfası
www.realizesoftware.com/
indir/RzRV40download.exe (Web yükleyici)
+
Kullanıcının telaffuzunda iddiasız; çok geniş bir komut dizisi
İşin kalitesi yine de daha iyi olabilirdi; yalnızca Windows'un İngilizce sürümünde yüklü
! PC'nizi yalnızca sesinizle kontrol edin

Realize Voice, daha önce incelenen Dragon Naturally Speaking'in aksine, steno yeteneğine pek sahip değildir (böyle bir işlev cephaneliğinde olmasına rağmen), ancak sesli komutlarla zekice başa çıkmaktadır. Dikkat çekici bir şekilde, İngilizce alanında olağanüstü derecede derin bilgiye ihtiyacınız yok - buluşsal çözümleyicinin akıllı modülü sayesinde, program hemen hemen her konuşmacı ile kolayca ortak bir dil bulacaktır. Realize Voice işlevlerinin aralığı oldukça geniştir: yürütülebilir dosyaları ve program kısayollarını başlatmaktan yazışmalar ve karmaşık makrolarla çalışmaya kadar. Diğer benzer programlarda olduğu gibi, kullanıcının yalnızca bağlı bir mikrofona ve bazı şeylerin temeline inmesi için birkaç dakikaya ihtiyacı vardır. Ve yardımcı programla gerçek iletişime geçmeden önce, onun için işin kapsamını belirlemeye değer. Varsayılan olarak, sistem menüsü kısayolları bu kategoriye girer. masaüstü, klasör içeriği Favoriler ve hızlı başlatma çubukları ile son açılan belgeler ve programlar. Tüm süreç tamamen otomatiktir ve kelimenin tam anlamıyla anında gerçekleştirilir. Doğru, komutlar adına sayıları kullanmanın imkansızlığı bazı rahatsızlıklara neden oluyor - örneğin, DOOM 3'ü bir sesli komut kullanarak başlatmak, yalnızca kısayolunu "DOOM Three" olarak yeniden adlandırarak mümkün olacak. Bu arada, aynısı Kiril alfabesi için de geçerli - pek eğlenceli bir olasılık değil, değil mi? Ancak böyle bir durumda, ilgilendiğiniz dosyanın/belgenin/grafik görüntüsünün vb. yolunu doğrudan belirterek programın manuel yapılandırmasına her zaman başvurabilirsiniz. Burada dosya adı ve koordinatları önemli değil - hatta abvgd.exe ise, evet Ve Masaüstü bozmak zorunda değilsin Windows ile çalışmak için yerleşik sistem komutları setinden de çok memnun kaldım - çok büyük olmasa da açık pencereler arasında hareket edebilir, en yaygın tuşların eylemini taklit edebilir ( Ara Çubuğu, Ekle, Ana Sayfa vb.), yardımı ile sistemi kapatmak ve bloke etmek oldukça mümkündür.

Makrolar hakkında biraz. Yardımcı program, klavyeden karakter girmekten ve sistem komutlarından yerleşik ses motorunu kullanarak konuşma sentezine kadar tüm bir dizi işlemi tek bir komut altında birleştirmenize olanak tanır. Doğru, tek bir cümlenin yardımıyla bir CD kaydetmek gibi bir idil hala çok uzakta, ancak zaman gösterecek ... Asıl mesele şu ki, evcil hayvanınızı artık herhangi bir şey olmadan "yönlendirebilirsiniz" (ve başarısız değil!) fare ve klavye gibi anakronizmler. Deneyin - pişman olmayacaksınız!

Ses Stüdyosu 1.4.6

Ses Stüdyosu 1.4.6
Shareware (7 günlük deneme, kayıt - 20,97 USD)
Developer Ultimate Interactive Desktop'lar
Web sitesi www.voicestudio.us
Boyut 57 MB
İndirme sayfası
ftp://ftp.voicestudio.us/
pub/dl2/vssetup.exe
+
Mükemmel işlevsellik; "canlı" bir animasyon karakterinin varlığı; çok düşük fiyat
Konuşma tanıma için MS SAPI kullanılır; oldukça yüksek kaynak tüketimi
! PC ses kontrolü için Dragon'a harika bir ek

Belki de, monitörün diğer tarafındaki sanal muhatabımızın nihayet maddi bir biçim aldığı bu türden tek program değilse de birkaç programdan biri. Ve bu amaçlar için kullanılan MS Agent teknolojisi, yapay zekanın prototipi olarak adlandırılamasa da, bunun için tüm ön koşullara sahiptir. Animasyonlu asistan yalnızca belirli bir bağımsızlığa sahip olmakla kalmaz, aynı zamanda bir dizi standart ifadeye nasıl yanıt vereceğini de bilir ("Merhaba!", "Nasıl hissediyorsun", "Kötü bilgisayar" vb.). İstenirse, kelime dağarcığını ve deyim stokunu yenilemek ve ayrıca eylemlerini "ruh haline" göre ayarlamak kolaydır. Bir PC ile bu tür sohbetler, programın bilgisinin kapsamı ile sınırlı olsa da, hiç kimse onu neredeyse sonsuza kadar genişletme zahmetine girmez. Ve işte kötü şöhretli yapay zekaya bir taş atımı kadar yakın ... Ancak, biraz konudan sapıyorum.

Aslında, Voice Studio'nun işlevselliği ile her şey mükemmel bir düzende - steno (Dragon çok daha iyi olmasına rağmen), çeşitli sesli komutlar (daha fazla rahatlık ve daha hızlı ezberleme için bunları yazdırabilirsiniz) ve kabul edilebilir makine konuşma sentezi . Daha ciddi şeylerden - tek bir anahtar kelimeyle bir dizi işlemi aynı anda çalıştırmak için makrolar oluşturmak, hatta fare hareketlerini kaydetmek ve yeniden oynatmak! Son "özelliğin" GreenBrowser veya MyIE2 gibi birçok alternatif tarayıcıda bir dizi eylemi (başka bir sayfaya gitmek, yeni bir pencere açmak vb.) gerçekleştirmek için yaygın olarak kullanıldığını hatırlatmama izin verin. Artık gereksiz hareketlere gerek yok - sadece uygun komutu söyleyin ve bilgisayar önceden kaydedilmiş komut dosyasını otomatik olarak yeniden oluşturacaktır. Kim bilir belki yakında sadece mikrofonla oyunlar oynarız? Zaman gösterecek…

Bu arada, Voice Studio, inanılmaz dostluğu ve kullanım kolaylığı nedeniyle şüphesiz en yüksek puanı hak ediyor. Doğru konuşma kaydının henüz onun gücü dahilinde olmamasına izin verin, ancak buradaki PC ses kontrolü tek kelimeyle kıyaslanamaz. Bu yardımcı programların en iyisi ve Dragon'a değerli bir katkı!

Dikte 2004 v.4.5.2399

Dikte 2004 v.4.5.2399
Shareware (7 günlük deneme, kayıt - 49,99 ABD doları)
Geliştirici Birleşik Araştırma Laboratuvarları
Web sitesi www.research-lab.com
Boyut 41 MB
İndirme sayfası
www.bandwidthsaver.com/
indirilenler/dict2002.zip
+
Bir PC'yi yönetmek ve konuşmayı kaydetmek için temel işlev seti; wav dosyaları ile harika çalışma
En iyi konuşma tanıma puanları değil; sinir bozucu metin editörü
! Fiyat için çok az

Görünüşte tamamen standart temel becerilere rağmen, Dikte 2004 hala bir şeylerle övünüyor. Her şeyden önce bu, neredeyse tüm Windows uygulamalarında parola girmek, yazılım başlatmak ve dikte etmek için komutlar oluşturmayı kolaylaştıran İşaretle ve Konuş teknolojisidir. MS Word ile entegrasyonun yanı sıra ifadelerin doğru tanımlanması için akıllı teknoloji ilan edildi. Doğru, son derece uygunsuz bir şekilde uygulandı - konuşulan her kelimede görünen ve yalnızca herhangi bir çalışma arzusunu caydıran bir açılır pencere şeklinde. Kapatabiliyor olman iyi. Dikte 2004, aynı SAPI 5.1'i kullanır, bu nedenle kalitesi, aynı teknolojiye dayalı diğer yazılımlardan (Voxx, IVOS, Realize Voice, vb.) Temelde farklı değildir. Ek işlevler arasında, ses kasetlerinden, mobil cihazlardan, mikrofonlardan bilgi almak ve ardından bunları wav dosyalarına kaydetmek için WAV Kaydediciyi belirtmekte fayda var; daha sonra metin, ayrı bir Dikte uygulaması olan Wave-to-Text kullanılarak onlardan çıkarılır. Şimdiye kadar, elbette, hala ideal olmaktan uzak, ancak konuşmacının net bir konuşması ve iyi bir telaffuzu varsa, o zaman herhangi bir sorun olmayacaktır.

+
işte çok yönlülük; çeşitli olasılıklar
— "Eğitim" programı uzun sürecek ! İlginç bir ürün ama daha iyi olabilirdi...

Bilgisayarınızla istediğiniz gibi sohbet etmenize izin veren başka bir "her işin püf noktası". Program özelliklerinin listesi, IVOS'unkine (kısa yazı / sesli komutlar / metin okuma) çok benzer, ancak burada yararlı bir bonus var - ister bir dosyayı yazın ister bir dosyayı açın, her eyleminizin titizlikle seslendirilmesi. Program, IVOS ile aynı Microsoft Speech API'sini kullanır, dolayısıyla tanıma kalitesi benzerdir. Tarayıcıda gezinmek için iyi bir sesli komut seti, bir metin düzenleyicideki temel işlemler (kes / kopyala / yapıştır, vb.) optik sürücü tepsisi - genel olarak rahat çalışma için her şey. Konuşma sentezine gelince, doğrudan sistemde yüklü olan ilgili modüllere bağlıdır. Programla birlikte sağlanan ücretsiz Microsoft motorları ideal olmaktan uzaktır, ancak prensip olarak bunlara alışabilirsiniz. Ne yazık ki ücretsiz olmayan daha uygun bir seçenek, üçüncü taraf geliştirmeleri, özellikle de Rusça konuşan çok iyi bir konuşmacıya sahip olan Digit PC'yi denemektir. Tüm artıları ve eksileri göz önüne alındığında, Voxx satın almak için iyi bir aday olacaktır. Bu arada, deneme sürümü yalnızca oturum başına ifade/komut sayısıyla sınırlıdır; yeni bir oturum başlatmak için programı yeniden başlatmanız yeterlidir...

Çözüm

Hâlâ çok sayıda eksikliğe rağmen, konuşma tanıma programları şimdiden oyuncak mertebesinden bir iş adamı için ciddi bir araca geçti. Daha önce onlardan pek mantıklı gelmediyse, şimdi kullanıcı için hayatı gerçekten kolaylaştırmayı ve bilgisayarın sayıları öğüten demir bir kutu olduğu şeklindeki daha önce sarsılmaz klişeyi yok etmeyi mümkün kılıyorlar. Ve elbette, en hoş gerçek, 21. yüzyılın teknolojik ilerlemesini hissetme fırsatıdır; bu, pek çok bilim kurgu yazarının hakkında çok sık yazdığı, şimdiden şimdi. Şimdi Katıl!