โปรแกรมจดจำเสียงในภาษารัสเซีย ซอฟต์แวร์รู้จำเสียง

บางทีอาจเป็นตัวถอดข้อความที่สะดวกที่สุดสำหรับ Windows และ Mac OS ซึ่งรวมเครื่องเล่นเสียงและโปรแกรมแก้ไขข้อความ หลักการทำงานนั้นง่ายมาก - โหลดไฟล์เสียงลงในโปรแกรมฟังโดยใช้ปุ่มลัดบนแป้นพิมพ์ (คุณสามารถกำหนดได้เอง) และพิมพ์ข้อความพร้อมกัน ความเร็วในการเล่นและระดับเสียงจะถูกควบคุมโดยใช้แป้นพิมพ์ ดังนั้น มือของคุณจะอยู่บนแป้นพิมพ์ตลอดเวลาและไม่จำเป็นต้องใช้เมาส์หรือสลับไปมาระหว่างโปรแกรมต่างๆ โปรดทราบว่าโปรแกรมแก้ไขข้อความในตัวไม่รู้จักข้อผิดพลาดและไม่มีคุณลักษณะอื่นๆ ที่คุ้นเคย เช่น การสลับยัติภังค์ในขีดกลาง อย่างไรก็ตาม คุณสามารถใช้โปรแกรมแก้ไขข้อความอื่นๆ ร่วมกับ Express Scribe ได้โดยใช้แป้นพิมพ์ลัดเพื่อควบคุมการเล่นเสียง โปรแกรมนี้เป็นแชร์แวร์ ราคาเต็ม 17-50 ดอลลาร์


02. ทรานสคริปเตอร์โปร



โปรแกรมภาษารัสเซียสำหรับ Windows ที่ให้คุณฟังได้ไม่เพียงแค่เสียงเท่านั้น แต่ยังสามารถดูไฟล์วิดีโอได้อีกด้วย โปรแกรมแก้ไขข้อความในตัวมีความสามารถในการประทับเวลาและชื่อของคู่สนทนา ข้อความที่เป็นผลลัพธ์สามารถนำเข้าไปยัง "การถอดเสียงแบบโต้ตอบ" รวมทั้งแก้ไขเป็นส่วนหนึ่งของโครงการกลุ่มได้ แอปพลิเคชันใช้ได้เฉพาะเมื่อสมัครสมาชิกรายปี ราคา 689 รูเบิลต่อปี


03.RSplayer V1.4



โปรแกรมอย่างง่ายสำหรับการประมวลผลและคัดลอกไฟล์เสียงพร้อมรองรับปุ่มลัดและความสามารถในการพิมพ์ข้อความใน Microsoft Word ซึ่งแตกต่างจากโปรแกรมที่คล้ายกันก่อนหน้านี้ สามารถดาวน์โหลดได้ฟรี แต่จะไม่เสถียรใน Windows เวอร์ชันใหม่

04. โวโก

แอปพลิเคชัน Windows ระดับมืออาชีพสำหรับการแปลงคำพูดเป็นข้อความ รองรับการพิมพ์ด้วยเสียงในเบราว์เซอร์ทดสอบใด ๆ มีชุดพจนานุกรมเฉพาะเรื่องจำนวนมาก และไม่ต้องใช้การเชื่อมต่ออินเทอร์เน็ตสำหรับการรู้จำเสียง เวอร์ชันเพิ่มเติม "Voco.Professional" และ "Voco.Enterprise" สามารถทำงานกับไฟล์เสียงสำเร็จรูปได้ ข้อเสียเปรียบเพียงอย่างเดียวคือค่าใช้จ่ายสูงของแอปพลิเคชัน


05. การเขียนตามคำบอกมังกร



แอพมือถือฟรีสำหรับการรู้จำเสียงตามคำบอก โปรแกรมสามารถจดจำภาษาและความหลากหลายได้ประมาณ 40 ภาษา ช่วยให้คุณสามารถแก้ไขข้อความและส่งไปยังเมล โซเชียลเน็ตเวิร์ก หรือคัดลอกไปยังคลิปบอร์ด จำเป็นต้องมีการเชื่อมต่ออินเทอร์เน็ตในการทำงาน


06.RealSpeaker



แอปพลิเคชันพิเศษที่ไม่เพียงแต่สามารถจดจำไฟล์เสียงเท่านั้น แต่ยังรวมถึงเสียงพูดสดที่พูดกับกล้องด้วย ด้วยส่วนขยายวิดีโอพิเศษ RealSpeaker จะอ่านการเคลื่อนไหวของริมฝีปาก จึงช่วยปรับปรุงกระบวนการรู้จำเสียงได้ถึง 20-30% เมื่อเทียบกับอัลกอริธึมอื่นที่คล้ายคลึงกัน ในขณะนี้ แอปพลิเคชันรองรับ 11 ภาษา: รัสเซีย, อังกฤษ (สำเนียงอเมริกันและอังกฤษ), ฝรั่งเศส, เยอรมัน, จีน, เกาหลีและญี่ปุ่น, ตุรกี, สเปน, อิตาลี และยูเครน โปรแกรมแจกฟรีแบบมีเงื่อนไข ค่าใช้จ่ายขึ้นอยู่กับเวลาที่สมัครสมาชิก รุ่นถาวรราคาประมาณ 2,000 รูเบิล

ในโลกสมัยใหม่ที่มีเหตุการณ์สำคัญต่างๆ มากมาย ความเร็วในการทำงานกับข้อมูลเป็นหนึ่งในรากฐานที่สำคัญของความสำเร็จ เร็วแค่ไหนที่เราได้รับ สร้าง ประมวลผลข้อมูลนั้นขึ้นอยู่กับผลิตภาพและผลผลิตในการทำงานของเรา และด้วยเหตุนี้ความมั่งคั่งทางวัตถุของเราจึงเกิดขึ้นทันที ในบรรดาเครื่องมือที่สามารถเพิ่มความสามารถในการทำงานของเรานั้นมีโปรแกรมสำหรับแปลคำพูดเป็นข้อความซึ่งสามารถเพิ่มความเร็วในการพิมพ์ข้อความที่เราต้องการได้อย่างมาก ในบทความนี้ฉันจะบอกคุณว่าโปรแกรมยอดนิยมสำหรับการแปลเสียงเป็นข้อความคืออะไรและคุณสมบัติของพวกเขาคืออะไร

โปรแกรมที่มีอยู่ในปัจจุบันส่วนใหญ่สำหรับการแปลเสียงเป็นข้อความมีลักษณะที่ต้องชำระเงิน โดยมีข้อกำหนดจำนวนหนึ่งสำหรับไมโครโฟน (ในกรณีที่โปรแกรมมีไว้สำหรับคอมพิวเตอร์) ไม่แนะนำอย่างยิ่งให้ใช้งานไมโครโฟนที่ติดตั้งในเว็บแคม รวมถึงใส่ในเคสแล็ปท็อปมาตรฐาน (คุณภาพของการรู้จำเสียงจากอุปกรณ์ดังกล่าวอยู่ในระดับค่อนข้างต่ำ) นอกจากนี้ การมีสภาพแวดล้อมที่เงียบสงบเป็นสิ่งสำคัญมาก โดยปราศจากเสียงรบกวนที่ไม่จำเป็น ซึ่งอาจส่งผลโดยตรงต่อระดับการจดจำคำพูดของคุณ

ในเวลาเดียวกัน โปรแกรมเหล่านี้ส่วนใหญ่ไม่เพียงแต่สามารถแปลงคำพูดเป็นข้อความบนหน้าจอคอมพิวเตอร์เท่านั้น แต่ยังสามารถใช้คำสั่งเสียงเพื่อควบคุมคอมพิวเตอร์ของคุณ (การเปิดและปิดโปรแกรม การรับและส่งอีเมล การเปิดและปิดเว็บไซต์ และอื่น ๆ )

โปรแกรมเสียงพูดเป็นข้อความ

ไปที่คำอธิบายโดยตรงของโปรแกรมที่สามารถช่วยในการแปลคำพูดเป็นข้อความ

โปรแกรม "Laitis"

โปรแกรมภาษารัสเซียฟรีสำหรับการจดจำเสียง "Laitis" มีคุณภาพในการทำความเข้าใจคำพูดที่ดีและตามที่ผู้สร้างสามารถแทนที่แป้นพิมพ์ที่ผู้ใช้คุ้นเคยได้เกือบทั้งหมด โปรแกรมยังทำงานได้ดีกับคำสั่งเสียง ทำให้คุณสามารถดำเนินการหลายอย่างเพื่อจัดการคอมพิวเตอร์ของคุณด้วยความช่วยเหลือของพวกเขา

สำหรับการดำเนินการโปรแกรมจำเป็นต้องมีอินเทอร์เน็ตความเร็วสูงที่จำเป็นบนพีซี (โปรแกรมใช้บริการเครือข่ายการจดจำเสียงจาก Google และ Yandex) ความสามารถของโปรแกรมยังช่วยให้คุณควบคุมเบราว์เซอร์ของคุณโดยใช้คำสั่งเสียง ซึ่งคุณต้องติดตั้งส่วนขยายพิเศษจาก Laitis (Chrome, Mozilla, Opera) บนเว็บเนวิเกเตอร์ของคุณ

"Dragon Professional" - การถอดความการบันทึกเสียงเป็นข้อความ

ในขณะที่เขียนนี้เป็นผลิตภัณฑ์ภาษาอังกฤษแบบดิจิทัล « Dragon Professional Individual "เป็นหนึ่งในผู้นำระดับโลกในด้านคุณภาพของตำราที่ได้รับการยอมรับ โปรแกรมเข้าใจเจ็ดภาษา (จนถึงขณะนี้มีเพียงแอปพลิเคชันมือถือ Dragon Anywhere เท่านั้นที่ใช้งานได้กับภาษารัสเซียและ) มีการจดจำเสียงคุณภาพสูงและสามารถสั่งงานด้วยเสียงได้หลายอย่าง (ราคาสำหรับโปรแกรมหลักคือ 300 ดอลลาร์สหรัฐและสำหรับผลิตภัณฑ์ Dragon Home เวอร์ชัน "บ้าน" ผู้ซื้อจะต้องจ่าย 75 ดอลลาร์สหรัฐ)

สำหรับการใช้งาน ผลิตภัณฑ์นี้จาก Nuance Communications จำเป็นต้องสร้างโปรไฟล์ของตัวเอง ซึ่งออกแบบมาเพื่อปรับความสามารถของโปรแกรมให้เหมาะกับเสียงของคุณโดยเฉพาะ นอกจากการป้อนข้อความตามคำบอกโดยตรงแล้ว คุณยังสามารถฝึกโปรแกรมให้ดำเนินการคำสั่งต่างๆ ได้ ซึ่งจะทำให้การโต้ตอบของคุณกับคอมพิวเตอร์มีความสอดคล้องกันและสะดวกมากยิ่งขึ้น

"RealSpeaker" - โปรแกรมรู้จำเสียงพูดที่แม่นยำเป็นพิเศษ

โปรแกรมแปลงเสียงเป็นข้อความ " RealSpeaker" นอกเหนือจากฟังก์ชั่นมาตรฐานสำหรับโปรแกรมประเภทนี้แล้ว ยังช่วยให้คุณใช้ความสามารถของเว็บแคมของพีซีได้ ตอนนี้โปรแกรมไม่เพียงแค่อ่านองค์ประกอบเสียงของเสียงเท่านั้น แต่ยังจับการเคลื่อนไหวของมุมปากของผู้พูดด้วย ดังนั้นจึงสามารถจดจำคำที่เขาออกเสียงได้ถูกต้องมากขึ้น


"RealSpeaker" ไม่เพียงอ่านเสียงเท่านั้น แต่ยังอ่านองค์ประกอบภาพของกระบวนการพูดด้วย

แอปพลิเคชันรองรับมากกว่าสิบภาษา (รวมถึงภาษารัสเซีย) ช่วยให้คุณจดจำเสียงพูด โดยคำนึงถึงสำเนียงและภาษาถิ่น ให้คุณถอดเสียงและวิดีโอ ให้คุณเข้าถึงระบบคลาวด์และอีกมากมาย โปรแกรมนี้เป็นแชร์แวร์ สำหรับเวอร์ชันที่ต้องชำระเงิน คุณจะต้องจ่ายเงินจริง

"Voco" - โปรแกรมจะแปลเสียงเป็นเอกสารข้อความอย่างรวดเร็ว

ตัวแปลงเสียงเป็นข้อความอีกตัวคือผลิตภัณฑ์ดิจิทัล Voco แบบชำระเงินซึ่งราคาของเวอร์ชัน "บ้าน" ซึ่งตอนนี้อยู่ที่ประมาณ 1,700 รูเบิล โปรแกรมเวอร์ชันขั้นสูงและมีราคาแพงกว่า - "Voco.Professional" และ "Voco.Enterprise" มีคุณสมบัติเพิ่มเติมจำนวนหนึ่งซึ่งหนึ่งในนั้นคือการรู้จำเสียงจากการบันทึกเสียงที่มีให้สำหรับผู้ใช้

ในบรรดาคุณสมบัติของ "Voco" ฉันสังเกตเห็นความเป็นไปได้ในการเสริมคำศัพท์ของโปรแกรม (ตอนนี้คำศัพท์ของโปรแกรมมีมากกว่า 85,000 คำ) รวมถึงการทำงานแบบออฟไลน์จากเครือข่ายซึ่งช่วยให้คุณไม่ต้องพึ่งพา การเชื่อมต่ออินเทอร์เน็ตของคุณ


ข้อดีของ "Voco" คือความสามารถในการเรียนรู้สูงของโปรแกรม

แอปพลิเคชั่นเปิดใช้งานค่อนข้างง่าย - เพียงดับเบิลคลิกที่ปุ่ม "Ctrl" แอปพลิเคชั่นนี้ไม่มีค่าใช้จ่ายใด ๆ รองรับหลายภาษารวมถึงภาษารัสเซีย

บทสรุป

ข้างต้น ฉันได้แสดงรายการโปรแกรมสำหรับแปลการบันทึกเสียงของคุณเป็นข้อความ อธิบายการทำงานทั่วไปและคุณลักษณะเฉพาะของโปรแกรมเหล่านั้น ผลิตภัณฑ์เหล่านี้ส่วนใหญ่มักมีลักษณะที่ต้องชำระเงินในขณะที่ช่วงและคุณภาพของโปรแกรมภาษารัสเซียมีคุณภาพต่ำกว่าโปรแกรมภาษาอังกฤษ เมื่อทำงานกับแอปพลิเคชันดังกล่าว ฉันขอแนะนำให้ให้ความสนใจเป็นพิเศษกับไมโครโฟนและการตั้งค่า - นี่เป็นสิ่งสำคัญในกระบวนการรู้จำเสียง เนื่องจากไมโครโฟนที่ไม่ดีสามารถลบล้างแม้แต่ซอฟต์แวร์คุณภาพสูงสุดในประเภทที่ฉันพิจารณา

โปรแกรมรู้จำเสียงมีสองประเภท:

1. เชื่อมโยงกับผู้พูด - โปรแกรมเหล่านี้เรียนรู้อย่างต่อเนื่องและเมื่อเวลาผ่านไปจะเริ่มเข้าใจเสียงของ "อาจารย์ของพวกเขา" ได้ดีขึ้นเรื่อย ๆ ยิ่งผู้ใช้ทำงานในโปรแกรมบ่อยเท่าไหร่ เธอก็ยิ่งเข้าใจเขามากขึ้นเท่านั้น โชคดีที่การเรียนรู้เกิดขึ้นค่อนข้างเร็ว - หลังจากผ่านไปประมาณ 20 นาที โปรแกรมจะเรียนรู้ที่จะเข้าใจคุณเป็นอย่างดี

2. เป็นอิสระจากผู้พูด - คุณสามารถเริ่มพูดได้ทันที - โปรแกรมจะตอบสนองต่อคำสั่งเสียง ซึ่งแตกต่างจากประเภทแรก โปรแกรมเหล่านี้ไม่จำเป็นต้องเรียนรู้ที่จะเข้าใจคุณ คุณต้องเรียนรู้วิธีการพูดเพื่อให้โปรแกรมเข้าใจคุณ

โปรแกรมรู้จำเสียงที่ใช้บนพีซีมีไว้เพื่ออะไร

อย่าคิดว่าถ้าคุณติดตั้งโปรแกรมรู้จำเสียง คุณจะไม่ต้องใช้คีย์บอร์ดและเมาส์อีกต่อไป แต่การทำงานบนพีซีจะง่ายกว่ามาก

1. การเขียนตามคำบอก - ด้วยความช่วยเหลือของโปรแกรมรู้จำเสียง ผู้ใช้จำนวนมากกำหนดข้อความในเอกสาร ความเป็นไปได้นี้มีความเกี่ยวข้อง ตัวอย่างเช่น สำหรับแพทย์ที่ทำการตรวจ (ในระหว่างที่มือของพวกเขามักจะไม่ว่าง) และในขณะเดียวกันก็บันทึกผลลัพธ์ สำหรับผู้ใช้ทั่วไปที่รู้สึกว่าพิมพ์ข้อความได้ยากด้วยเหตุผลบางอย่าง (หรือแค่ขี้เกียจเกินไป) ก็มีประโยชน์เช่นกัน

2. การป้อนคำสั่ง - ผู้ใช้พีซีสามารถใช้ "การจดจำ" เพื่อป้อนคำสั่ง นั่นคือระบบจะรับรู้คำพูดเมื่อคลิกเมาส์ คำสั่งของผู้ใช้: "เปิดไฟล์", "ส่งเมล" หรือ "หน้าต่างใหม่" และคอมพิวเตอร์จะดำเนินการที่เหมาะสม โดยเฉพาะอย่างยิ่งสำหรับผู้ทุพพลภาพ - แทนที่จะใช้เมาส์และคีย์บอร์ด พวกเขาจะสามารถควบคุมคอมพิวเตอร์ด้วยเสียงได้

สิ่งที่จำเป็นสำหรับการรู้จำเสียง?

1. โปรแกรมรู้จำเสียง - ผู้ใช้ Windows ที่พูดภาษาอังกฤษสามารถใช้ได้ เช่น Dragon Naturally Speaking หรือ IBM Via Voice ภาษารัสเซียเป็นที่เข้าใจโดยโปรแกรม Gorynych และ Dictograph การรู้จำเสียงมีอยู่แล้วในระบบปฏิบัติการ Windows Vista

2. ไมโครโฟนหรือชุดหูฟัง (ลูกผสมของหูฟังและไมโครโฟน) - สำหรับการ "กด" คำลงในคอมพิวเตอร์

3. คอมพิวเตอร์ที่มีประสิทธิภาพเพียงพอ - เพื่อให้ฟังก์ชันการรู้จำเสียงทำงานได้ คอมพิวเตอร์ไม่จำเป็นต้องเร็วเป็นพิเศษ RAM 1 GB ก็เพียงพอแล้ว (สำหรับ Windows Vista ควรมี 2 GB) และความเร็วสัญญาณนาฬิกาของโปรเซสเซอร์อย่างน้อย 1 GHz

อุปกรณ์ใดบ้างที่ใช้การรู้จำเสียง

ฟังก์ชั่นการรู้จำเสียงสามารถใช้ได้ไม่เฉพาะกับพีซีเท่านั้น แต่ยังใช้กับอุปกรณ์อื่น ๆ อีกมากมาย โดยเฉพาะอย่างยิ่งหาก "แกดเจ็ต" มีแป้นพิมพ์ขนาดกะทัดรัดที่มีปุ่มเล็กๆ (หรือไม่มีเลย)

1. โทรศัพท์มือถือ - หลายปีที่ผ่านมามีรุ่นที่มีความสามารถในการควบคุมด้วยเสียง แต่สิ่งนี้ไม่เกี่ยวข้องกับการจดจำเสียง - อุปกรณ์ไม่ได้แปลเสียงเป็นข้อความ แต่เปรียบเทียบวลีที่พูดกับวลีที่บันทึกไว้ล่วงหน้า (อันหลังคือ "ข้อมูลอ้างอิง" และมักเรียกว่า "แท็กเสียง") แท็กเสียงสามารถสอดคล้องกับรายการสมุดที่อยู่ (การโทรออกด้วยเสียง) หรือรายการเมนู (การควบคุมด้วยเสียง) หากโทรศัพท์ไม่มีฟังก์ชันที่เหมาะสมในตอนแรก จะไม่สามารถ "ฝึก" ได้

2. ระบบนำทางเคลื่อนที่ - ในอุปกรณ์นำทางใหม่ เช่น Tom Tom Go 720T ผู้ขับขี่สามารถป้อนปลายทางด้วยเสียงได้ หากคุณออกเสียงคำอย่างชัดเจนและถ้าเป็นไปได้ให้เงียบ ๆ ฟังก์ชันนี้จะทำงานได้ดีมาก แม้ว่าการดำเนินการนี้จะใช้เวลาเท่ากับการป้อนข้อมูลด้วยแป้นพิมพ์ แต่จะปลอดภัยและสะดวกกว่าในการใช้การควบคุมด้วยเสียงขณะขับรถ จริงอยู่ไม่มีใครทำได้โดยไม่ต้องใช้มือเลย - ในการเปิดใช้คำสั่งเสียงคุณต้องกดปุ่มบนหน้าจอ

3. รถยนต์ - รถยนต์ใหม่บางยี่ห้อ เช่น Mercedes, Audi, Toyota, Ford หรือ BMW สามารถควบคุมได้โดยใช้เสียง (แม้ว่าชุดคำสั่งจะถูกจำกัด) ตัวอย่างเช่น ในรถยนต์ BMW บางรุ่น หลังจากกดปุ่มที่อยู่บนพวงมาลัย (ดูรูป) ฟังก์ชันการควบคุมด้วยเสียงของสเตอริโอหรือระบบนำทางจะเปิดใช้งาน

4. แผ่นมัลติมีเดียสำหรับการเรียนรู้ภาษาต่างประเทศ - โปรแกรมการเรียนรู้บางโปรแกรมตรวจสอบการออกเสียงที่ถูกต้อง โปรแกรมขอให้คุณอ่านบางประโยคและหลังจากประมวลผลผลลัพธ์โดยใช้ฟังก์ชันการรู้จำเสียงแล้ว จะรายงานว่าทุกอย่างเป็นไปตามการออกเสียงของคุณหรือไม่

ปัญหาอะไรเกิดขึ้นเมื่อทำงานกับโปรแกรม "การจดจำ"

การควบคุมอุปกรณ์หรือการเขียนตามคำบอกทำได้ดีพอ แต่น่าเสียดายที่ไม่สมบูรณ์แบบ และนี่คือสาเหตุหลายประการ:

1. คำพูดไม่ได้ออกเสียงเหมือนกันเสมอไป ความยากที่สุดในการรู้จำเสียงคือไม่มีใครออกเสียงคำเดียวกันในลักษณะเดียวกัน แม้ว่าพวกเขาจะพยายามอย่างหนักก็ตาม

2. ทุกคนพูดไม่เหมือนกัน ดังนั้นโปรแกรมการรู้จำเสียงจะทำงานได้ชัดเจนขึ้นหากผู้ใช้ใหม่ "ปฏิบัติ" ก่อนเล็กน้อย จริงอยู่ สิ่งนี้เป็นไปไม่ได้เสมอไปและบางครั้งก็ไม่จำเป็นด้วยซ้ำ เช่น เมื่อใช้โปรแกรมที่ไม่ได้เชื่อมโยงกับคู่สนทนา โปรแกรมรู้จำเสียงหลายโปรแกรมสามารถปรับแต่งผู้ใช้ใหม่ได้โดยอัตโนมัติ

3. เสียงพื้นหลังสามารถบิดเบือนเสียงของคำพูดได้อย่างมาก สิ่งนี้จำกัดการทำงานของการรู้จำเสียงอย่างมาก และในสถานที่ที่มีผู้คนพลุกพล่านหรือมีเสียงดังจะทำให้เป็นไปไม่ได้เลย

4. พูดเร็ว - ผู้ใช้บางคนพูดเร็วมาก - คำเกือบจะรวมกัน คู่สนทนาจะเข้าใจคำพูดดังกล่าวได้ง่าย แต่โปรแกรมจะยากเกินไปสำหรับงานดังกล่าว

5. คำที่มีเสียงเหมือนกัน (หรือคล้ายกันมาก) - เป็นเรื่องยากโดยเฉพาะอย่างยิ่งสำหรับโปรแกรมรู้จำเสียงที่เรียกว่าคำพ้องเสียง - คำที่ออกเสียงเกือบเหมือนกันแต่สะกดต่างกัน ("lez" และ "forest", "mouth" และ "สกุล"). โปรแกรมจะต้องกำหนดความหมายของคำดังกล่าวตามบริบทของประโยค

โอกาสสำหรับฟังก์ชั่นการรู้จำเสียงคืออะไร?

ในโทรศัพท์มือถือ บทบาทของฟังก์ชันการรู้จำเสียงจะเพิ่มขึ้นอย่างมาก เนื่องจากการพิมพ์ข้อความบนแป้นพิมพ์โทรศัพท์มือถือขนาดเล็กนั้นเหนื่อยมาก

1. การเขียนตามคำบอกของข้อความ SMS - ในไม่ช้าคุณไม่จำเป็นต้องพิมพ์ข้อความบนโทรศัพท์ของคุณ - คุณสามารถเขียนตามคำบอกได้ Samsung สัญญาว่าจะแนะนำฟังก์ชันนี้ในโทรศัพท์บางรุ่น (ซึ่งควรจะปรากฏในตลาดในอนาคตอันใกล้นี้)

2. การแปล - เมื่อถึงเวลาของการแข่งขันกีฬาโอลิมปิกปี 2008 ที่กรุงปักกิ่ง คาดว่าจะมีโทรศัพท์มือถือที่มีตัวแปลในตัวปรากฏขึ้น หากคุณอยู่ในราชอาณาจักรกลางต้องการรับประทานอาหารในร้านอาหารก็เพียงพอแล้วสำหรับคุณที่จะพูดคำสั่งของคุณเป็นภาษารัสเซียทางโทรศัพท์มือถือ - ทุกอย่างจะถูกแปลเป็นภาษาจีนและเสียงอิเล็กทรอนิกส์จาก ผู้พูดจะโอนคำสั่งไปยังบริกร

สันนิษฐานได้ว่าเมื่อเวลาผ่านไป อุปกรณ์จำนวนมากขึ้นจะเข้าใจเสียงของมนุษย์ ดังนั้นอย่าแปลกใจถ้าเช้าวันหนึ่งเครื่องชงกาแฟของคุณไม่เพียงถามคุณว่าจะชงอะไร - คาปูชิโน่หรือเอสเปรสโซ - แต่ยังเข้าใจคำตอบของคุณด้วย

การรู้จำเสียงใน Windows Vista

Windows Vista มีโปรแกรมรู้จำเสียง ขออภัย ส่วนประกอบนี้เข้าใจเฉพาะภาษาอังกฤษ เยอรมัน ฝรั่งเศส สเปน ญี่ปุ่น และจีนเท่านั้น เมื่อเปิดใช้งานส่วนประกอบเป็นครั้งแรก (คุณต้องเลือกรายการความง่ายในการเข้าถึงและการรู้จำเสียงในแผงควบคุม) หน้าต่างตัวช่วยสร้างการเรียนรู้จะเปิดขึ้นซึ่งจะทำให้คุณคุ้นเคยกับหลักการของการควบคุมด้วยเสียงของ Windows เป็นเวลาครึ่งชั่วโมง หลังจากทำแบบฝึกหัดสองสามข้อเสร็จแล้ว คุณจะได้เรียนรู้วิธีกำหนดและควบคุม Windows โดยใช้คำสั่งเสียง เนื่องจากซอฟต์แวร์การรู้จำเสียงขึ้นอยู่กับลำโพง ซอฟต์แวร์จะเรียนรู้เสียงของคุณไปพร้อมกัน หลังจากเรียนรู้ส่วนเบื้องต้นสำเร็จแล้ว Windows จะตอบสนองต่อการโทรของคุณ: "ฟัง!" และเริ่มรับคำสั่งเสียง ข้อเสีย: การป้อนข้อมูลด้วยเสียงใช้ได้กับโปรแกรม Microsoft เท่านั้น (เช่น สำหรับ Windows เอง, Word หรือ Internet Explorer) เมื่อใช้โปรแกรมอื่น (เช่น Open Office หรือ Firefox) คอมพิวเตอร์จะ "หูหนวก"

อัปเดต: วันจันทร์ที่ 31 กรกฎาคม 2017

ความคิดกึ่งมหัศจรรย์ในการพูดคุยกับคอมพิวเตอร์เกี่ยวข้องกับการถ่ายภาพระดับมืออาชีพอย่างไร? แทบไม่มีเลยหากคุณไม่ได้เป็นแฟนของแนวคิดของการพัฒนาสภาพแวดล้อมทางเทคนิคของมนุษย์อย่างไม่มีที่สิ้นสุด ลองนึกภาพสักครู่ว่าคุณกำลังสั่งงานด้วยเสียงไปยังกล้องของคุณเพื่อเปลี่ยนทางยาวโฟกัสและปรับการชดเชยแสงเป็นบวกครึ่งขั้น มีการใช้การควบคุมระยะไกลของกล้องแล้ว แต่คุณต้องกดปุ่มอย่างเงียบ ๆ และนี่คือการได้ยิน fotik!

กลายเป็นประเพณีไปแล้วที่จะกล่าวถึงภาพยนตร์ที่ยอดเยี่ยมเป็นตัวอย่างของการสื่อสารด้วยเสียงของมนุษย์กับคอมพิวเตอร์ อย่างน้อยที่สุดก็ "Space Odyssey 2001" ที่กำกับโดย Stanley Kubrick ที่นั่น คอมพิวเตอร์ออนบอร์ดไม่เพียงแต่ดำเนินการสนทนาอย่างมีความหมายกับนักบินอวกาศเท่านั้น แต่ยังสามารถอ่านริมฝีปากได้เหมือนคนหูหนวกอีกด้วย กล่าวอีกนัยหนึ่ง เครื่องเรียนรู้ที่จะจดจำคำพูดของมนุษย์โดยไม่มีข้อผิดพลาด บางทีบางคนอาจพบว่าการควบคุมกล้องด้วยเสียงจากระยะไกลไม่จำเป็น แต่หลายคนชอบวลีนี้ “พาเราออกไปที่รัก”และรูปถ่ายของทั้งครอบครัวที่มีต้นปาล์มเป็นฉากหลังก็พร้อมแล้ว

ที่นี่ฉันแสดงความเคารพต่อประเพณี เพ้อฝันเล็กน้อย แต่พูดจากก้นบึ้งของหัวใจ บทความนี้เขียนยาก และทั้งหมดเริ่มต้นด้วยของขวัญในรูปแบบของสมาร์ทโฟนที่ใช้ระบบปฏิบัติการ Android 4 HUAWEI U8815 รุ่นนี้มีหน้าจอสัมผัสขนาดเล็กสี่นิ้วและแป้นพิมพ์บนหน้าจอ มันค่อนข้างแปลกที่จะพิมพ์ลงไป แต่กลับกลายเป็นว่าไม่จำเป็นอย่างยิ่ง (ภาพ01)

1. การจดจำเสียงในสมาร์ทโฟนบนระบบปฏิบัติการ Android

ขณะที่ลองของเล่นใหม่ ฉันสังเกตเห็นกราฟิกไมโครโฟนในแถบค้นหา Googleและบนแป้นพิมพ์ใน Notes ก่อนหน้านี้ฉันไม่สนใจว่าสัญลักษณ์นี้หมายถึงอะไร ฉันได้สนทนาใน สไกป์และพิมพ์ตัวอักษรบนแป้นพิมพ์ นี่คือสิ่งที่ผู้ใช้อินเทอร์เน็ตส่วนใหญ่ทำ แต่หลังจากที่พวกเขาอธิบายให้ฉันทราบในเครื่องมือค้นหา Googleมีการเพิ่มการค้นหาด้วยเสียงในภาษารัสเซียและมีโปรแกรมที่ให้คุณเขียนตามคำบอกข้อความสั้น ๆ เมื่อใช้เบราว์เซอร์ โครเมียม.

ฉันพูดวลีสามคำ โปรแกรมระบุคำเหล่านั้นและแสดงในเซลล์ที่มีพื้นหลังสีน้ำเงิน มีบางอย่างที่ต้องประหลาดใจเพราะทุกคำสะกดถูกต้อง หากคุณคลิกที่เซลล์นี้ วลีจะปรากฏในช่องข้อความของแผ่นจดบันทึก android ดังนั้นเขาจึงพูดสองสามวลีและส่งข้อความถึงผู้ช่วยทาง SMS


2. ประวัติย่อของโปรแกรมจดจำเสียง

ไม่ใช่การค้นพบสำหรับฉันที่ความสำเร็จที่ทันสมัยในด้านการควบคุมด้วยเสียงช่วยให้คุณสามารถสั่งการเครื่องใช้ในครัวเรือน, รถยนต์, หุ่นยนต์ได้ โหมดคำสั่งถูกนำมาใช้ใน Windows, OS/2 และ Mac OS เวอร์ชันที่ผ่านมา ฉันเคยเห็นโปรแกรมนักพูด แต่มีประโยชน์อย่างไร บางทีอาจเป็นลักษณะเฉพาะของฉันที่การพูดได้ง่ายกว่าการพิมพ์บนแป้นพิมพ์ และบนโทรศัพท์มือถือฉันไม่สามารถพิมพ์อะไรได้เลย คุณต้องบันทึกผู้ติดต่อบนแล็ปท็อปด้วยแป้นพิมพ์ปกติและถ่ายโอนผ่านสาย USB แต่เพียงแค่พูดใส่ไมโครโฟนแล้วคอมพิวเตอร์ก็พิมพ์ข้อความโดยไม่มีข้อผิดพลาด - นี่เป็นความฝันสำหรับฉัน บรรยากาศแห่งความสิ้นหวังได้รับการสนับสนุนจากการอภิปรายในฟอรัม ทุกที่ที่พวกเขามีความคิดที่น่าเศร้า:

“อย่างไรก็ตาม ในทางปฏิบัติ จนถึงขณะนี้ โปรแกรมสำหรับการรู้จำเสียงพูดจริง (และแม้แต่ในภาษารัสเซีย) ยังไม่มีอยู่จริง และแน่นอนว่าพวกเขาจะไม่ถูกสร้างขึ้นในเร็วๆ นี้ ยิ่งไปกว่านั้น แม้แต่งานผกผันของการจดจำ - การสังเคราะห์เสียงซึ่งดูเหมือนจะง่ายกว่าการจดจำมาก ก็ยังไม่ได้รับการแก้ไขอย่างสมบูรณ์ (สำนักพิมพ์คอมพิวเตอร์ №12, 2547)

“จนถึงทุกวันนี้ไม่มีโปรแกรมรู้จำเสียงพูดปกติ (ไม่ใช่เฉพาะภาษารัสเซีย) เนื่องจากงานนี้ค่อนข้างยากสำหรับคอมพิวเตอร์ และสิ่งที่เลวร้ายที่สุดคือกลไกการรู้จำคำโดยบุคคลยังไม่ได้รับการตระหนักดังนั้นจึงไม่มีอะไรต้องสร้างเมื่อสร้างโปรแกรมการรู้จำ (การสนทนาอื่นในฟอรัม)

ในขณะเดียวกัน การทบทวนโปรแกรมป้อนข้อความภาษาอังกฤษก็ชี้ให้เห็นถึงความสำเร็จอย่างชัดเจน ตัวอย่างเช่น, IBM ViaVoice 98 รุ่นผู้บริหารมีพจนานุกรมพื้นฐาน 64,000 คำและความสามารถในการเพิ่มคำศัพท์ของตนเองในจำนวนที่เท่ากัน เปอร์เซ็นต์ของการรู้จำคำโดยไม่ได้ฝึกฝนโปรแกรมอยู่ที่ประมาณ 80% และด้วยการทำงานกับผู้ใช้รายใดรายหนึ่งในเวลาต่อมา สูงถึง 95%

จากโปรแกรมสำหรับจดจำภาษารัสเซีย "Gorynych" ซึ่งเป็นส่วนเสริมของ Dragon Dictate 2.5 ภาษาอังกฤษ เกี่ยวกับการค้นหาแล้ว "การต่อสู้กับ Gorynychs ห้าคน" ฉันจะบอกในส่วนที่สองของบทวิจารณ์ ฉันพบ "มังกรอังกฤษ" ก่อน

3. โปรแกรมจดจำคำพูดต่อเนื่อง "Dragon Naturally Speaking"

เวอร์ชันที่ทันสมัยของโปรแกรมของบริษัท ความแตกต่างนิดหน่อยกลายเป็นเพื่อนเก่าของฉันจากสถาบันภาษาต่างประเทศมินสค์ เธอนำมันมาจากการเดินทางไปต่างประเทศและซื้อมาโดยคิดว่าเธอสามารถเป็น "เลขานุการคอมพิวเตอร์" ได้ แต่มีบางอย่างไม่ทำงานและโปรแกรมยังคงเกือบลืมไปแล้วในแล็ปท็อป เนื่องจากไม่มีประสบการณ์ที่เข้าใจได้ ฉันจึงต้องไปหาเพื่อนด้วยตัวเอง บทนำที่มีความยาวทั้งหมดนี้จำเป็นสำหรับความเข้าใจที่ถูกต้องเกี่ยวกับข้อสรุปที่ฉันได้รับ

ชื่อเต็มของมังกรตัวแรกของฉันคือ: . โปรแกรมเป็นภาษาอังกฤษและทุกอย่างชัดเจนแม้ไม่มีคู่มือ ขั้นตอนแรกคือการสร้างโปรไฟล์ของผู้ใช้เฉพาะเพื่อกำหนดคุณลักษณะของเสียงของคำในการแสดงของเขา สิ่งที่ฉันทำ - อายุของผู้พูด, ประเทศ, ลักษณะเฉพาะของการออกเสียงมีความสำคัญ ตัวเลือกของฉันคือ: อายุ 22-54, ภาษาอังกฤษแบบอังกฤษ, การออกเสียงมาตรฐาน ถัดมาเป็นหน้าต่างสองสามหน้าต่างที่คุณตั้งค่าไมโครโฟน (ภาพ04)

ขั้นตอนต่อไปในโปรแกรมการรู้จำเสียงอย่างจริงจังคือการฝึกการออกเสียงเฉพาะของบุคคลใดบุคคลหนึ่ง คุณได้รับเชิญให้เลือกลักษณะของข้อความ: ตัวเลือกของฉันคือคำแนะนำสั้น ๆ เกี่ยวกับการเขียนตามคำบอก แต่คุณสามารถ "เรียงลำดับ" เรื่องราวตลกขบขันได้เช่นกัน

สาระสำคัญของขั้นตอนการทำงานกับโปรแกรมนี้ง่ายมาก - ข้อความจะปรากฏในหน้าต่างด้านบนเป็นลูกศรสีเหลือง เมื่อออกเสียงถูกต้อง ลูกศรจะเลื่อนผ่านวลีต่างๆ และที่ด้านล่างจะมีแถบแสดงความคืบหน้าในการฝึก บทสนทนาภาษาอังกฤษค่อนข้างลืมไปแล้ว ดังนั้นฉันจึงเคลื่อนไหวด้วยความยากลำบาก เวลาก็จำกัดเช่นกัน เพราะคอมพิวเตอร์ไม่ใช่ของฉัน และฉันต้องขัดจังหวะการฝึก แต่เพื่อนบอกว่าเธอทำแบบทดสอบได้ภายในเวลาไม่ถึงครึ่งชั่วโมง (ภาพที่05)

ปฏิเสธที่จะปรับโปรแกรมให้เข้ากับการออกเสียงของฉัน ฉันไปที่หน้าต่างหลักและเปิดโปรแกรมแก้ไขข้อความในตัว เขาพูดคำแยกต่างหากจากข้อความบางส่วนที่เขาพบในคอมพิวเตอร์ คำที่เขาพูดถูกต้อง รายการพิมพ์ คำที่เขาพูดไม่ดี แทนที่ด้วยคำว่า "ภาษาอังกฤษ" หลังจากออกเสียงคำสั่ง "ลบบรรทัด" เป็นภาษาอังกฤษอย่างชัดเจน โปรแกรมก็ตอบสนอง ซึ่งหมายความว่าฉันอ่านคำสั่งได้ถูกต้อง และโปรแกรมจดจำได้โดยไม่ต้องมีการฝึกอบรมล่วงหน้า

แต่มันสำคัญสำหรับฉันว่า "มังกร" ตัวนี้เขียนเป็นภาษารัสเซียอย่างไร ตามที่คุณเข้าใจจากคำอธิบายก่อนหน้านี้ เมื่อฝึกโปรแกรม คุณสามารถเลือกได้เฉพาะข้อความภาษาอังกฤษ ไม่มีข้อความภาษารัสเซียอยู่ที่นั่น เป็นที่ชัดเจนว่าการฝึกอบรมการรู้จำคำพูดภาษารัสเซียจะไม่ทำงาน ในภาพถัดไป คุณจะเห็นวลีที่โปรแกรมพิมพ์เมื่อออกเสียงคำว่า "สวัสดี" ในภาษารัสเซีย (ภาพ06)

ผลของการสื่อสารกับมังกรตัวแรกกลายเป็นเรื่องตลกเล็กน้อย หากคุณอ่านข้อความบนเว็บไซต์อย่างเป็นทางการอย่างละเอียด คุณจะเห็น "ความเชี่ยวชาญ" ภาษาอังกฤษของผลิตภัณฑ์ซอฟต์แวร์นี้ นอกจากนี้เมื่อโหลดเราจะอ่านในหน้าต่างโปรแกรม "ภาษาอังกฤษ" เหตุใดทั้งหมดนี้จึงจำเป็น เป็นที่ชัดเจนว่าฟอรัมและข่าวลือต้องตำหนิ ...

แต่ยังมีประสบการณ์ที่เป็นประโยชน์ เพื่อนของฉันขอดูสภาพแล็ปท็อปของเธอ เขาเริ่มทำงานอย่างช้าๆ ไม่น่าแปลกใจ - พาร์ติชันระบบมีพื้นที่ว่างเพียง 5% ในขณะที่ลบโปรแกรมที่ไม่จำเป็น ฉันเห็นว่าเวอร์ชันทางการใช้พื้นที่มากกว่า 2.3 GB เราจะต้องใช้หมายเลขนี้ในภายหลัง (ภาพที่ 07)



การรู้จำคำพูดของรัสเซียไม่ใช่เรื่องเล็กน้อย ในมินสค์ฉันหา "Gorynych" จากเพื่อนได้ เขาค้นหาแผ่นดิสก์เป็นเวลานานในเศษหินหรืออิฐเก่าของเขาและตามที่เขาพูดนี่คือสิ่งพิมพ์อย่างเป็นทางการ โปรแกรมติดตั้งทันที และฉันพบว่าพจนานุกรมมีคำศัพท์ภาษารัสเซีย 5,000 คำบวก 100 คำสั่งและภาษาอังกฤษ 600 คำบวก 31 คำสั่ง

ก่อนอื่นคุณต้องตั้งค่าไมโครโฟนซึ่งฉันทำไปแล้ว จากนั้นฉันก็เปิดพจนานุกรมและเพิ่มคำ "การตรวจสอบ"เพราะไม่มีในพจนานุกรมของโปรแกรม ฉันพยายามพูดให้ชัดเจนด้วยเสียงเดียว ในที่สุดฉันก็เปิดโปรแกรม Gorynych Pro 3.0 เปิดโหมดเขียนตามคำบอกและได้รับรายการ "คำที่ฟังดูคล้ายกัน" (ภาพที่.09)

ผลลัพธ์ที่ได้ทำให้ฉันงุนงงเพราะมันแตกต่างจากการทำงานของสมาร์ทโฟน Android ที่แย่กว่าอย่างชัดเจนและฉันตัดสินใจลองใช้โปรแกรมอื่นจาก " Google Chrome เว็บสโตร์". และเขาเลิกยุ่งเกี่ยวกับ "งูกอรีนิช" ในภายหลัง ฉันคิดอย่างนี้ การเลื่อนการกระทำในจิตวิญญาณดั้งเดิมของรัสเซีย

5. ความสามารถด้านเสียงของ Google

ในการทำงานด้วยเสียงบนคอมพิวเตอร์ปกติที่ใช้ระบบปฏิบัติการ Windows คุณจะต้องติดตั้งเบราว์เซอร์ Google Chrome. หากคุณกำลังทำงานบนอินเทอร์เน็ตคุณสามารถคลิกที่ลิงค์สำหรับร้านซอฟต์แวร์ที่ด้านล่างขวา ฉันพบสองโปรแกรมและส่วนขยายสองรายการสำหรับการป้อนข้อความเสียงที่นั่นโดยไม่เสียค่าใช้จ่าย มีการเรียกโปรแกรมต่างๆ "สมุดบันทึกเสียง"และ "Voysnot - เสียงเป็นข้อความ". หลังการติดตั้ง สามารถพบได้บนแท็บ "แอพพลิเคชั่น"เบราว์เซอร์ของคุณ "โครเมียม". (ภาพที่ 10)

นามสกุลเรียกว่า "คำที่นิยมของ Google Voice Search (เบต้า) 0.1.0.5"และ "ข้อความป้อนด้วยเสียง - Speechpad.ru 5.4". หลังจากติดตั้งแล้ว สามารถปิดหรือลบได้บนแท็บ "ส่วนขยาย".(ภาพที่ 11)

วอยซ์โน้ต. บนแท็บแอปพลิเคชันในเบราว์เซอร์ Chrome ดับเบิลคลิกที่ไอคอนโปรแกรม กล่องโต้ตอบจะเปิดขึ้นดังภาพด้านล่าง เมื่อคลิกที่ไอคอนไมโครโฟน คุณจะพูดวลีสั้นๆ ใส่ไมโครโฟน โปรแกรมจะส่งคำพูดของคุณไปยังเซิร์ฟเวอร์การรู้จำเสียงและพิมพ์ข้อความในหน้าต่าง คำและวลีทั้งหมดที่แสดงในภาพประกอบถูกพิมพ์ในครั้งแรก เห็นได้ชัดว่าวิธีนี้ใช้ได้กับการเชื่อมต่ออินเทอร์เน็ตที่ใช้งานอยู่เท่านั้น (ภาพที่ 12)

แผ่นจดบันทึกด้วยเสียง. หากคุณเรียกใช้โปรแกรมบนแท็บแอปพลิเคชัน แท็บใหม่ของหน้าอินเทอร์เน็ตจะเปิดขึ้น Speechpad.ru. มีคำแนะนำโดยละเอียดเกี่ยวกับการใช้บริการนี้และรูปแบบที่กะทัดรัด หลังแสดงในภาพประกอบด้านล่าง (ภาพที่ 13)

การป้อนข้อมูลด้วยเสียงข้อความ ให้คุณกรอกข้อความในช่องข้อความของหน้าอินเทอร์เน็ตด้วยเสียงของคุณ ตัวอย่างเช่น ฉันไปที่เพจของฉัน Google+. ในฟิลด์ป้อนข้อความใหม่ ให้คลิกขวาและเลือก "แผ่นเสียง". ช่องใส่สีชมพูบอกว่าคุณสามารถเขียนตามคำบอกของคุณได้ (ภาพที่ 14)

Google ค้นหาด้วยเสียงให้คุณค้นหาด้วยเสียง เมื่อคุณติดตั้งและเปิดใช้งานส่วนขยายนี้ สัญลักษณ์ไมโครโฟนจะปรากฏในแถบค้นหา เมื่อคุณกด สัญลักษณ์จะปรากฏในวงกลมสีแดงขนาดใหญ่ เพียงพูดวลีค้นหาก็จะปรากฏในผลการค้นหา (ภาพที่ 15)

หมายเหตุสำคัญ: เพื่อให้ไมโครโฟนใช้งานได้กับส่วนขยายของ Chrome คุณต้องอนุญาตการเข้าถึงไมโครโฟนในการตั้งค่าเบราว์เซอร์ มันถูกปิดใช้งานโดยค่าเริ่มต้นด้วยเหตุผลด้านความปลอดภัย ผ่านเข้ามา การตั้งค่า→ข้อมูลส่วนบุคคล→การตั้งค่าเนื้อหา. (หากต้องการเข้าถึงการตั้งค่าทั้งหมดที่ส่วนท้ายของรายการ ให้คลิก แสดงการตั้งค่าขั้นสูง). กล่องโต้ตอบจะเปิดขึ้น การตั้งค่าเนื้อหาของเพจ. เลือกรายการในรายการ มัลติมีเดีย→ไมโครโฟน.

6. ผลการทำงานกับโปรแกรมรู้จำเสียงของรัสเซีย

ประสบการณ์เล็กน้อยในการใช้โปรแกรมป้อนข้อความด้วยเสียงแสดงให้เห็นการใช้งานคุณลักษณะนี้อย่างยอดเยี่ยมบนเซิร์ฟเวอร์ของบริษัทอินเทอร์เน็ต Google. โดยไม่ต้องมีการฝึกอบรมใด ๆ มาก่อน จำคำศัพท์ได้อย่างถูกต้อง สิ่งนี้บ่งชี้ว่าปัญหาของการรู้จำเสียงภาษารัสเซียได้รับการแก้ไขแล้ว

ตอนนี้เราสามารถพูดได้ว่าผลของการพัฒนา Googleจะเป็นเกณฑ์ใหม่ในการประเมินสินค้าจากผู้ผลิตรายอื่น ฉันต้องการให้ระบบจดจำทำงานแบบออฟไลน์โดยไม่ต้องติดต่อกับเซิร์ฟเวอร์ของบริษัท ซึ่งสะดวกและรวดเร็วกว่า แต่เมื่อใดที่โปรแกรมอิสระสำหรับการทำงานกับสุนทรพจน์ภาษารัสเซียอย่างต่อเนื่องจะถูกปล่อยออกมาไม่เป็นที่รู้จัก อย่างไรก็ตาม มันก็คุ้มค่าที่จะสันนิษฐานว่าโอกาสในการฝึกฝน "การสร้างสรรค์" นี้จะเป็นความก้าวหน้าอย่างแท้จริง

โปรแกรมของนักพัฒนารัสเซีย "กอรีนิช", "ดิกโตกราฟ"และ "การต่อสู้"ฉันจะอธิบายอย่างละเอียดในส่วนที่สองของบทวิจารณ์นี้ บทความนี้เขียนช้ามากเนื่องจากการค้นหาแผ่นต้นฉบับเป็นเรื่องยาก ในขณะนี้ ฉันมีซอฟต์แวร์การจดจำเสียงเป็นข้อความของรัสเซียทุกเวอร์ชันอยู่แล้ว ยกเว้น Combat 2.52 ไม่มีเพื่อนหรือเพื่อนร่วมงานของฉันที่มีโปรแกรมนี้ และตัวฉันเองมีบทวิจารณ์ที่น่ายกย่องเพียงไม่กี่รายการในฟอรัม จริงมีตัวเลือกที่แปลก - ดาวน์โหลด "Combat" ผ่าน SMS แต่ฉันไม่ชอบ (ภาพที่ 16)


คลิปวิดีโอสั้นๆ จะแสดงให้คุณเห็นว่าการรู้จำเสียงทำงานอย่างไรในสมาร์ทโฟนที่ใช้ระบบปฏิบัติการ Android คุณลักษณะของการโทรออกด้วยเสียงคือต้องเชื่อมต่อกับเซิร์ฟเวอร์ของ Google ดังนั้น อินเทอร์เน็ตควรใช้งานได้สำหรับคุณ

ราคา — $199.99
นักพัฒนา ScanSoft
เว็บไซต์ www.scansoft.com
ขนาด
หน้าดาวน์โหลดเลขที่
+
ฟังก์ชั่นที่กว้างที่สุด ทำงานในแอปพลิเคชัน Windows ทั้งหมด ฐานข้อมูลคำศัพท์ที่มีประสิทธิภาพ
ราคาสูง
! ซอฟต์แวร์รู้จำเสียงที่ดีที่สุดที่มีอยู่

โมดูลการรู้จำเสียงที่ดีที่สุดอย่างแน่นอน! ในประวัติศาสตร์อันยาวนาน Dragon ได้มาจากทหารสู่จอมพล ไม่ บางทีอาจจะยังไม่ถึงจอมพล แต่แน่นอนว่าเขาสมควรได้รับตำแหน่งนายพลแห่งกองทัพ อัลกอริธึมทั้งหมดของการทำงานกับโปรแกรมนั้นง่ายมาก - เราเชื่อมต่อหูฟังและไมโครโฟนเข้ากับเอาต์พุตที่สอดคล้องกันจากการ์ดเสียงและเรียกใช้ยูทิลิตี้เอง ขั้นแรก ผู้ใช้จะถูกขอให้ปรับระดับเสียงจากไมโครโฟนและกำหนดข้อความสำเร็จรูปจำนวนหนึ่งไปยังคอมพิวเตอร์เพื่อปรับแต่ง Dragon Naturally Speaking ให้เหมาะกับเสียงต่ำ น้ำเสียง และการออกเสียงของคุณ และสุดท้ายคือบทช่วยสอนแบบโต้ตอบที่ผู้ใช้จะได้เรียนรู้คำสั่งเสียงพื้นฐาน

เป็นที่น่าสังเกตว่าพีซีไม่ใช่คู่สนทนาสดและเขาไม่สามารถคิดพยางค์ที่ "กลืน" หรือเข้าใจประโยคที่ไม่เข้าใจได้ สำเนียงของผู้พูดมีความสำคัญไม่น้อยไปกว่ากัน เช่น ระดับของภาษาอังกฤษ ซึ่งเช่น ฟังในการประชุมทางวิทยาศาสตร์ระดับนานาชาติต่างๆ นั้น โดยหลักการแล้วไม่เหมาะสมสำหรับการทำงาน ในทางกลับกัน มีความเป็นไปได้เสมอในการเรียนรู้ด้วยตนเอง: หาก Dragon ไม่ต้องการจดจำคำศัพท์ใดๆ ในทางใดทางหนึ่ง อย่าขี้เกียจเกินไปที่จะมองหา Lingvo และออกเสียงด้วยการถอดความที่ถูกต้อง ฉันรับรองกับคุณว่าอย่างน้อยหนึ่งหรือสองสัปดาห์คุณจะไม่เพียงเขียนตามคำบอกของข้อความเป็นกิโลไบต์อย่างง่ายดาย แต่ยังอวดการออกเสียงภาษาอังกฤษที่แท้จริงในหมู่คนรู้จักของคุณอีกด้วย

ยังไม่พอใจกับคุณภาพการรับรู้? ตรวจสอบ Accuracy Center ในพื้นที่ของคุณ ซึ่งจะปรับโปรไฟล์ผู้ใช้ของคุณให้เหมาะสมและสอนวิธีเพิ่ม neo-logisms ที่เป็นที่นิยมในคำศัพท์ของคุณ นอกจากนี้ยังสามารถดำเนินการที่แปลกใหม่ได้มากขึ้น เช่น การจดจำเนื้อหาข้อความของไฟล์ wav (รวมถึงจาก Pocket PC หรือโดยตรงจากเอาต์พุตบรรทัดของการ์ดเสียง) นอกจากนี้ Dragon Naturally Speaking ยังสามารถเปิดโปรแกรมต่างๆ สลับไปมาระหว่างโปรแกรมเหล่านั้น และแม้แต่ควบคุมฟังก์ชันต่างๆ ของโปรแกรมเหล่านั้น (เช่น เริ่ม/หยุดเล่นเพลงชั่วคราวในเครื่องเล่นมีเดียหรือสั่งงานโดยตรงจากเมนู) รุ่นที่ต้องการและรุ่น Pro-fessional ยังรวมเครื่องมือพูด Real-Speech 2 ของตัวเองซึ่งเป็นหนึ่งในเครื่องมือที่ทันสมัยที่สุดในปัจจุบัน

แต่ขอกลับไปที่คำพูด เป็นเรื่องน่ายินดีอย่างยิ่งที่คุณสามารถเขียนตามคำบอกได้ไม่เฉพาะในโปรแกรมประมวลผลข้อความ DragonPad ดั้งเดิมเท่านั้น แต่ยังอยู่ในแอปพลิเคชันอื่นที่คล้ายคลึงกัน เช่น MS Word, Outlook Express, Internet Ex-plorer และ Corel WordPerfect ด้วยความสำเร็จเดียวกัน โปรแกรมนี้ทำงานร่วมกับ ICQ, แชทผ่านเครือข่าย (Network Assistant) และผู้ส่งข้อความโต้ตอบแบบทันทีอื่น ๆ อย่างไรก็ตาม คำสั่งบางคำสั่งจะไม่สามารถใช้งานได้ แต่จะส่งข้อความได้ เข้าคุณไม่จำเป็นต้องคลิก เพียงแค่พูดว่า: "ย่อหน้าใหม่" - และ ICQ จะดำเนินการให้โดยอัตโนมัติ ในแอปพลิเคชันที่เชี่ยวชาญมากขึ้น โดยเฉพาะอย่างยิ่งใน Word เดียวกัน มีการใช้คำสั่งเพิ่มเติม: การจัดรูปแบบข้อความ การสะกดคำ การแก้ไข - และทั้งหมดนี้ใช้ผ่านการพูดด้วยวาจาเท่านั้น หากชุดคำสั่งมาตรฐานไม่เพียงพอ คุณสามารถสร้างคำสั่งของคุณเองได้เสมอ ซึ่งจะเป็นการขยายฟังก์ชันการทำงานของ Dragon ต้องใช้ความพยายามเพียงเล็กน้อย และค่อนข้างเป็นไปได้ที่จะพิมพ์หน้าข้อความโดยไม่มีการแก้ไขใดๆ สิ่งสำคัญคือการผสมผสานที่ถูกต้องของน้ำเสียงและการออกเสียง อย่าวาดวลี แต่อย่าเขียนลวก ๆ เหมือนปืนกล มิฉะนั้นเปอร์เซ็นต์ของเนื้อหาที่เข้าใจถูกต้องจะมีแนวโน้มเป็นศูนย์อย่างมั่นใจ ยิ่งไปกว่านั้น ไม่จำเป็นต้องดูพจนานุกรมตลอดเวลา แม้ว่าคุณจะออกเสียงบางวลีไม่ถูกต้อง (เช่น ฉันมีความสุขมาก) ที่รู้จักในโปรแกรม โปรแกรมก็จะ "เดา" แก้ไขข้อความโดยอัตโนมัติ หวือหวา? ทั้งหมดนี้เป็นเรื่องของคำศัพท์ขนาดใหญ่ ซึ่งเมื่อรวมกับเทคโนโลยีการรู้จำเสียงขั้นสูงแล้ว ก็ไม่ทิ้งโอกาสสำหรับคู่แข่ง เราจะจำ Dragon รุ่นแรก ๆ ได้อย่างไรซึ่งผู้เขียนบรรทัดเหล่านี้ต้องทนทุกข์ทรมานมากในอดีต แต่ไม่ได้งานคุณภาพสูงจากพวกเขา ...

ระบบจดจำเสียงอัจฉริยะ (IVOS) 2.0.2A
แชร์แวร์ (ทดลองใช้ 30 วัน ลงทะเบียน - $50)
ผู้พัฒนา ComunX
เว็บไซต์ www.ivos.biz
ขนาด 2.69 ลบ
หน้าดาวน์โหลด ftp://ftp.download.com/
ผับ/ppd/1007091810190380/
setup_ivos.exe
+
ขนาดจุลภาคของการกระจาย ฟังก์ชั่นที่ยอดเยี่ยม
โหมดชวเลขคำพูดยังไม่ถึงระดับมังกร
! หนึ่งในสาธารณูปโภคที่ดีที่สุดในย่านนี้

โปรแกรมที่เจียมเนื้อเจียมตัวที่สุด (ตามขนาดของชุดการแจกจ่าย) ในการตรวจสอบได้รับการพิสูจน์แล้วว่าคุ้มค่าอย่างน่าประหลาดใจและพิสูจน์ชื่อที่ดังของมันได้อย่างสมเหตุสมผล เหตุผลนี้เป็นสากลซึ่งออกแบบมาเพื่อกำจัดวิธีการป้อนข้อมูล "ด้วยตนเอง" อย่างสมบูรณ์ ดังนั้น IVOS ช่วยให้คุณ: a) จดจำเสียงพูดและแปลงเป็นข้อความในโปรแกรมประมวลผลข้อความที่เข้ากันได้กับ Windows; b) จัดการพีซีของคุณด้วยคำสั่งเสียงที่หลากหลาย รวมถึงสร้างของคุณเอง c) e-book เสียงโดยใช้เครื่องมือเสียงภายนอก นอกจากนี้แน่นอนว่าเรื่องเล็ก ๆ น้อย ๆ เช่นการแยกข้อความจากไฟล์ Wav แผงควบคุมโปรแกรมที่สะดวกซึ่งไม่เป็นภาระต่อหน้าจอและราคาที่ไม่แพง (เมื่อเทียบกับ Dragon รุ่นเดียวกัน) เมื่อลงทะเบียนแล้ว ผู้ใช้จะสามารถเข้าถึงเทคโนโลยี VoiceTouch ซึ่งช่วยให้พีซีสามารถเรียนรู้คำสั่งเสียงของคุณเองได้

ประสิทธิภาพของการดำเนินการคำสั่งนั้นสูงอย่างน่าประหลาดใจ - อาจจะดีกว่า Realize Voice เสียด้วยซ้ำ แต่ระดับการรับรู้ของ "การบรรยาย" จะลดลงซึ่งไม่แปลก: การเข้าใจคำสองสามคำเป็นเรื่องหนึ่งและอีกเรื่องหนึ่งคือการเข้าใจทั้งประโยค ควรสังเกตว่า IVOS เช่นเดียวกับโปรแกรมรู้จำเสียงอื่น ๆ ยกเว้น Dragon ใช้โมดูล Speech API จาก Microsoft เพื่อวัตถุประสงค์ดังกล่าว และประสิทธิภาพในพื้นที่นี้ขึ้นอยู่กับความสำเร็จในการสร้างสรรค์ขององค์กรนี้โดยตรง อย่างไรก็ตาม เป็นไปได้ที่จะบรรลุผลงานคุณภาพสูงจาก IVOS ในตอนนี้ โดยอ่านข้อความการฝึกอบรมทั้งหมดที่มีในสต็อคไปยังโปรแกรม แน่นอนว่าในท้ายที่สุดแล้ว เธอจะไม่ถึงระดับของ Dragon Naturally Speaking แต่เธอก็ค่อนข้างมีความสามารถในการพิมพ์เอกสารที่ไม่ซับซ้อนเกินไป และหากคุณเติมพจนานุกรมผู้ใช้เป็นประจำก็จะไม่มีปัญหาเกี่ยวกับคำศัพท์ทางวิทยาศาสตร์ จริงอยู่ที่ภาวะที่กลืนไม่เข้าคายไม่ออกเกิดขึ้นที่นี่ - ในสัปดาห์ที่จะต้องใช้ในการสอนยูทิลิตี้เกี่ยวกับความซับซ้อนทั้งหมดของการทำงานกับคำพูดมันค่อนข้างเป็นไปได้ที่จะเชี่ยวชาญวิธีการพิมพ์ด้วยสิบนิ้วตาบอดบนแป้นพิมพ์อย่างรวดเร็ว . .. ในทางกลับกัน คุณสมบัติของผู้ใช้พีซีจะเพิ่มขึ้นก็ต่อเมื่อเขามีวิธีการป้อนข้อมูลลงในคอมพิวเตอร์หลายวิธี

ตระหนักถึงเสียง 4.0

ตระหนักถึงเสียง 4.0
แชร์แวร์ (ทดลองใช้ 15 วัน ลงทะเบียน - $49.00)
ผู้พัฒนา Realize Software Corporation
เว็บไซต์ www.realizesoftware.com
ขนาด 55 MB
หน้าดาวน์โหลด
www.realizesoftware.com/
ดาวน์โหลด/RzRV40download.exe (ตัวติดตั้งเว็บ)
+
ไม่โอ้อวดต่อการออกเสียงของผู้ใช้ ชุดคำสั่งที่กว้างมาก
คุณภาพของงานยังดีกว่านี้ ติดตั้งเฉพาะใน Windows เวอร์ชันภาษาอังกฤษเท่านั้น
! ควบคุมพีซีของคุณด้วยเสียงของคุณ

Realize Voice ซึ่งแตกต่างจาก Dragon Naturally Speaking ที่ผ่านการตรวจสอบก่อนหน้านี้ไม่สามารถจดชวเลขได้มากนัก (แม้ว่าฟังก์ชั่นดังกล่าวจะอยู่ในคลังแสง) แต่ก็สามารถรับมือกับคำสั่งเสียงได้อย่างยอดเยี่ยม คุณไม่จำเป็นต้องมีความรู้เชิงลึกเป็นพิเศษในด้านภาษาอังกฤษ - ด้วยโมดูลอัจฉริยะของตัววิเคราะห์ฮิวริสติก โปรแกรมจะค้นหาภาษากลางได้อย่างง่ายดายกับผู้พูดเกือบทุกคน ช่วงของฟังก์ชั่น Realize Voice นั้นค่อนข้างกว้าง: ตั้งแต่การเปิดใช้ไฟล์ปฏิบัติการและทางลัดโปรแกรมไปจนถึงการทำงานกับการติดต่อทางจดหมายและมาโครที่ซับซ้อน เช่นเดียวกับในโปรแกรมอื่นที่คล้ายคลึงกัน ผู้ใช้ต้องการเพียงไมโครโฟนที่เชื่อมต่ออยู่และเวลาสองสามนาทีเพื่อไปยังจุดต่ำสุดของสิ่งต่างๆ และก่อนที่จะดำเนินการสื่อสารจริงกับยูทิลิตี การกำหนดขอบเขตของงานนั้นคุ้มค่า ทางลัดเมนูระบบจะจัดอยู่ในหมวดหมู่นี้ตามค่าเริ่มต้น เดสก์ทอป, เนื้อหาของโฟลเดอร์ รายการโปรดและแถบเปิดใช้ด่วน ตลอดจนเอกสารและโปรแกรมที่เปิดล่าสุด กระบวนการทั้งหมดเป็นไปโดยอัตโนมัติอย่างสมบูรณ์และดำเนินการในทันที จริงอยู่ที่ความไม่สะดวกบางอย่างเกิดจากการใช้ตัวเลขในชื่อคำสั่งไม่ได้ ตัวอย่างเช่น จะสามารถเรียกใช้ DOOM 3 โดยใช้คำสั่งเสียงได้โดยการเปลี่ยนชื่อทางลัดเป็น "DOOM Three" เท่านั้น อย่างไรก็ตาม เช่นเดียวกับอักษรซีริลลิก - ไม่ใช่เรื่องสนุกใช่ไหม อย่างไรก็ตาม ในกรณีเช่นนี้ คุณสามารถใช้การกำหนดค่าด้วยตนเองของโปรแกรมได้เสมอ โดยระบุเส้นทางไปยังไฟล์/เอกสาร/ภาพกราฟิกที่คุณสนใจโดยตรง เป็นต้น ที่นี่ ชื่อไฟล์และพิกัดของไฟล์นั้นไม่สำคัญ แม้แต่ ถ้าเป็น abvgd.exe ใช่ And เดสก์ทอปคุณไม่จำเป็นต้องเสีย ฉันพอใจมากกับชุดคำสั่งระบบในตัวสำหรับการทำงานกับ Windows แม้ว่ามันจะไม่ใหญ่เกินไป แต่ก็สามารถย้ายไปมาระหว่างหน้าต่างที่เปิดอยู่ เลียนแบบการทำงานของปุ่มทั่วไป ( Spacebar, แทรก, หน้าแรกฯลฯ ) ค่อนข้างเป็นไปได้ที่จะปิดและบล็อกระบบด้วยความช่วยเหลือ

เล็กน้อยเกี่ยวกับมาโคร ยูทิลิตีนี้ช่วยให้คุณสามารถรวมชุดการดำเนินการทั้งหมดไว้ภายใต้คำสั่งเดียว ตั้งแต่การป้อนอักขระจากแป้นพิมพ์และคำสั่งระบบไปจนถึงการสังเคราะห์เสียงโดยใช้โปรแกรมเสียงในตัว จริงอยู่ ไอดีลเช่นการบันทึกซีดีด้วยความช่วยเหลือของวลีเดียวยังอยู่ห่างไกล แต่เวลาจะบอก ... สิ่งสำคัญคือตอนนี้คุณสามารถ (และไม่สำเร็จ!) "บังคับ" สัตว์เลี้ยงของคุณแล้ว ยุคสมัยเช่นเมาส์และคีย์บอร์ด ลอง - คุณจะไม่เสียใจเลย!

สตูดิโอเสียง 1.4.6

สตูดิโอเสียง 1.4.6
แชร์แวร์ (ทดลองใช้ 7 วัน ลงทะเบียน - $20.97)
นักพัฒนา Ultimate Interactive Desktop
เว็บไซต์ www.voicestudio.us
ขนาด 57 MB
หน้าดาวน์โหลด
ftp://ftp.voicestudio.us/
pub/dl2/vssetup.exe
+
ฟังก์ชั่นที่ยอดเยี่ยม การปรากฏตัวของตัวละครอนิเมชั่น "สด"; ราคาต่ำมาก
MS SAPI ใช้สำหรับการรู้จำเสียง การใช้ทรัพยากรค่อนข้างสูง
! ส่วนเสริมที่ยอดเยี่ยมสำหรับการควบคุมเสียงของ Dragon สำหรับพีซี

บางทีอาจเป็นหนึ่งในไม่กี่โปรแกรม หากไม่ใช่เพียงโปรแกรมดังกล่าว ซึ่งในที่สุดคู่สนทนาเสมือนของเราที่อยู่อีกฝั่งของจอภาพก็ได้รับแบบฟอร์มวัสดุ และแม้ว่าเทคโนโลยี MS Agent ซึ่งใช้เพื่อวัตถุประสงค์เหล่านี้ แทบจะไม่สามารถเรียกได้ว่าเป็นต้นแบบของปัญญาประดิษฐ์ แต่ก็มีข้อกำหนดเบื้องต้นทั้งหมดสำหรับสิ่งนี้ ผู้ช่วยแอนิเมชั่นไม่เพียงแต่มีความเป็นอิสระในระดับหนึ่งเท่านั้น แต่ยังรู้วิธีตอบสนองต่อวลีมาตรฐานต่างๆ (เช่น "สวัสดี!" "คุณรู้สึกอย่างไร" "คอมพิวเตอร์เสีย" เป็นต้น) หากต้องการคุณสามารถเติมคำศัพท์และคลังวลีของเขาได้ง่ายและนอกจากนี้ตั้งค่าการกระทำของเขาตาม "อารมณ์" แม้ว่าการสนทนาดังกล่าวกับพีซีจะถูกจำกัดขอบเขตความรู้ของโปรแกรม แต่ก็ไม่มีใครรบกวนที่จะขยายมันออกไปอย่างไม่มีกำหนด และมันก็อยู่ไม่ไกลจาก AI ที่มีชื่อเสียง ... อย่างไรก็ตามฉันพูดนอกเรื่องเล็กน้อย

ที่จริงแล้วด้วยฟังก์ชันการทำงานของ Voice Studio ทุกอย่างจึงเป็นระเบียบเรียบร้อย - ชวเลข (แม้ว่า Dragon จะดีกว่ามาก) คำสั่งเสียงที่หลากหลาย (คุณสามารถพิมพ์ออกมาเพื่อความสะดวกและการท่องจำที่เร็วขึ้น) รวมถึงการสังเคราะห์เสียงพูดด้วยเครื่องที่ยอมรับได้ . จากสิ่งที่ร้ายแรงกว่านั้น - การสร้างมาโครเพื่อเรียกใช้ชุดการดำเนินการพร้อมกันด้วยคำหลักคำเดียว แม้กระทั่งการบันทึกและเล่นซ้ำการเคลื่อนไหวของเมาส์! ฉันขอเตือนคุณว่า "คุณลักษณะ" สุดท้ายนี้ใช้กันอย่างแพร่หลายในเบราว์เซอร์ทางเลือกมากมาย เช่น GreenBrowser หรือ MyIE2 เพื่อดำเนินการหลายอย่าง (ไปที่หน้าอื่น เปิดหน้าต่างใหม่ ฯลฯ) ตอนนี้ไม่จำเป็นต้องใช้ท่าทางสัมผัสที่ไม่จำเป็น เพียงแค่พูดคำสั่งที่เหมาะสม จากนั้นคอมพิวเตอร์จะสร้างสคริปต์ที่บันทึกไว้ก่อนหน้านี้ขึ้นมาใหม่โดยอัตโนมัติ ใครจะไปรู้ อีกไม่นานเราอาจจะเล่นเกมโดยใช้ไมโครโฟนอย่างเดียวก็ได้? เวลาจะแสดง…

ในขณะเดียวกัน Voice Studio สมควรได้รับคะแนนสูงสุดอย่างไม่ต้องสงสัยสำหรับความเป็นมิตรที่น่าทึ่งและใช้งานง่าย ให้การบันทึกเสียงพูดที่ถูกต้องยังไม่อยู่ในอำนาจของเธอ แต่การควบคุมเสียงของพีซีที่นี่หาที่เปรียบมิได้ ยูทิลิตี้ที่ดีที่สุดเหล่านี้และส่วนเสริมที่คู่ควรกับ Dragon!

การเขียนตามคำบอก 2004 v.4.5.2399

การเขียนตามคำบอก 2004 v.4.5.2399
แชร์แวร์ (ทดลองใช้ 7 วัน ลงทะเบียน - $49.99)
นักพัฒนา United Research Labs
เว็บไซต์ www.research-lab.com
ขนาด 41 ลบ
หน้าดาวน์โหลด
www.bandwidthsaver.com/
ดาวน์โหลด/dict2002.zip
+
ชุดฟังก์ชันพื้นฐานสำหรับจัดการพีซีและบันทึกเสียงพูด ใช้งานได้ดีกับไฟล์ wav
ไม่ใช่คะแนนการรู้จำเสียงที่ดีที่สุด โปรแกรมแก้ไขข้อความที่น่ารำคาญ
! น้อยเกินไปสำหรับราคา

แม้จะดูเหมือนมีทักษะพื้นฐานมาตรฐานที่สมบูรณ์ แต่ Dictation 2004 ก็ยังมีบางอย่าง ประการแรก นี่คือเทคโนโลยี Point-and-Speak ซึ่งทำให้ง่ายต่อการสร้างคำสั่งสำหรับการป้อนรหัสผ่าน เรียกใช้ซอฟต์แวร์ และเขียนตามคำบอกในแอปพลิเคชัน Windows เกือบทั้งหมด มีการประกาศการรวมเข้ากับ MS Word รวมถึงเทคโนโลยีอัจฉริยะสำหรับคำจำกัดความของวลีที่ถูกต้อง จริงอยู่ที่มันใช้งานไม่สะดวกอย่างยิ่ง - ในรูปแบบของหน้าต่างป๊อปอัปที่ปรากฏขึ้นพร้อมกับทุกคำที่พูดและกีดกันความปรารถนาที่จะทำงานเท่านั้น เป็นการดีที่คุณสามารถปิดได้ Dictation 2004 ใช้ SAPI 5.1 เดียวกัน ดังนั้นคุณภาพของซอฟต์แวร์จึงไม่แตกต่างจากซอฟต์แวร์อื่นๆ ที่ใช้เทคโนโลยีเดียวกัน (Voxx, IVOS, Realize Voice เป็นต้น) ในบรรดาฟังก์ชันเพิ่มเติมนั้น สิ่งที่ควรสังเกตคือ WAV Recorder สำหรับบันทึกข้อมูลจากเทปเสียง อุปกรณ์พกพา ไมโครโฟน แล้วบันทึกลงในไฟล์ wav จากนั้นข้อความจะถูกดึงออกมาโดยใช้แอปเพล็ตการเขียนตามคำบอกแยกต่างหาก - Wave-to-Text จนถึงตอนนี้เขายังห่างไกลจากอุดมคติ แต่ถ้าผู้พูดมีคำพูดที่ชัดเจนและการออกเสียงที่ดีก็จะไม่มีปัญหา

+
ความคล่องตัวในการทำงาน ความเป็นไปได้ที่หลากหลาย
— "การฝึกอบรม" โปรแกรมจะใช้เวลานาน ! ผลิตภัณฑ์ที่น่าสนใจ แต่น่าจะดีกว่านี้...

"แจ็คของการซื้อขายทั้งหมด" อื่นที่ช่วยให้คุณสนทนากับพีซีของคุณได้อย่างจุใจ รายการคุณลักษณะของโปรแกรมคล้ายกับ IVOS มาก (ชวเลข / คำสั่งเสียง / การอ่านข้อความ) ยกเว้นว่ามีโบนัสที่มีประโยชน์อยู่ที่นี่ - การแสดงทุกการกระทำของคุณอย่างละเอียดถี่ถ้วน ไม่ว่าจะเป็นการพิมพ์หรือเปิดไฟล์ โปรแกรมใช้ Microsoft Speech API เดียวกันกับ IVOS ดังนั้นคุณภาพการจดจำจึงใกล้เคียงกัน มีชุดคำสั่งเสียงที่ดีสำหรับการนำทางเบราว์เซอร์ การดำเนินการพื้นฐานในโปรแกรมแก้ไขข้อความ (ตัด / คัดลอก / วาง ฯลฯ ) เช่นเดียวกับการทำงานกับ windows มีทางลัดสำหรับการเรียกแอปเพล็ตระบบ แม้กระทั่งการเปิด / ปิด ถาดออปติคัลไดรฟ์ - โดยทั่วไปแล้วทุกอย่างเพื่อการทำงานที่สะดวกสบาย สำหรับการสังเคราะห์เสียงนั้นขึ้นอยู่กับโมดูลที่เกี่ยวข้องที่ติดตั้งในระบบโดยตรง เอ็นจิ้นฟรีจาก Microsoft ที่มาพร้อมกับโปรแกรมนั้นยังห่างไกลจากอุดมคติ แต่โดยหลักการแล้ว คุณจะคุ้นเคยกับมันได้ ตัวเลือกที่สะดวกกว่าคือไม่เสียค่าใช้จ่าย ลองใช้การพัฒนาของบุคคลที่สาม โดยเฉพาะ Digit PC ซึ่งนอกจากนี้ยังมีผู้พูดภาษารัสเซียได้ดีมากอีกด้วย เมื่อพิจารณาถึงข้อดีและข้อเสียทั้งหมดแล้ว Voxx จึงเป็นตัวเลือกที่ดีที่จะซื้อ ยังไงก็ตาม เวอร์ชันทดลองถูกจำกัดด้วยจำนวนวลี/คำสั่งต่อเซสชันเท่านั้น เพื่อเริ่มเซสชันใหม่ เพียงรีสตาร์ทโปรแกรม ...

บทสรุป

แม้จะมีข้อบกพร่องมากมาย แต่โปรแกรมการรู้จำเสียงได้เปลี่ยนจากระดับของเล่นเป็นเครื่องมือที่จริงจังสำหรับนักธุรกิจแล้ว หากก่อนหน้านี้ไม่มีความรู้สึกใด ๆ จากพวกเขา ตอนนี้พวกเขาทำให้ชีวิตของผู้ใช้ง่ายขึ้นจริง ๆ และทำลายกฎตายตัวที่ไม่สั่นคลอนก่อนหน้านี้ที่ว่าคอมพิวเตอร์เป็นเพียงกล่องเหล็กที่บดตัวเลข และแน่นอน ความจริงที่น่ายินดีที่สุดคือโอกาสที่จะได้สัมผัสกับความก้าวหน้าทางเทคโนโลยีของศตวรรษที่ 21 ซึ่งนักเขียนนิยายวิทยาศาสตร์หลายคนเขียนเกี่ยวกับเรื่องนี้อยู่บ่อยๆ ในตอนนี้ เข้าร่วมเดี๋ยวนี้!