Hệ thống nhận dạng giọng nói là khả năng của một thiết bị hoặc chương trình để nhận và hiểu chính tả hoặc hiểu hướng dẫn bằng giọng nói. Khi hệ thống này được sử dụng với máy tính, tín hiệu analog phải được chuyển đổi thành tín hiệu số bằng ADC.
Trong máy tính, cơ sở dữ liệu số, các âm tiết và từ vựng của các từ, âm tiết được yêu cầu để giải mã tín hiệu. Các dạng giọng nói được lưu trữ trên ổ cứng và được tải vào bộ nhớ khi chương trình được chạy. Các biểu mẫu được lưu trữ được máy tính kiểm tra dựa trên o/p của bộ chuyển đổi tương tự sang kỹ thuật số.
Tất cả các loại hệ thống nhận dạng giọng nói đều không tạo ra đầu ra chính xác. Bởi vì tiếng chó sủa, tiếng la hét của trẻ em và các âm thanh lớn bên ngoài có thể tạo ra i/p sai.
Những loại giọng nói này chỉ có thể được nhận dạng bằng cách sử dụng hệ thống nhận dạng giọng nói trong phòng yên tĩnh. Ngoài ra còn có một số vấn đề với một số từ tạo ra âm thanh tương tự như ở đây & nghe. Để khắc phục vấn đề này, hệ thống này yêu cầu bộ xử lý và RAM nhanh hơn có sẵn trong máy tính cá nhân.
Tuy nhiên, những hệ thống này hiện đã có sẵn trên thị trường và các hệ thống nhận dạng giọng nói dẫn đầu ngành là Dragon system và IBM.
Phụ lục bài viết
Hệ thống bảo mật nhận dạng giọng nói
Ý tưởng chính của dự án này là thiết kế một hệ thống bảo mật nhận dạng giọng nói. Dự án này chủ yếu được sử dụng cho mục đích bảo mật để xác định mật khẩu giọng nói được nói từ người được ủy quyền và hệ thống sẽ mở khi mật khẩu đúng. Hệ thống này sẽ được điều khiển bởi vi điều khiển PIC có thể được lập trình bằng ngôn ngữ hợp ngữ hoặc ngôn ngữ C.
Phân loại hệ thống nhận dạng giọng nói
Hệ thống nhận dạng giọng nói được phân thành bốn loại như VRS biệt lập, VRS liên tục, VRS phụ thuộc vào loa và VRS độc lập với loa.
- VRS bị cô lập yêu cầu chuyển qua ngắn gọn qua các từ được nói
- VRS liên tục không yêu cầu chuyển nhanh qua các từ được nói
- VRS phụ thuộc của người nói chỉ xác định giọng nói từ một người nói
- Diễn giả độc lập VRS xác định bài phát biểu của bất kỳ ai.
Thiết kế phần cứng của hệ thống bảo mật nhận dạng giọng nói
Dự án Hệ thống bảo mật nhận dạng giọng nói này được thiết kế với ba yếu tố chính như mạch micrô, vi điều khiển và màn hình LCD. Việc thiết kế dự án hệ thống bảo mật nhận dạng giọng nói này rất dễ dàng. Mạch micrô được kết nối với mạch tương tự sang kỹ thuật số của vi điều khiển PIC.
Từ được số hóa được chuyển qua các bộ lọc kỹ thuật số. Quá trình cú được thực hiện trên vi điều khiển, sau khi quá trình hoàn tất, màn hình LCD được kết nối với vi điều khiển để hiển thị lời nói có khớp với mật khẩu cài sẵn hay không.
Micrô hoặc Mike
Micrô, đôi khi được ký hiệu là mic hoặc mike, là một cảm biến hoặc bộ chuyển đổi được sử dụng để chuyển đổi âm thanh thành tín hiệu điện. Các ứng dụng của micro chủ yếu liên quan đến máy ghi âm, radio, phát sóng TV, điện thoại.
Trong micro tụ điện hay còn gọi là micro tụ điện, màng loa đóng vai trò là một cực của tụ điện và độ rung thay đổi theo khoảng cách giữa hai cực. Để trích xuất âm thanh o/p từ đầu dò, có hai phương pháp được gọi là micrô tụ điện DC và HF hoặc RF.
Bộ vi điều khiển
MCU là một máy tính trên chip và có mức tiêu thụ điện năng thấp, khả năng tự cung cấp, tích hợp cao. Bộ vi điều khiển thường tích hợp các phần tử bổ sung như ROM để lưu trữ mã, bộ nhớ R/W để lưu trữ giao diện I/O dữ liệu và các thiết bị ngoại vi. MCU này tiêu thụ ít năng lượng hơn và nhìn chung nó có khả năng ngủ trong khi chờ đợi một sự kiện ngoại vi khác như khi nhấn nút để đánh thức chúng và làm lại điều gì đó.
Bộ vi điều khiển thường được sử dụng trong các thiết bị và sản phẩm được điều khiển tự động, như điều khiển từ xa, hệ thống điều khiển động cơ ô tô, dụng cụ điện, máy văn phòng, đồ chơi và thiết bị. Bằng cách giảm chi phí, kích thước và mức tiêu thụ điện năng so với các thiết bị I/O khác, bộ vi xử lý, bộ nhớ, bộ vi điều khiển giúp việc điều khiển nhiều quy trình bằng điện tử trở nên không tốn kém.
Máy tính bảng đơn-Atmega32
ATmega321644 là một máy tính nhỏ có Single-board dựa trên họ Atmel, chẳng hạn như bộ xử lý ATmega32 hoặc Atmel ATmega644 AVR. Bảng mạch này được thiết kế với sự hợp tác của Holger Bu, Ulrich Radig và Thomas Scherer với mục đích đầu tiên là điều khiển máy pha cà phê từ xa thông qua internet.
Máy tính bo mạch đơn này hỗ trợ RAM lên tới 2048 byte. Nó bao gồm một hệ điều hành nhúng được thiết kế đặc biệt. Mặc dù khá liên quan đến ECB-ATmega321644 và ECB-AT91, nhưng có các tính năng riêng biệt. Nó hoạt động trong phạm vi tiêu thụ năng lượng tối thiểu dưới 100mA.
Nó vẫn được sử dụng như một máy chủ web để theo dõi web cam, điều khiển từ xa dựa trên web. Tuy nhiên, lượng điện năng nhỏ, dung lượng của máy chủ web thấp và chủ yếu thiết bị hướng đến nhu cầu sử dụng ở cường độ thấp.
Màn hình LCD
Màn hình tinh thể lỏng (LCD) là màn hình phẳng và mỏng, được tạo thành từ các pixel đơn sắc được sắp xếp phía trước tấm phản xạ. Nó thường được sử dụng trong các thiết bị điện tử chạy bằng pin. Bởi vì nó bao gồm một lượng nhỏ sức mạnh.
Màn hình LCD được sử dụng trong dự án này là loại chữ và số hiển thị các ký tự chữ cái, ký hiệu và số từ bộ ký tự ASCII tiêu chuẩn. Loại màn hình này cũng hiển thị đồ họa có độ phân giải thấp.
Phát triển phần mềm
Multisim 2001
Công cụ Multisim 2001 được sử dụng để thiết kế một hệ thống và nó cung cấp một lượng lớn cơ sở dữ liệu, mục nhập sơ đồ, mô phỏng, thiết kế VHDL, tổng hợp FPGAICPLD, khả năng RF, Xử lý hậu kỳ, v.v.
Công cụ này cung cấp một giao diện đồ họa duy nhất và dễ sử dụng cho tất cả các thiết kế và cung cấp các chức năng nâng cao, nhưng bạn phải lấy thiết kế từ quá trình sản xuất. Bởi vì, chương trình tích hợp bố cục PCB, logic lập trình, chụp và mô phỏng sơ đồ.
- Nó hỗ trợ tất cả quá trình thiết kế mạch, bao gồm thiết kế được đưa vào công cụ phần mềm đang được sử dụng
- Xác minh hoạt động của mạch, việc này được thực hiện bằng cách sử dụng mô phỏng và phân tích.
- Sửa đổi thiết kế mạch, nếu hoạt động của mạch đáp ứng mong đợi.
Ví dụ: nếu nó được đặt trên bảng mạch in, bước tiếp theo là sử dụng chương trình bố trí PCB (sản phẩm Ultiboard của Electronic Workbench). Nếu nó được đặt trên PLD (thiết bị logic lập trình) hoặc CPLD hoặc FPGA thì bước tiếp theo là sử dụng công cụ tổng hợp có sẵn từ Electronics Workbench.
Đây là tất cả về hệ thống nhận dạng giọng nói và hoạt động của nó. Chúng tôi hy vọng bạn đã hiểu rõ hơn về khái niệm này. Hơn nữa, mọi thắc mắc liên quan đến chủ đề này hoặc mô-đun nhận dạng giọng nói, vui lòng đưa ra phản hồi của bạn bằng cách bình luận trong phần bình luận bên dưới.
Nếu bạn cần thiết bị đo điện chính hãng, uy tín
Lidinco là công ty cung cấp các loại thiết bị do điện uy tín nhập khẩu trực tiếp với giá cạnh tranh. Các sản phẩm đều được bảo hành theo chính sách hãng, tư vấn kỹ thuật tận tình.
Ngoài ra, Lidinco còn cung cấp các loại thiết bị phân tích, đo lường viễn thông, vật tư nhà máy, công nghiệp, thiết bị giáo dục, thiết bị SMT và các loại thiết bị chuyên dụng khác.
Công Ty TNHH Đầu Tư Phát Triển Cuộc Sống
Địa chỉ: 487 Cộng Hòa, Phường 15, Quận Tân Bình, TPHCM, Việt Nam
Điện thoại: 028 3977 8269 / 028 3601 6797
Di động: 0906 988 447
Email: sales@lidinco.com
Xem thêm: Biến tần: Các loại, sơ đồ mạch và ứng dụng của nó