ĐÁNH GIÁ MỘT SỐ YẾU TỐ ẢNH HƯỞNG ĐẾN ĐỘ CHÍNH XÁC CỦA HỆ THỐNG NHẬN DẠNG TỪ KHOÁ TIẾNG VIỆT

120 lượt xem

Các tác giả

Từ khóa:

Nhận dạng từ khóa; Nhận dạng tiếng nói; Khoảng cách xa; Mạng nơ ron tích chập; Mạng nơ ron hồi quy.

Tóm tắt

Ngày nay, hệ thống nhận dạng từ khóa (KWS) đóng vai trò quan trọng trong các ứng dụng sử dụng tiếng nói như trong các hệ thống khai thác dữ liệu, định tuyến cuộc gọi, tổng đài chăm sóc khách hàng, điện thoại thông minh hay trong hệ thống nhà thông minh điều khiển bằng giọng nói… Với mục tiêu nghiên cứu một số yếu tố ảnh hưởng đến chất lượng của hệ thống nhận dạng từ khóa tiếng Việt, chúng tôi đã xây dựng các mô hình hệ thống sử dụng sự kết hợp của mạng nơ ron tích chập (CNN) và mạng nơ ron hồi quy (RNN, cụ thể là GRU) trong môi trường không có nhiễu và môi trường có nhiễu tại khoảng cách đặt micro đến người thu âm là 1m và 2m. Trong thử nghiệm với môi trường nhiễu, kết quả cho thấy, các mô hình được huấn luyện trong môi trường nhiễu hoạt động tốt hơn mô hình được huấn luyện trong môi trường sạch. Trong thử nghiệm về khoảng cách đặt micro đến người thu âm cho ta thấy, tại vị trí đặt micro là 1m và 2m không làm ảnh hưởng nhiều đến chất lượng của các hệ thống nhận dạng từ khóa tiếng Việt. Kết quả này là một cơ sở tham khảo cho việc xác định các vị trí đặt micro phù hợp trong bài toán xây dựng cơ sở dữ liệu tiếng nói tránh sự dư thừa về dữ liệu thu âm.

Tải xuống

Đã Xuất bản

12-06-2020

Cách trích dẫn

Xuan. “ĐÁNH GIÁ MỘT SỐ YẾU TỐ ẢNH HƯỞNG ĐẾN ĐỘ CHÍNH XÁC CỦA HỆ THỐNG NHẬN DẠNG TỪ KHOÁ TIẾNG VIỆT”. Tạp Chí Nghiên cứu Khoa học Và Công nghệ quân sự, số p.h 67, Tháng Sáu 2020, tr 33-43, https://online.jmst.info/index.php/jmst/article/view/204.

Số

Chuyên mục

Nghiên cứu khoa học