Tìm kiếm theo cụm từ
Chi tiết
Tên Applying Bottle Neck Feature for Vietnamese speech recognition
Lĩnh vực Tin học
Tác giả Nguyen Van Huy, Luong Chi Mai, Vui Tat Thang
Nhà xuất bản / Tạp chí Journal of Computer Science and Cybernetics Tập 29 Số 4 Năm 2013
Số hiệu ISSN/ISBN 1813-9663
Tóm tắt nội dung

Bài báo trình bày việc áp dụng Bottle Neck Feature (BNF) - một dạng đặc trưng của tín hiệu tiếng nói được trích chọn thông qua mạng neural (Neural Network) - cho nhận dạng tiếng nói tiếng Việt. Nghiên cứu sử dụng mạng Multilayer Perceptron (MLP) năm lớp với kích thước của lớp ẩn thứ nhất khác nhau để trích chọn đặc trưng BNF từ hai loại dữ liệu đầu vào là Perceptual Linear Prediction (PLP) và Mel Frequency Cepstral Coefficient (MFCC), nhằm đánh giá hiệu quả của mỗi loại đặc trưng sau khi được áp dụng BNF. Kết quả thử nghiệm chứng tỏ BNF hiệu quả với tiếng nói tiếng Việt, kết quả nhận dạng trên đặc trưng BNF tốt hơn so với hệ thống cơ sở (baseline system) trong khoảng từ 6% đến 7%, và đặc trưng MFCC cho kết quả tốt hơn PLP.