Tìm video bằng giọng nói

14/03/2011 19:22 GMT+7

Nhóm nghiên cứu thuộc phòng thí nghiệm AILab, trường ĐH Khoa học tự nhiên (ĐH Quốc gia TP.HCM) vừa phát triển và đưa vào thử nghiệm hệ thống truy vấn video bằng giọng nói.

Theo đó, từ khóa tìm kiếm sẽ được người dùng đưa vào máy tính bằng giọng nói, thay vì sử dụng bàn phím thông thường. Tín hiệu tiếng nói sau đó sẽ được hệ thống tự động nhận dạng rồi chuyển sang dạng văn bản để thực hiện truy vấn. Với bộ từ vựng nhỏ, 100 từ, độ chính xác của hệ thống đạt trên 90% và hầu hết đều thỏa mãn yêu cầu truy vấn của người dùng.

Trong giai đoạn nghiên cứu, nhóm tác giả đã chọn thực nghiệm truy vấn thông tin trên các đoạn clip bóng đá. Các video clip bóng đá ban đầu được tách ra theo kênh hình ảnh và âm thanh riêng. Kênh âm thanh với nội dung chủ yếu là lời của các bình luận viên sẽ được hệ thống nhận dạng và chuyển thành văn bản tương ứng. Các đoạn văn bản này sẽ được sử dụng để lập chỉ mục cho công đoạn tìm kiếm sau đó. Trong đề tài này, nhóm đã thực hiện thao tác nhận dạng và lập chỉ mục trên toàn bộ dữ liệu video của giải bóng đá AFF Cup năm 2008, giải đấu mà tuyển Việt Nam vô địch. Ứng dụng này nếu mở rộng có thể hỗ trợ đắc lực cho công tác dựng phim, truy xuất tư liệu của các đài truyền hình và nhiều lĩnh vực khác khi giảm phụ thuộc vào bàn phím, đặc biệt khi dùng các thiết bị di động.

Đây là một phần trong kết quả của đề tài cấp nhà nước do nhóm các nhà khoa học thuộc trường ĐH Khoa học tự nhiên và trường ĐH Bách khoa TP.HCM phối hợp thực hiện vừa được hội đồng nghiệm thu đánh giá cao. Người dùng có thể thử nghiệm hệ thống qua website: www.ailab.hcmus.edu.vn với yêu cầu máy tính phải cài đặt phần mềm Java và có sẵn microphone.

T.P

Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.