Thông tin chung
Tên đề tài (*) | Nghiên cứu sử dụng mạng Noron nhân tạo để nhận dạng ký tự |
Cơ quan chủ trì | Đại học Công nghệ thông tin và Truyền thông |
Cơ quan thực hiện | Đại học Công nghệ thông tin và Truyền thông |
Loại đề tài | Đề tài cấp cơ sở |
Lĩnh vực nghiên cứu | Tin học |
Chủ nhiệm(*) | Lê Anh Tú |
Ngày bắt đầu | 01/2012 |
Ngày kết thúc | 12/2012 |
Tổng quan
Mạng nơron nhân tạo (Artificial Neural Network: ANNs) là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con người với vô số các nơron được liên kết truyền thông với nhau qua mạng. Giống như con người, ANNs được học bởi kinh nghiệm, lưu những kinh nghiệm đó và sử dụng trong những tình huống phù hợp.
Trong kỹ thuật nhận dạng ký tự, các phương pháp ra quyết định trong nhận dạng truyền thống thường được cài đặt tĩnh trong chương trình, khi muốn bổ sung thêm các mẫu học mới phải thiết kế lại chương trình. Trong khi với mạng nơron, chỉ cần cung cấp một tập mẫu vào ra của dữ liệu mới cho pha huấn luyện là có thể bổ sung vào “bộ nhớ mạng” những kiểu dữ liệu mới mà không ảnh hưởng đến cấu trúc chương trình ban đầu.
Thực tế hiện nay thì bài toán nhận dạng ký tự quang (ký tự in) đã được thực hiện khá thành công và đã có nhiều sản phẩm thương mại trên thị trường. Ví dụ như phần mềm VnDOCR, VietOCR,… Tuy nhiên, việc nhận dạng chữ in bằng tay, chữ thảo bằng tay, vẫn còn là một đề tài của các nghiên cứu.
Giải pháp thường được sử dụng phổ biến cho bài toán nhận dạng ký tự này là sử dụng các kỹ thuật liên quan đến xử lý ảnh như: dãy điểm đặc trưng, phân tích đường biên, phân tích đường trơn, sơ đồ hình chiếu, đối sánh mẫu,… hoặc kết hợp sử dụng mạng noron truyền thẳng trong việc quyết định nhận dạng. Tuy nhiên, mang noron truyền thẳng lại có một nhược điểm cơ bản là không thể lưu lại các kết quả huấn luyện của tất cả các ký tự đồng thời. Do đó để thực hiện việc nhận dạng ta phải lưu lại kết quả huấn luyện của từng ký tự, điều này làm cho tốc độ xử lý của chương trình chậm hơn và đặc biệt không hiệu quả khi các mẫu ký tự đầu vào thực sự hết sức đa dạng.
Tính cấp thiết
Việc thực hiện thu nhận thông tin dạng ký tự có thể thực hiện theo 2 cách: thủ công và tự động hóa. Phương pháp thủ công mất nhiều thời gian, công sức, do vậy người ta mong muốn sử dụng phương pháp nhận dạng ký tự một cách tự động. Thông thường những ký tự này sẽ được ghi nhận lại dưới dạng hình ảnh (ảnh số) bằng các thiết bị chụp ảnh (ví dụ: biển số xe), quét ảnh (ví dụ: tài liệu in trên giấy, chữ viết tay,...). Bằng chương trình máy tính các ký tự này sẽ được nhận dạng một cách tự động từ các hình ảnh thu nhận được.
Thực tế cho thấy rằng nhận dạng ký tự là một bài toán quan trọng, cốt lõi của rất nhiều các ứng dụng trong thực tiễn như:
+ Số hóa tài liệu: lưu trữ văn bản, phân loại thư tín, thư viện,..
+ Nhận dạng biển số xe: trông giữ xe tự động, theo dõi an ninh,..
+ Nhận dạng chữ ký điện tử: sử dụng trong các giao dịch điện tử
+ Chấm thi trắc nghiệm, thống kê tự động các phiếu điều tra
+ Nhận dạng chữ viết: sử dụng trên các thiết bị cảm ứng
Do vậy, việc nghiên cứu một giải pháp nhận dạng ký tự tự động là thực sự cần thiết và có tính khả thi cao trong thực tiễn.
Mục tiêu
- Nghiên cứu trích chọn đặc trưng của ký tự và áp dụng mạng noron để nhận dạng ký tự. Kết quả nghiên cứu có thể tiếp tục phát triển thành một module lõi khi tiến hành giải quyết các bài toán ứng dụng thực tiễn như ở trên. Ngoài ra, giải pháp đưa ra cũng phấn đấu để đạt được một số kết quả nhất định đối với dạng chữ viết tay.
- Cài đặt chương trình máy tính minh họa
Nội dung
- Nghiên cứu lý thuyết mạng noron nhân tạo và khả năng ứng dụng nhận dạng ký tự
- Nghiên cứu kỹ thuật tiền xử lý và trích chọn đặc trưng của ký tự
- Thiết kế mô hình mạng noron nhân tạo để nhận dạng ký tự
- Cài đặt phần mềm minh họa
- Viết 1 bài báo (hoặc tổ chức 1 seminar) tổng hợp các nội dung đã thực hiện của đề tài
- Viết báo cáo tổng hợp
Tải file Nghiên cứu sử dụng mạng Noron nhân tạo để nhận dạng ký tự tại đây
PP nghiên cứu
- Sử dụng các mẫu ký tự in và một số ký tự viết tay dưới dạng ảnh số
- Tiến hành một số kỹ thuật tiền xử lý đối với các ảnh ký tự
- Trích chọn các đặc trưng của ký tự, tạo thành tập dữ liệu đầu vào cho mạng noron
- Dự kiến sử dụng mô hình mạng noron phân cụm SOM với số đầu vào chính là số các đặc trưng đã trích chọn.
- Cài đặt chương trình minh họa
Hiệu quả KTXH
ĐV sử dụng
Trường Đại học CNTT và Truyền thông, xã Quyết Thắng, Thành Phố Thái Nguyên.
BÌNH LUẬN BẠN ĐỌC(0)