Sinh viên dùng trí tuệ nhân tạo để giải mã… chữ bác sĩ

10/02/2021 - 08:37

PNO - Một sinh viên của Đại học RMIT tại Việt Nam đã giúp giải quyết thách thức đang “ngáng đường” việc số hóa lượng lớn bệnh án tiếng Việt bằng cách giải mã chữ viết tay loằng ngoằng khó đọc của bác sĩ.

Do đặc thù công việc phải tiết kiệm thời gian để chữa bệnh, cứu người nên đa số bác sĩ đều có chữ viết rất khó đọc. Chữ viết tay của bác sĩ trên toa thuốc, bệnh án… thường "làm khó" bệnh nhân.

Sinh viên ngành Kỹ sư phần mềm Phùng Minh Tuấn phát triển thành công một tập hợp đầu cuối để nhận diện chữ viết trên bản quét bệnh án tiếng Việt. Phần mềm này giúp khắc phục tính phức tạp của chữ viết tay tiếng Việt.

Minh hoạ về cách vận hành kỹ thuật
Một minh họa về cách vận hành kỹ thuật để giải mã "chữ bác sĩ"

Nói về nguyên nhân đưa đến nghiên cứu “đọc vị” chữ bác sĩ, Tuấn chia sẻ: “Ban đầu, em nghĩ đến việc nghiên cứu trí tuệ nhân tạo (AI) trong lĩnh vực thời trang, nhưng sau quá trình nghiên cứu và tìm hiểu khi đi thực địa tại nhiều nơi, em đã quyết định nghiên cứu về hệ thống nhận diện chữ viết tay tiếng Việt của bác sĩ. Hơn nữa, mẹ của em cũng là bác sĩ. Khi làm việc với đơn vị Nghiên cứu lâm sàng Đại học Oxford, em cũng nhận ra việc lọc lại thông tin từ công nghệ này sẽ giúp đẩy nhanh quá trình nghiên cứu các bệnh lý sau này”.

Tuấn mất 3 tháng để định hướng đề tài và 3 tháng sau đó thực hiện. Em làm việc và nhận được sự hỗ trợ của Bệnh viện Bệnh nhiệt đới và đơn vị Nghiên cứu lâm sàng Đại học Oxford (OUCRU) tại TPHCM.

Cậu sinh viên năm cuối khoa Khoa học và Công nghệ Trường Đại học RMIT chia sẻ:  “Công nghệ nhận diện chữ viết đã tiến bộ rất nhiều nhưng hầu hết những phương pháp hiện có được phát triển để đọc tiếng Anh và hiện có rất ít hay gần như không có phần mềm riêng cho tiếng Việt”.

“Nhận diện chữ viết tay tiếng Việt về cơ bản thách thức hơn với tiếng Anh nhiều vì sự hiện diện của các lớp ký tự, âm điệu và dấu câu phức tạp”, Tuấn cho hay.

Cậu bạn mất hơn ba tháng với quy trình thử-sai-thử để tìm ra cách hiệu quả nhất có thể chuyển hình ảnh của một bệnh án giấy thành phiên bản điện tử.

“Chúng tôi giải quyết những thách thức này bằng cách đẩy mạnh các nhiệm vụ khác nhau trên tập hợp nhận diện chữ viết”, Tuấn nói.

Chương trình của Tuấn áp dụng quy trình giảm nhiễm, chia nhỏ chữ viết xuống cấp độ từ và áp dụng mô hình ngôn ngữ Bigram để tăng xác suất chỉnh sửa có thể cho những từ chung quanh. .

Tiến sĩ Đinh Ngọc Minh, giảng viên khoa Khoa học và Công nghệ Đại học RMIT nhận định: Điều này có thể đóng vai trò thiết yếu hỗ trợ công cuộc số hóa các cơ sở y tế và bệnh viện ở Việt Nam, giúp họ sẵn sàng hơn trong việc chuyển sang sử dụng hệ thống quản lý bệnh án điện tử hiện đại.

“Công trình có thể đẩy mạnh quy trình số hóa hệ thống bệnh án. Với sự trợ giúp của máy móc trong xử lý toàn bộ bệnh án, các cơ sở y tế có thể dần chuyển sang hệ thống điện tử mà không phải thay đổi quy trình đột ngột”, TS Minh cho hay.

Theo TS Minh, hệ thống như vậy sẽ còn cho phép các cơ sở y tế ở vùng hẻo lánh hay cán bộ y tế không có điều kiện tiếp cận máy tính tiếp tục với hệ thống giấy tờ hiện tại và có thể số hóa dễ dàng sau đó.

Sinh viên ngành Kỹ sư phần mềm Phùng Minh Tuấn phát triển thành công một cấu trúc đầu cuối để nhận diện chữ viết từ các bản quét bệnh án tiếng Việt.
Sinh viên ngành Kỹ sư phần mềm Phùng Minh Tuấn phát triển thành công một cấu trúc đầu cuối để nhận diện chữ viết từ các bản quét bệnh án tiếng Việt

Tiến sĩ Minh tin rằng việc có thể chia sẻ bệnh án của bệnh nhân dễ dàng giữa các phòng ban sẽ giúp giảm bớt những xét nghiệm không cần thiết và tối ưu hóa điều trị, dần cải thiện chất lượng chăm sóc y tế.

“Và quan trọng nhất là công trình có thể tạo nên bộ dữ liệu ghi chép y khoa số hóa cho các giải pháp học máy y khoa tiềm năng khác nhau”, ông nói.

Theo "bật mí" của Tuấn thì các bên phối hợp cùng là Bệnh viện Bệnh nhiệt đới và OUCRU dự kiến dùng dữ liệu tạo ra được để phát triển hệ thống chuyên gia chẩn đoán, cải tiến quy trình điều trị và giảm thiểu lỗi trong thực hành y khoa. Mở ra cánh cửa cho quy trình điều trị tốt hơn.

Thanh Thanh

 

news_is_not_ads=
TIN MỚI