ChatGPT vượt qua bài kiểm tra năng lực hành nghề y của Mỹ

13/02/2023 - 18:14

PNO - Trong một nghiên cứu gần đây, ChatGPT đã vượt qua kỳ thi “tiêu chuẩn vàng” bắt buộc để đủ điều kiện hành nghề y ở Hoa Kỳ, trong bối cảnh có sự lo ngại ngày càng tăng về viễn cảnh AI có thể khiến con người mất việc.

 

ChatGPT, một hệ thống trí tuệ nhân tạo (AI) mới, đã đạt hoặc gần đạt điểm đủ ngưỡng đậu trong Kỳ thi Cấp phép Y tế Hoa Kỳ (USMLE) bắt buộc để hành nghề y tại Mỹ – Ảnh: Shutterstock
ChatGPT, một hệ thống trí tuệ nhân tạo (AI) mới, đã đạt hoặc gần đạt điểm đủ ngưỡng đậu trong Kỳ thi cấp phép y tế Hoa Kỳ (USMLE) bắt buộc để hành nghề y tại Mỹ – Ảnh: Shutterstock

Công ty công nghệ Ansible Health cho biết, Chương trình trí tuệ nhân tạo (Artificial Intelligence – AI) ChatGPT đã đạt điểm từ 52,4 đến 75% trong Kỳ thi Cấp phép Y tế (USMLE) gồm 3 phần. Ngưỡng trung bình để vượt qua kỳ kiểm tra mỗi năm là khoảng 60%.

Đại diện của nhóm chuyên gia thuộc Công ty Ansible Health, cũng là những người thực hiện nghiên cứu nói trên, cho biết: “Việc đạt được số điểm đậu cho kỳ thi chuyên ngành nổi tiếng khó khăn này, mà không cần bất kỳ sự hỗ trợ nào của con người, đánh dấu một cột mốc đáng nhớ trong quá trình trưởng thành của AI”.

Nghiên cứu này được công bố đúng thời điểm nhân lực của một số ngành nghề đối mặt nguy cơ cạnh tranh từ AI. Bản toàn văn của nghiên cứu hiện đã được bình duyệt và xuất bản trên tạp chí PLOS Digital Health.

Được phát triển bởi đội ngũ OpenAI, ChatGPT là một bot hoạt động dựa trên tương tác ngôn ngữ có thể tạo ra các phản hồi giống như con người. Chương trình đã được đưa vào thử nghiệm và vượt qua các bài kiểm tra tại Trường Kinh doanh Wharton của Đại học Pennsylvania và trường luật của Đại học Minnesota.

Trong nghiên cứu mới nhất, nhóm chuyên gia của Ansible Health đã thử nghiệm ChatGPT trên 350 câu hỏi lấy từ bài kiểm tra USMLE, nội dung các câu hỏi được cập nhật đến tháng 6/2022. Có 2 bác sĩ đánh giá trực tiếp kết quả trên bài làm của ChatGPT, bác sĩ thứ 3 xem xét sự khác biệt giữa các đánh giá.

USMLE là bài kiểm tra đánh giá kiến thức của sinh viên y khoa và bác sĩ thực tập, nội dung sát hạch trên hầu hết các lĩnh vực y tế, đã được áp dụng từ năm 1992. Kỳ thi thứ nhất của USMLE thường được thực hiện vào cuối năm thứ 2 của sinh viên trường y, kỳ thứ 2 được thực hiện vào năm thứ 4 và kỳ thứ 3 được thực hiện sau khi sinh viên tốt nghiệp và bước vào năm nội trú đầu tiên. Hơn 100.000 sinh viên và nghiên cứu sinh ngành y tế ở Mỹ phải dự thi hàng năm.

ChatGPT thậm chí còn tạo ra “ít nhất một chi tiết quan trọng” mới, không hiển nhiên và có ý nghĩa y tế trong 88,9% phản hồi khi làm kiểm tra.

Theo nhóm nghiên cứu của Ansible Health, thành tích của ChatGPT vượt qua cả hiệu suất của PubMedGPT, một mô hình AI được thiết kế riêng về lĩnh vực y sinh, chỉ đạt 50,8% trên bộ dữ liệu cũ hơn khi trả lời các câu hỏi kiểu USMLE.

Các tác giả của nghiên cứu cho rằng những phát hiện này chứng minh ChatGPT có thể trở thành một công cụ có giá trị trong giáo dục y tế. Nhóm nghiên cứu cho biết, AI bot “sở hữu một phần khả năng dạy y học bằng cách đưa ra những khái niệm mới lạ và không hiển nhiên, có thể nằm ngoài phạm vi nhận thức của người học”. 

Nhóm chuyên gia cho biết thêm: “AI hiện được định vị sẽ sớm trở nên phổ biến trong thực hành y tế lâm sàng, với các ứng dụng đa dạng trên tất cả các lĩnh vực chăm sóc sức khỏe”.

Các bác sĩ của Ansible Health đã bắt đầu thử nghiệm sử dụng ChatGPT như một phần trong quy trình làm việc của họ để viết lại các báo cáo nặng về từ ngữ chuyên ngành. Ngay cả nhóm nghiên cứu cũng sử dụng ChatGPT để viết lại những phát hiện của họ.

Tiến sĩ Tiffany Kung, tác giả của nghiên cứu, cho biết: “ChatGPT đã đóng góp đáng kể vào quá trình viết bản thảo. Chúng tôi đã tương tác với ChatGPT giống như một đồng nghiệp, yêu cầu ChatGPT tổng hợp, đơn giản hóa và đề xuất điểm đối lập cho các bản nháp đang thực hiện... Tất cả các đồng tác giả đều đánh giá cao ý kiến đóng góp của ChatGPT”.

Tuy nhiên, một số chuyên gia nhấn mạnh những hạn chế đối với kết quả nghiên cứu và việc sử dụng AI. Giáo sư Nello Cristianini chuyên về AI tại Đại học Bath, cho biết: “Điều này không gợi ý rằng ChatGPT có bất kỳ kiến thức nào có thể so sánh được với con người”.

Ngay cả nhóm OpenAI cũng thừa nhận xu hướng phản hồi của công cụ này bằng “các câu trả lời nghe có vẻ hợp lý nhưng không chính xác hoặc vô nghĩa”, một vấn đề vẫn khó khắc phục. Công nghệ AI cũng có thể duy trì những thành kiến xã hội như những thành kiến về chủng tộc, giới tính và văn hóa.

Những “ông lớn” công nghệ, bao gồm cả Google và Amazon, trước đây đã thừa nhận rằng một số dự án thử nghiệm AI của họ là “xúc xắc về mặt đạo đức” và có những hạn chế, đôi khi buộc con người phải can thiệp và giải quyết.

Tuy nhiên, tiến sĩ Stuart Armstrong, đồng sáng lập và trưởng nhóm nghiên cứu tại Aligned AI, cho biết: “Đây là một màn trình diễn ấn tượng và chúng ta nên kỳ vọng sẽ thấy nhiều thành công như vậy hơn nữa về AI trong tương lai”.

Hiệu trưởng Andrew Karolyi của Trường Kinh doanh SC Johnson tại Đại học Cornell cho hay: “Một điều mà tất cả chúng ta đều biết chắc chắn là ChatGPT sẽ không biến mất. Thậm chí, AI này sẽ ngày càng được hoàn thiện. Những lãnh đạo cấp khoa và cấp trường tại các cơ sở giáo dục đại học cần đầu tư vào lĩnh vực này để giáo dục chính họ”.

Trường An (theo Daily Mail) 

 

news_is_not_ads=
TIN MỚI