Tuy nhiên, chính năng lực tạo lập văn bản trôi chảy đã khiến vấn đề liêm chính học thuật trở nên phức tạp hơn. Trước đây, các rủi ro thường được nhận diện thông qua sự trùng lặp văn bản, cách trích dẫn không phù hợp hoặc sao chép từ nguồn đã công bố. Hiện nay, một văn bản có thể không giống đáng kể với bất kỳ nguồn nào, nhưng vẫn được tạo ra phần lớn bởi công cụ; một đoạn tóm tắt có thể đúng ngữ pháp, giàu thuật ngữ chuyên ngành và có vẻ phù hợp với văn phong khoa học, nhưng vẫn chưa phản ánh đầy đủ lao động trí tuệ, năng lực phân tích và trách nhiệm học thuật của người đứng tên.
Theo Dwivedi và cộng sự (2023), các công cụ đối thoại tạo sinh mở ra nhiều khả năng cho nghiên cứu, thực hành và hoạch định chính sách, nhưng đồng thời đặt ra những vấn đề nghiêm trọng về tính minh bạch, đạo đức sử dụng và trách nhiệm của con người đối với sản phẩm cuối cùng. Stokel-Walker và Van Noorden (2023) cũng nhấn mạnh rằng ChatGPT và trí tuệ nhân tạo tạo sinh đang buộc cộng đồng khoa học phải xem xét lại chuẩn mực công bố, đặc biệt trong bối cảnh văn bản do công cụ hỗ trợ có thể thuyết phục về hình thức nhưng chưa chắc đáng tin cậy về nội dung. Những cảnh báo này đặc biệt đáng chú ý trong các lĩnh vực khoa học sức khỏe, nơi một văn bản thiếu kiểm chứng có thể làm ảnh hưởng đến chất lượng tri thức chuyên môn và niềm tin của cộng đồng học thuật.
Trong bối cảnh đó, câu hỏi trung tâm không còn chỉ là “văn bản có bị trùng lặp hay không”, mà là “văn bản được tạo lập như thế nào, có được khai báo minh bạch hay không, thông tin đã được kiểm chứng ra sao và ai chịu trách nhiệm cuối cùng về nội dung khoa học”. Đây là sự dịch chuyển quan trọng trong cách hiểu về liêm chính học thuật: từ kiểm tra bề mặt văn bản sang quản trị toàn bộ quá trình tạo lập tri thức.
Khi giảng viên trẻ khó nhận diện tóm tắt do ChatGPT tạo ra
Kết quả cho thấy việc phân biệt tóm tắt do con người viết với tóm tắt do ChatGPT tạo ra không hề đơn giản. Độ chính xác của các giảng viên trẻ dao động từ 44% đến 76%; số trường hợp nhận diện sai khác nhau giữa từng người, từ 6 đến 14 tóm tắt. Điều đáng lưu ý là nhóm giảng viên trẻ thuộc đại học định hướng nghiên cứu không thể hiện ưu thế rõ ràng so với nhóm thuộc đại học không định hướng nghiên cứu. Cả hai nhóm đều có những kết quả chưa ổn định, cho thấy loại hình cơ sở giáo dục không phải yếu tố duy nhất quyết định năng lực nhận diện văn bản do công cụ tạo sinh hỗ trợ.
Phát hiện này có ý nghĩa quan trọng đối với giáo dục đại học. Trong hình dung thông thường, giảng viên tại các đại học định hướng nghiên cứu có thể được kỳ vọng có nhiều cơ hội tiếp xúc hơn với viết học thuật, phản biện bản thảo, công bố quốc tế và đánh giá chất lượng văn bản khoa học. Tuy nhiên, dữ liệu của Al-Rawas và cộng sự (2026) cho thấy ở giai đoạn đầu sự nghiệp, sự khác biệt cá nhân về kinh nghiệm đọc, viết, phản biện, khả năng kiểm chứng và mức độ hiểu biết về công cụ tạo sinh có thể quan trọng hơn bối cảnh tổ chức. Nói cách khác, môi trường nghiên cứu thuận lợi là điều kiện cần, nhưng chưa đủ để bảo đảm năng lực nhận diện văn bản do trí tuệ nhân tạo hỗ trợ.
Kết quả này tương thích với các công bố trước đó. Gao và cộng sự (2023) từng so sánh tóm tắt khoa học do ChatGPT tạo ra với tóm tắt thật và nhận thấy cả người đánh giá lẫn công cụ phát hiện đều có thể gặp khó khăn trong quá trình phân loại. Else (2023) ghi nhận hiện tượng tóm tắt do ChatGPT viết có thể khiến nhà khoa học khó phân biệt với tóm tắt do con người viết. Trong lĩnh vực giáo dục, Fleckenstein và cộng sự (2024) cũng cho thấy giáo viên không phải lúc nào cũng nhận diện chính xác văn bản do trí tuệ nhân tạo tạo ra trong bài viết của người học. Những kết quả đó cùng củng cố một nhận định: kinh nghiệm đọc văn bản học thuật theo cách truyền thống chưa đủ để xử lý những sản phẩm ngôn ngữ do công cụ tạo sinh hiện đại tạo ra.
Chất lượng hình thức không còn là bằng chứng chắc chắn của tính nguyên bản
Điều này cho thấy văn bản do ChatGPT tạo ra có thể đạt mức hoàn chỉnh hình thức đủ để vượt qua ấn tượng ban đầu của người đọc. Một tóm tắt có cấu trúc hợp lý, câu văn trôi chảy, thuật ngữ tương đối phù hợp và ngữ pháp chuẩn không còn là bằng chứng chắc chắn cho tính nguyên bản. Khi công cụ tạo sinh có thể tái tạo các mô thức quen thuộc của văn bản khoa học, người đánh giá dễ bị thuyết phục bởi bề mặt ngôn ngữ nếu không kiểm tra kỹ sự nhất quán giữa mục tiêu, phương pháp, kết quả, dữ liệu và tài liệu tham khảo.
Vấn đề cốt lõi là văn bản khoa học không chỉ cần mạch lạc về diễn đạt, mà còn phải trung thực về nguồn gốc tri thức. Một tóm tắt khoa học có giá trị không chỉ vì nó trình bày đầy đủ mục tiêu, phương pháp, kết quả và hàm ý; nó còn phải phản ánh sự hiểu biết thật sự của người viết đối với vấn đề được trình bày. Khi công cụ tạo sinh có thể tạo ra một bản tóm tắt có vẻ hợp lý mà không cần trực tiếp tham gia vào quá trình thu thập dữ liệu, phân tích kết quả hay kiểm chứng tài liệu, việc đánh giá học thuật buộc phải chuyển từ cảm nhận ngôn ngữ sang kiểm tra nội dung.
Đây cũng là điểm làm cho thách thức hiện nay khác biệt so với đạo văn theo nghĩa truyền thống. Một văn bản sao chép thường để lại dấu vết qua sự tương đồng với nguồn có sẵn. Trong khi đó, văn bản do công cụ tạo sinh hỗ trợ có thể có mức tương đồng thấp nhưng vẫn đặt ra câu hỏi về minh bạch, quyền tác giả và trách nhiệm khoa học. Vì vậy, các phần mềm kiểm tra trùng lặp tuy vẫn cần thiết, nhưng không còn đủ để bảo vệ liêm chính học thuật trong môi trường viết có sự tham gia của trí tuệ nhân tạo.
Công cụ phát hiện: cần thiết, nhưng không thể thay thế con người
Những con số trên cho thấy công cụ phát hiện có thể hỗ trợ đáng kể cho quá trình kiểm tra học thuật, nhưng không nên được xem là phán quyết cuối cùng. Các phần mềm phát hiện văn bản do trí tuệ nhân tạo tạo ra thường vận hành dựa trên xác suất, đặc điểm thống kê của ngôn ngữ, dữ liệu huấn luyện và ngưỡng phân loại riêng. Hiệu quả của chúng có thể thay đổi theo lĩnh vực chuyên môn, độ dài văn bản, phong cách viết, phiên bản công cụ tạo sinh và ngôn ngữ sử dụng. Perkins và cộng sự (2024) nhấn mạnh rằng trong giáo dục đại học, việc nhận diện văn bản do công cụ tạo sinh hỗ trợ cần kết hợp giữa đánh giá học thuật và phần mềm, thay vì giao toàn bộ quyền kết luận cho công nghệ.
Vì vậy, cách tiếp cận phù hợp không phải là tìm kiếm một công cụ duy nhất có khả năng giải quyết mọi trường hợp, mà là thiết kế một quy trình kiểm chứng nhiều tầng. Quy trình đó cần bao gồm khai báo của tác giả về việc sử dụng công cụ tạo sinh, kiểm tra tương đồng văn bản, sử dụng công cụ phát hiện như một nguồn tham chiếu, rà soát nội dung bởi người có chuyên môn, đối chiếu tài liệu tham khảo và yêu cầu giải trình khi có nghi vấn. Cách làm này vừa bảo đảm sự thận trọng cần thiết, vừa tránh nguy cơ kết luận thiếu căn cứ nếu chỉ dựa vào kết quả phần mềm.
Đối với các tạp chí khoa học, điều này đặc biệt quan trọng. Một kết quả do phần mềm đưa ra không nên được dùng như căn cứ duy nhất để từ chối bản thảo. Thay vào đó, kết quả ấy cần được đặt trong bối cảnh rộng hơn: năng lực ngôn ngữ của tác giả, mức độ chỉnh sửa học thuật, sự nhất quán giữa các phần của bài viết, tính xác thực của trích dẫn, khả năng cung cấp dữ liệu và giải thích quy trình nghiên cứu. Liêm chính học thuật chỉ có thể được bảo vệ bằng sự kết hợp giữa công nghệ, chuyên môn và trách nhiệm biên tập.
Minh bạch học thuật và trách nhiệm tác giả trong xuất bản khoa học
Vấn đề vì thế không phải là phủ nhận hoàn toàn giá trị hỗ trợ của công cụ tạo sinh. Trong nhiều trường hợp, công cụ có thể giúp người viết cải thiện diễn đạt, rà soát ngữ pháp, tổ chức bản nháp hoặc hỗ trợ người không sử dụng tiếng Anh như ngôn ngữ thứ nhất trình bày ý tưởng rõ ràng hơn. Tuy nhiên, việc sử dụng đó phải được đặt trong nguyên tắc minh bạch, kiểm chứng và trách nhiệm. Người viết cần khai báo phạm vi sử dụng, kiểm tra lại thông tin, xác minh tài liệu tham khảo, bảo đảm dữ liệu và kết luận không bị thay thế bởi các đề xuất chưa được kiểm chứng của công cụ.
Từ góc độ đào tạo, năng lực sử dụng trí tuệ nhân tạo trong học thuật không nên được hiểu giản đơn là biết cách đặt yêu cầu cho công cụ. Năng lực này bao gồm khả năng hiểu giới hạn của công cụ, nhận diện rủi ro về trích dẫn không có thật, kiểm chứng thông tin, phân biệt hỗ trợ ngôn ngữ với tạo lập nội dung khoa học, tuân thủ quy định của tạp chí hoặc cơ sở đào tạo và chịu trách nhiệm về sản phẩm cuối cùng. Với giảng viên trẻ, đây cần được xem là một phần của năng lực nghiên cứu và năng lực công bố trong môi trường học thuật số.
Trên cơ sở đó, các cơ sở giáo dục đại học cần sớm ban hành quy định riêng về sử dụng công cụ tạo sinh trong hoạt động học thuật. Quy định này không nên chỉ dừng ở các khuyến cáo chung, mà cần phân biệt rõ các tình huống sử dụng: hỗ trợ diễn đạt, chỉnh sửa ngôn ngữ, tóm lược tài liệu, gợi ý cấu trúc, tạo bản nháp, phân tích dữ liệu, soạn đề cương, viết tổng quan hoặc chuẩn bị phản hồi học thuật. Với mỗi tình huống, nhà trường cần xác định phạm vi được chấp nhận, yêu cầu khai báo, trách nhiệm kiểm chứng và hình thức xử lý khi người học hoặc giảng viên sử dụng thiếu minh bạch.
Trong đào tạo sinh viên, học viên cao học và nghiên cứu sinh, liêm chính học thuật cần được mở rộng từ nội dung chống sao chép sang quản trị trách nhiệm học thuật trong môi trường có công cụ tạo sinh. Người học cần hiểu rằng văn bản có mức tương đồng thấp chưa đủ để chứng minh tính nguyên bản; tài liệu tham khảo do công cụ gợi ý phải được kiểm tra độc lập; dữ liệu, kết quả và kết luận khoa học không thể giao phó cho công cụ. Nội dung này nên được tích hợp vào các học phần phương pháp nghiên cứu, viết học thuật, đạo đức nghiên cứu và công bố khoa học, thay vì chỉ được phổ biến như một quy định hành chính.
Đối với đội ngũ giảng viên trẻ, các trường đại học cần tổ chức bồi dưỡng chuyên sâu về đánh giá văn bản học thuật trong bối cảnh trí tuệ nhân tạo tạo sinh. Nội dung bồi dưỡng cần tập trung vào kiểm chứng trích dẫn, nhận diện tài liệu tham khảo không có thật, đánh giá sự nhất quán giữa mục tiêu, phương pháp và kết quả, sử dụng công cụ phát hiện như nguồn tham khảo, thiết kế nhiệm vụ học tập hạn chế phụ thuộc vào công cụ, đồng thời hướng dẫn sinh viên khai báo việc sử dụng công nghệ một cách trung thực. Kết quả của Al-Rawas và cộng sự (2026) cho thấy ngay cả giảng viên trẻ có nền tảng học thuật vẫn có thể gặp khó khăn trong nhận diện văn bản do ChatGPT tạo ra; vì vậy, đào tạo đội ngũ không thể chỉ dừng ở kỹ năng sử dụng, mà phải hướng tới năng lực thẩm định và kiểm chứng.
Đối với các tạp chí khoa học trong nước, cần xây dựng chính sách minh bạch về việc sử dụng công cụ tạo sinh trong bản thảo. Tác giả nên được yêu cầu khai báo công cụ đã sử dụng, phiên bản, mục đích sử dụng và phạm vi can thiệp vào văn bản. Đồng thời, tạp chí cần khẳng định nguyên tắc: công cụ tạo sinh không được xem là tác giả; tác giả con người chịu trách nhiệm hoàn toàn về tính chính xác, tính nguyên bản, trích dẫn, dữ liệu và kết luận của bài viết. Chính sách này phù hợp với xu hướng quốc tế trong quản trị xuất bản học thuật và giúp bảo vệ uy tín của tạp chí trước những rủi ro ngày càng tinh vi của văn bản do công cụ tạo sinh hỗ trợ.
Ở phương diện quản lý, giáo dục đại học Việt Nam cần tránh hai thái cực: xem công cụ tạo sinh như nguy cơ phải loại trừ hoàn toàn, hoặc xem công cụ như giải pháp tự động nâng cao chất lượng học thuật. Cách tiếp cận phù hợp hơn là xây dựng văn hóa sử dụng có trách nhiệm, trong đó người học, giảng viên, nhà quản lý và tạp chí đều có quy định rõ ràng, được đào tạo thường xuyên và có cơ chế kiểm chứng công bằng. Công nghệ chỉ có giá trị giáo dục khi được đặt trong hệ chuẩn mực học thuật minh bạch, có căn cứ và đề cao trách nhiệm của con người.
Sự phát triển của ChatGPT không chỉ đặt ra một thách thức kỹ thuật trong việc nhận diện văn bản do công cụ tạo sinh hỗ trợ, mà còn buộc giáo dục đại học phải nhìn lại những chuẩn mực căn bản của hoạt động học thuật. Khi một tóm tắt do công cụ tạo ra có thể trở nên mạch lạc, đúng ngữ pháp và đủ sức thuyết phục người đọc, liêm chính học thuật không thể tiếp tục được bảo vệ chủ yếu bằng cảm nhận ngôn ngữ hoặc phần mềm kiểm tra trùng lặp. Điều cần được củng cố là năng lực kiểm chứng, nghĩa vụ khai báo, trách nhiệm tác giả và văn hóa đánh giá dựa trên bằng chứng.
Giá trị sâu xa của các bằng chứng thực nghiệm không phải là xác định công cụ nào phát hiện chính xác hơn, mà là nhắc nhở cộng đồng học thuật rằng văn bản khoa học chỉ thực sự có giá trị khi được tạo lập trong một quy trình trung thực, được kiểm chứng và có người chịu trách nhiệm. Trong kỷ nguyên trí tuệ nhân tạo, bảo vệ liêm chính học thuật không chỉ là bảo vệ văn bản khỏi sự sao chép, mà còn là bảo vệ quá trình hình thành tri thức khỏi sự thiếu minh bạch. Đây chính là nền tảng để giáo dục đại học duy trì phẩm giá học thuật, chất lượng công bố và niềm tin xã hội đối với khoa học.
Tài liệu tham khảo
Dwivedi, Y. K., et al. (2023). So, what if ChatGPT wrote it? Multidisciplinary perspectives on opportunities, challenges and implications of generative conversational artificial intelligence for research, practice and policy. International Journal of Information Management, 71, 102642. doi:10.1016/j.ijinfomgt.2023.102642.
Else, H. (2023). Abstracts written by ChatGPT fool scientists. Nature, 613(7944), 423. doi:10.1038/d41586-023-00001-9.
Fleckenstein, J., et al. (2024). Do teachers spot artificial intelligence? Evaluating the detectability of artificial intelligence-generated texts among student essays. Computers and Education: Artificial Intelligence, 6, 100209.
Gao, C. A., et al. (2023). Comparing scientific abstracts generated by ChatGPT to real abstracts with detectors and blinded human reviewers. NPJ Digital Medicine, 6, 75. doi:10.1038/s41746-023-00819-6.
Jakesch, M., Hancock, J. T., & Naaman, M. (2023). Human heuristics for artificial intelligence-generated language are flawed. Proceedings of the National Academy of Sciences, 120, e2208839120. doi:10.1073/pnas.2208839120.
Perkins, M., et al. (2024). Detection of GPT-4 generated text in higher education: Combining academic judgement and software to identify generative artificial intelligence tool misuse. Journal of Academic Ethics, 22, 89–113. doi:10.1007/s10805-023-09460-7.
Stokel-Walker, C., & Van Noorden, R. (2023). What ChatGPT and generative artificial intelligence mean for science. Nature, 614, 214–216. doi:10.1038/d41586-023-00340-6.
Thorp, H. H. (2023). ChatGPT is fun, but not an author. Science. doi:10.1126/science.adg7879.