ChatGPT dường như ở khắp mọi nơi. Morgan Stanley, Duolingo, Snapchat, Coca-Cola và Instacart đã ký hợp đồng, cũng như các lập trình viên, nhà thiết kế web, công ty dược phẩm, nhà văn, nhạc sĩ, dịch giả và doanh nghiệp...
Chỉ trong nửa năm, ChatGPT đã được sử dụng bởi hơn 100 triệu người dùng trên toàn cầu và nó xử lý hơn 10 triệu yêu cầu mỗi ngày. Thực tế, những câu chuyện được viết chi tiết về tiềm năng của nó từ mô hình kinh doanh đến thói quen cá nhân. Mọi người ai cũng muốn sở hữu nó để hỗ trợ công việc.
Nhưng một số người đang xoáy vào những nhược điểm của ChatGPT, ứng dụng phát triển nhanh nhất trong lịch sử. Đáng chú ý nhất là một lá thư vào tháng Ba, được ký bởi hơn 1.000 chuyên gia, kêu gọi lệnh cấm mở rộng công nghệ AI cho đến khi những rủi ro và nguy hiểm của nó được hiểu rõ hơn. Trong khi những người hoài nghi chủ yếu tập trung vào khả năng các tác nhân xấu thao túng AI cho các mục đích có hại hoặc đã tưởng tượng ra một kịch bản có thể xảy ra khi các mô hình AI tự quyết định hành động độc hại, thì những người khác lại đang tập trung vào một vấn đề trực tiếp hơn, đó là độ chính xác.
Tạp chí Phố Wall gần đây đã cảnh báo: "Chatbot AI và các chương trình AI tạo ra là tấm gương phản chiếu dữ liệu mà chúng tiêu thụ. Nó hồi sinh và phối lại những gì nó học được, điều này sẽ cho ra những kết quả tuyệt vời, và tất nhiên là cũng kèm theo những thất bại.
Nhóm nghiên cứu AI lấy con người làm trung tâm của Đại học Stanford đã xuất bản một bài báo trên máy chủ in sẵn arXiv vào tháng trước, và đặt câu hỏi về độ tin cậy của dữ liệu được truy xuất trong các truy xuất mô hình ngôn ngữ lớn. Nelson Liu, một nghiên cứu sinh tiến sĩ tại Stanford và là một trong những tác giả của báo cáo, cho biết: "Một đặc điểm tiên quyết của một công cụ tìm kiếm đáng tin cậy là khả năng kiểm chứng". Sau khi nghiên cứu đầu ra từ 4 công cụ tìm kiếm phổ biến, Liu và hai đồng nghiệp Tianyi Zhang và Percy Jiang đã báo cáo kết quả rằng "chúng hoạt động trôi chảy và xuất hiện nhiều thông tin, nhưng thường chứa các tuyên bố không được hỗ trợ và các trích dẫn không chính xác".
Các công cụ tìm kiếm mà họ nghiên cứu là Bing Chat, NeevaAI, perplexity.ai và YouChat. Các chủ đề bao gồm dữ liệu tiểu sử về ca sĩ Alicia Keys đến các vấn đề kiểm duyệt trên phương tiện truyền thông xã hội. Các nhà nghiên cứu đã xem xét bốn đặc điểm: sự trôi chảy, tiện ích nhận thức (tức câu trả lời hữu ích như thế nào), nhớ lại trích dẫn (tức cách các tuyên bố được tạo ra nhất quán được hỗ trợ đầy đủ bởi các trích dẫn) và độ chính xác trích dẫn (tỷ lệ trích dẫn được tạo ra hỗ trợ các tuyên bố liên quan).
Nhóm nghiên cứu nhận thấy các câu trả lời "thường có tính lưu loát cao và tiện ích nhận thức, nhưng thường chứa các tuyên bố không được hỗ trợ hoặc trích dẫn không chính xác". Chỉ có khoảng 1/2 số câu được tạo ra được hỗ trợ đầy đủ bởi các trích dẫn và 1/4 số trích dẫn không hỗ trợ các câu liên quan. Trong khi đó, Một công cụ tìm kiếm được cho là đáng tin cậy phải là một công cụ đạt được khả năng nhớ lại trích dẫn và độ chính xác cao. Kết quả thật đáng thất vọng.
Một bài báo trên ExtremeTech đã đề cập đến vấn đề tìm nguồn cung ứng: "Các chatbot như ChatGPT và Bing Chat rất giỏi trong việc làm cho thông tin giả mạo trở thành sự thật. Nếu không có trích dẫn, điều mà hầu hết các kết quả chatbot đều thiếu, thật sự rất khó để phân biệt giữa những thông tin chính xác và những thông tin giả mạo, đặc biệt là chỉ trong vài giây người dùng dành cho trang kết quả của công cụ tìm kiếm.
Các nhà nghiên cứu bày tỏ hy vọng rằng nghiên cứu của họ sẽ "thúc đẩy hơn nữa sự phát triển của các công cụ tìm kiếm đáng tin cậy và giúp các nhà nghiên cứu và người dùng hiểu rõ hơn về những thiếu sót của các hệ thống thương mại hiện có".
Chỉ trong nửa năm, ChatGPT đã được sử dụng bởi hơn 100 triệu người dùng trên toàn cầu và nó xử lý hơn 10 triệu yêu cầu mỗi ngày. Thực tế, những câu chuyện được viết chi tiết về tiềm năng của nó từ mô hình kinh doanh đến thói quen cá nhân. Mọi người ai cũng muốn sở hữu nó để hỗ trợ công việc.

Tạp chí Phố Wall gần đây đã cảnh báo: "Chatbot AI và các chương trình AI tạo ra là tấm gương phản chiếu dữ liệu mà chúng tiêu thụ. Nó hồi sinh và phối lại những gì nó học được, điều này sẽ cho ra những kết quả tuyệt vời, và tất nhiên là cũng kèm theo những thất bại.
Nhóm nghiên cứu AI lấy con người làm trung tâm của Đại học Stanford đã xuất bản một bài báo trên máy chủ in sẵn arXiv vào tháng trước, và đặt câu hỏi về độ tin cậy của dữ liệu được truy xuất trong các truy xuất mô hình ngôn ngữ lớn. Nelson Liu, một nghiên cứu sinh tiến sĩ tại Stanford và là một trong những tác giả của báo cáo, cho biết: "Một đặc điểm tiên quyết của một công cụ tìm kiếm đáng tin cậy là khả năng kiểm chứng". Sau khi nghiên cứu đầu ra từ 4 công cụ tìm kiếm phổ biến, Liu và hai đồng nghiệp Tianyi Zhang và Percy Jiang đã báo cáo kết quả rằng "chúng hoạt động trôi chảy và xuất hiện nhiều thông tin, nhưng thường chứa các tuyên bố không được hỗ trợ và các trích dẫn không chính xác".
Các công cụ tìm kiếm mà họ nghiên cứu là Bing Chat, NeevaAI, perplexity.ai và YouChat. Các chủ đề bao gồm dữ liệu tiểu sử về ca sĩ Alicia Keys đến các vấn đề kiểm duyệt trên phương tiện truyền thông xã hội. Các nhà nghiên cứu đã xem xét bốn đặc điểm: sự trôi chảy, tiện ích nhận thức (tức câu trả lời hữu ích như thế nào), nhớ lại trích dẫn (tức cách các tuyên bố được tạo ra nhất quán được hỗ trợ đầy đủ bởi các trích dẫn) và độ chính xác trích dẫn (tỷ lệ trích dẫn được tạo ra hỗ trợ các tuyên bố liên quan).
Nhóm nghiên cứu nhận thấy các câu trả lời "thường có tính lưu loát cao và tiện ích nhận thức, nhưng thường chứa các tuyên bố không được hỗ trợ hoặc trích dẫn không chính xác". Chỉ có khoảng 1/2 số câu được tạo ra được hỗ trợ đầy đủ bởi các trích dẫn và 1/4 số trích dẫn không hỗ trợ các câu liên quan. Trong khi đó, Một công cụ tìm kiếm được cho là đáng tin cậy phải là một công cụ đạt được khả năng nhớ lại trích dẫn và độ chính xác cao. Kết quả thật đáng thất vọng.
Một bài báo trên ExtremeTech đã đề cập đến vấn đề tìm nguồn cung ứng: "Các chatbot như ChatGPT và Bing Chat rất giỏi trong việc làm cho thông tin giả mạo trở thành sự thật. Nếu không có trích dẫn, điều mà hầu hết các kết quả chatbot đều thiếu, thật sự rất khó để phân biệt giữa những thông tin chính xác và những thông tin giả mạo, đặc biệt là chỉ trong vài giây người dùng dành cho trang kết quả của công cụ tìm kiếm.
Các nhà nghiên cứu bày tỏ hy vọng rằng nghiên cứu của họ sẽ "thúc đẩy hơn nữa sự phát triển của các công cụ tìm kiếm đáng tin cậy và giúp các nhà nghiên cứu và người dùng hiểu rõ hơn về những thiếu sót của các hệ thống thương mại hiện có".