Mô hình mạnh nhất của OpenAI o3 'được tố cáo gian lận' với nghi vấn sử dụng đặc quyền để nhận trước đáp án kiểm tra, có gian lận về năng lực toán học không?

Gần đây, một tổ chức phi lợi nhuận có tên là "Meemi" trên diễn đàn Less Wrong đã tiết lộ rằng nhà phát triển sau ChatGPT là OpenAI đã tài trợ bí mật cho nền tảng kiểm tra toán học FrontierMath và có đặc quyền truy cập vào câu hỏi và đáp án của FrontierMath để giúp mô hình mới nhất của họ, o3, đạt điểm cao trong kiểm tra. (Trước đó: Muốn kiểm soát ChatGPT? Musk viết thư cho Thanh tra chính, yêu cầu bán cổ phần OpenAI bắt buộc) (Bổ sung thông tin: OpenAI giới thiệu tính năng tinh chỉnh học tăng cường mới trái ngược, nâng cao độ chính xác học tập chuyên sâu của AI) Gần đây, đã có thông tin về việc mô hình ChatGPT của OpenAI làm giả, gây tranh cãi rộng rãi trong cộng đồng công nghệ. Sự việc bắt nguồn từ bài viết của một nhà thầu thuộc tổ chức phi lợi nhuận có tên là "Meemi" trên diễn đàn Less Wrong. Bài viết cho biết, nền tảng kiểm tra toán học FrontierMath đã từng nhận được sự tài trợ từ OpenAI và FrontierMath đã có đặc quyền cho OpenAI để "mở cánh cửa sau" cho mô hình o3 mới nhất của họ. Đọc thêm: OpenAI ra mắt mô hình o3! Cường độ suy luận tiếp tục tăng cao, chuẩn bị cho thế hệ AI tiếp theo Meemi cáo buộc rằng OpenAI đã có câu hỏi và đáp án của FrontierMath trước khi kiểm tra o3. Trong bài viết, Meemi đã đề cập rằng nhiều nhà toán học và nhà thầu liên quan đến FrontierMath không biết về việc tài trợ của OpenAI: Các nhà toán học tạo ra các câu hỏi toán học cho FrontierMath không được (tự nguyện) thông báo về tài trợ từ OpenAI. Các nhà thầu được yêu cầu giữ bí mật về câu hỏi và đáp án, bao gồm cấm sử dụng Overleaf, Colab hoặc thảo luận câu hỏi qua email và ký NDA (giao thức bảo mật) để đảm bảo tính bí mật của câu hỏi và tránh rò rỉ thông tin. Ngoài ra, nhà thầu cũng không được thông báo về tài trợ của OpenAI vào ngày 20 tháng 12. Tôi tin rằng ngay cả những tác giả bài báo có ký tên cũng không biết về tài trợ của OpenAI. Meemi sau đó bổ sung rằng anh có nguồn tin gián tiếp cho thấy OpenAI thực sự có câu hỏi và đáp án của FrontierMath: Hiện tại, Epoch AI hoặc OpenAI chưa công khai xác nhận xem OpenAI có thể nhận được những câu hỏi, đáp án hoặc giải pháp này hay không. Tôi có nguồn tin gián tiếp cho thấy OpenAI thực sự có câu hỏi và đáp án này và sử dụng chúng để thực hiện kiểm tra xác minh. Tôi không biết liệu Epoch AI và OpenAI có giao thức hạn chế việc sử dụng tập dữ liệu này cho việc đào tạo không, nhưng có một số dấu hiệu cho thấy giao thức này không tồn tại. FrontierMath là gì? Theo thông tin, FrontierMath là một nền tảng toán học mới được Epoch AI phối hợp cùng hơn 60 nhà toán học trên toàn thế giới, bao gồm giáo sư, những người đề xuất bài toán IMO và những người đoạt giải Fields. Các vấn đề toán học này bao gồm từ độ khó của các cuộc thi đến các vấn đề trừu tượng trong toán học hiện đại, bao gồm tất cả các nhánh chính trong nghiên cứu toán học - từ các vấn đề tính toán phức tạp trong lý thuyết số và phân tích thực đến các vấn đề trừu tượng trong hình học đại số và lý thuyết nhóm. Người sáng lập chung của Epoch AI đã lên tiếng xin lỗi Trong lúc cộng đồng dậy sóng về vấn đề này, Tamay Besiroglu, người sáng lập chung của Epoch AI, cũng đã xin lỗi về sự việc này trong tweet ngày 19, ông nói: Chúng tôi đã mắc một sai lầm khi không tiết lộ sự tham gia của OpenAI trong FrontierMath sớm hơn. Hợp đồng của chúng tôi đã cấm chúng tôi tiết lộ cho đến khoảng thời gian o3 mới được phát hành. Nhìn lại, chúng tôi nên cố gắng nhiều hơn để mở rộng sự minh bạch từ trước. Chúng tôi chấp nhận điều này và sẽ cải thiện trong tương lai. Besiroglu cũng đã bổ sung trên blog rằng mặc dù OpenAI có quyền truy cập FrontierMath, nhưng giữa OpenAI và Epoch AI có một "giao thức miệng", không sử dụng bộ câu hỏi của FrontierMath để huấn luyện mô hình AI. Ngoài ra, Epoch AI cũng có một tập dữ liệu dự trữ riêng, như một biện pháp bảo vệ bổ sung, để độc lập xác minh kết quả kiểm tra của FrontierMath.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)