OpenAI最強モデルo3は「作弊」の疑いがあるとされ、特権を利用してテストの回答を事前に入手したのか、数学能力を偽造したのか?

最近、エポックのAI請負業者である「Meemi」という非営利団体が、ChatGPTの開発元であるOpenAIが、AI開発数学ベンチマークテストプラットフォーム「FrontierMath」を非公開で提供し、最新モデルのo3がテストで高得点を獲得できるように、FrontierMathテストの質問と回答を得る特権を持っているというニュースを投稿しました。 (あらすじ:ChatGPTをコントロールしたいですか? マスク氏は監察官に書簡を送り、OpenAI株の強制競売を要求した) (背景補足:OpenAIは、AI専門分野の学習精度を高めるために、Day2の新機能である「強化学習の微調整」を空に対してリリースしました) ChatGPTの開発元であるOpenAIは最近、モデル詐欺の噂を広め、テクノロジーコミュニティで幅広い議論を引き起こしています。 この事件は、Less Wrongフォーラムで「Meemi」という名前の非営利団体のEpochAI請負業者が暴露したことに端を発しています。 記事は、AI開発をテストするための数学テストプラットフォームであるFrontierMathがOpenAIから資金提供を受けているだけでなく、OpenAIの最新のo3モデルに「バックドアを開く」特権を持っていることを指摘しています。 続きを読む: OpenAI が o3 モデルを発表! 推論能力がレベルを押し上げ、次世代AIへの道を開く Meemiは、OpenAIがo3モデルをテストする前に質問と回答を得たと非難している Meemiは記事の中で、FrontierMath関連の提案や請負業者の多くがOpenAIの資金提供に気づいていなかったと述べている。 FrontierMathのために数学の問題を作成した数学者は、OpenAIからの資金提供について(積極的に)知らされていなかった。 請負業者は、Overleaf、Colab、または電子メールでトピックについて議論しないなど、トピックとその回答を機密に保ち、トピックの機密性を確保し、漏洩を防ぐためにNDA(機密保持プロトコル)に署名する必要があります。 さらに、請負業者は12月20日にOpenAIの資金調達について知らされていなかった。 署名された論文の著者でさえ、OpenAIの資金提供に気づいていない人もいると思います。 Meemi氏はさらに、OpenAIがテスト前にFrontierMathの質問と回答を持っていたことを示す間接的な情報源を持っていると付け加えた。 現在、Epoch AIまたはOpenAIは、OpenAIがこれらの質問、回答、またはソリューションにアクセスできるかどうかを公に示していません。 OpenAIがこれらの質問と回答を所有し、検証テストに使用していることを示唆する間接的な情報源があります。 Epoch AIとOpenAIに、このデータセットをトレーニングに使用するためのプロトコル制限があるかどうかはわかりませんが、そのようなプロトコルが存在しないことを示す兆候がいくつかあります。 FrontierMathとは何ですか? FrontierMathは、Epoch AIと、教授、IMO提案者、フィールズ賞受賞者など、世界中の60人以上の数学者が共同で立ち上げた新しい数学ベンチマークであると理解されています。 これらの数学的問題は、オルセーの難しさから今日の数学のフロンティアに至るまで、整数論や実数解析における計算集約的な問題から、代数幾何学や群論における抽象的な問題まで、現在の数学研究のすべての主要な分野を網羅しています。 Epoch AIの共同創業者が謝罪に名乗り出た コミュニティでの騒動の際、Epoch AIの共同創業者であるTamay Besiroglu氏も19日に謝罪のツイートをしており、次のように述べています。 私たちの契約は、O3モデルがリリースされるまで開示することを制限しています。 今にして思えば、もっと早くから透明性を高めるべきでした。 私たちはこのことを認識しており、将来的にはさらに改善します。 Besiroglu氏は自身のブログ記事で、OpenAIはFrontierMassにアクセスできるが、Epoch AIとの間には「口頭プロトコル」があり、AIモデルのトレーニングにFrontierMaxの問題セットを使用することはないと付け加えた。 さらに、Epoch AIには、FrontierMathベンチマークテストの結果を独自に検証するための追加の保証として、別の予約セットがあります。 OpenAIのFrontierMathへの関与をもっと早く開示しなかったという過ちを犯しました。 私たちの契約は、o3頃まで私たちを禁止しました。 今にして思えば、もっと早くに透明性を高めるべきでした。 私たちはこれを所有しており、より良くします。 — Tamay Besiroglu (@tamaybes) January 19, 2025 関連記事 アーサー・ヘイズ:トランプがBTCの準備金を積み上げるとは思わない、ポリマーケットの100日パスの確率は36%に低下 トランプはカードを報告した? Family Decentralized Finance Project WLFI last night ポジションを増やす 数千万ドル BTC、イーサリアム、AAVE、ONDO.. エルサルバドルは継続するために融資を受けたポジションを増やす 12BTC、IMFプロトコルで投げ捨てるな 〈OpenAI最強モデルo3「暴露された不正行為」 事前にテストの解答を得る特権を利用した疑い、数学的能力詐欺? 〉この記事は、BlockTempoの「Dynamic Zone-The Most Influential BlockChain News Media」に掲載されたものです。

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)