ゲートニュース 4月27日 — Google DeepMindのシニア・プロダクトマネージャーであり、Google AI Studioのプロダクトリードでもあるローガン・キルパトリックは、Xで、AIベースのプロダクトを構築するすべての企業は、AIモデルの性能を測るために自社のカスタムベンチマークを確立すべきだと述べた。彼はこれを、モデルの改善が「自社に不釣り合いなほど大きな利益をもたらす」ための方法だと説明し、創業者やビジネスリーダーに「明日から始めるよう」促した。彼はこれを
ゲートニュース速報、4月27日—サムスングループのITサービス部門であるSamsung SDSは、OpenAIのChatGPT Eduを販売する権利を確保したと発表した。同社は韓国放送通信大学(National Korea Broadcasting and Communications University)と、約90,000人の学生を対象にした実証実験を実施しており、
Mollick は、公開された手法とデータだけで、AI agent が元の論文やコードがない状況でも複雑な研究を再現できると指摘している。再現が原論文と一致しない場合は、多くの場合 AI ではなく、論文自体のデータ処理の誤り、または結論の過度な解釈によるものだという。Claude はまず論文を再現し、その後 GPT‑5 Pro によるクロス検証を行い、多くは成功するが、データが大きすぎる場合や replication data の問題がある場合には阻まれることがある。この傾向は人力コストを大幅に下げ、再現が一般的に実行可能な検証となり得ることを示すとともに、査読やガバナンスの制度上の課題も提起しており、政府のガバナンスツール、あるいはそれに関連する事項が重要な論点となっている。