日前,首届人工智能数学奥林匹克进步奖竞赛(AIMO Progress Prize)现已启动,这是由两位菲尔兹奖得主(Timothy Gowers蒂莫西·高尔斯、Terence Tao陶哲轩)及Po-Shen Loh(罗博深)、Dan Roberts(丹·罗伯茨)、Geoff Smith(杰夫·史密斯)担任顾问委员会,伦敦金融科技公司XTX Markets赞助的千万美元AI奥数奖(AI-MO Prize)的第一部分,用于奖励答对题库(公开和非公开题库各50道题,高中水平)开源开云平台 开云体育官方入口的AI“做题家”(代码需公开开源),奖金池$2²⁰=$1048576美金。
这项比赛的目标是创建一些算法和模型,可以解决以LaTeX格式编写的棘手的数学问题。广泛的参与将有助于提高AI模型的数学推理技能并推动前沿知识。注意,该比赛相当于与今年IMO(International Mathematical Olympiad国际奥数,第65届竞赛于2024年7月在英国巴斯市举办)同期进行的$500万大奖赛(The Grand Prize)之前的“开胃菜”。(参阅 )
若五支排名最高的队伍中的任何一支在公开和非公开测试集上都没有超过Gemma 7B的基准(3/50),则该队伍的奖金将除以4。
整体进步奖获得者应是在公开和非公开测试集上得分至少为47/50的最高排名团队。在五个最高排名的团队获得任何奖项后,总资金的剩余部分将授予整体进步奖得主,即奖金至少为2²⁰-(2¹⁷+2¹⁶+2¹⁵+2¹⁴+2¹³)=$794624美金。如果没有团队在本次比赛中获得整体进步奖,则总资金的剩余部分将转入下一次比赛,届时将同样用于奖金分配。
参赛作品必须通过笔记本电脑提交。为了在代码上传后激活“提交”按钮,必须满足以下条件:
个人参与者和团队可以使用自动化机器学习工具(“AMLT”)(例如,Google AutoML、H2O无人驾驶AI等)创建提交,前提是参赛者或团队确保他们拥有AMLT的适当许可,以便能够遵守竞争规则。团队只能使用开源且在2024年2月23日之前发布的AI模型和工具。例如,编程语言,如Python和Lean,以及具有公开可用权重的LLMs,如Llama或Gemma。
竞赛数据包括110个与AIME(American Invitational Mathematics Examination美国数学邀请赛,是介于美国数学竞赛AMC10、AMC12及美国数学奥林匹克竞赛USAMO之间的一个数学竞赛)风格相似的数学问题。所有问题都是纯文本的,并使用LaTeX中的数学符号,虽然有些问题可能涉及几何学,但在任何问题中都不使用图表。每个问题的答案都是一个非负整数,模型预测答案时,对答案数字取模1000,即提交0~999之间的数字。例如,如果你认为问题的答案是2034 ,那么你的预测应该是34。
其中公共测试集有50个问题,非公开测试集有50个问题,训练数据集有10个问题。
训练数据集可以在Kaggle查看和下载(公式为LaTeX格式,参见下列蓝字题目)
对正整数n进行“闪光”(sparkle)运算,即计算n的数字之和并取其阶乘,例如13的闪光是4! = 24。一个机器人从黑板上一个正整数开始,然后在接下来的每一秒,用它的“闪光”替换黑板上的数字。对于一些“特殊”数字,如果它们是第一个数字,那么最终出现的每个数字都会小于6。有多少这样的特殊数字,满足最多为36位数?
设k, l 0为参数。抛物线kx + l与直线相交于两点A和B。这些点之间的距离是6。求从原点分别到A点和B点的距离之和的平方。
设ABCD是一个单位正方形。设P为AB上的一点,满足AP = 1/20,设Q为AD上的一点,满足AQ = 1/24。线段DP和BQ将正方形分为四个区域。求最大区域与最小区域的面积比。
假设我们掷4个六面公平骰子,面分别标有1到6。设a/b为最高掷出5的概率,其中a和b是互质的正整数。求a + b。
从111到999的每个三位数被染成蓝色或黄色,使得任意两个(不必不同)黄色数字的和等于一个蓝色数字。黄色数字的最大可能个数是多少?