2024 年对于人工智能来说将是具有里程碑意义的一年。随着新模型、融资轮次和进步的快速发展,要跟上人工智能世界中正在发生的一切是很困难的。让我们深入探讨 2024 年可能定义人工智能的关键事件、产品发布、研究突破和趋势。
2024 年第一季度将以一些主要模型的发布和改进拉开序幕,这些模型有望进一步推动人工智能功能。
我们预计谷歌最终将在第一季度推出 Gemini Ultra。由于宪法提示和自我监督等宪法人工智能技术,他们的新版本对话式人工智能助手可能会击败 GPT-4。虽然它可能无法在每个领域都击败 GPT-4,但 Gemini Ultra 的安全性和推理能力应该远远超出 OpenAI 在 GPT-3 和 GPT-3.5 上所展示的水平。
随着研究人员分享更多微调技术,我们还应该在 2024 年第一季度看到开源 AI 模型取得令人印象深刻的改进。针对推理任务和数学/逻辑问题进行微调的模型可能会在常识和避免虚假陈述等领域缩小与 GPT-3 等专有模型的差距。
到第一季度末,一些开源模型甚至可能在复杂的数学/逻辑推理基准上达到人类水平的性能(超过 75%)。当然,作弊风险仍然是基准测试的一个问题,但自然语言任务也应该显示出令人印象深刻的收益。
随着人工智能软件的快速发展,更多的资金将流入机器人等商业应用。我们应该会看到机器人初创公司至少有两轮数百万美元的融资,专注于将人工智能进步带入现实世界。仓库机器人、自动驾驶汽车,甚至家庭/办公室的通用辅助机器人都应该在 2024 年取得重大进展。
尽管 OpenAI 等组织宣布推出超过 100 万亿参数的巨型模型,但较小的开源模型在许多现实世界用例中将继续流行。公司发现,在利基数据集上微调的 10-200 亿个参数模型非常有用,同时保持训练和部署的经济性。公司发现,在利基数据集上微调的 10-200 亿个参数模型非常有用,同时保持训练和部署的经济性。
即使像 GPT-4 这样的超级模型占据了头条新闻,也要寻找这些“微型模型”来支持更多的交互式演示和基本的聊天机器人。初创公司会发现,与依赖 GPT-3 这样的单一模型相比,使用一组微模型更容易满足用户需求。
随着备受瞩目的模型发布、人工开云网址 kaiyun官方入口智能安全工作的大量资金以及对这些复杂模型实际工作原理的突破性研究,人工智能炒作周期将在 2024 年第二季度达到另一个高峰。
Meta 预计将于 2024 年第二季度发布 LLama 3,这是其大规模语言模型的第三个版本。LLama 3 应该能够在推理和为其输出提供证据等领域与 GPT-4 正面交锋。一些专家预测它在人类评估中甚至可能超越 GPT-4。
OpenAI 也不甘示弱,很可能会在 LLama 3 发布后不久推出 GPT-4.5。与 GPT-4 发布后的不稳定稳定期相比,GPT-4.5 有望变得更强大、更安全、更可靠。
Mistral 是一家人工智能初创公司,致力于公开构建下一代模型、数据集和培训基础设施,在爆炸性增长的背景下,该公司将在第二季度筹集一大笔资金。
米斯特拉尔开放生态系统的流行将迫使传统科技巨头重新思考他们的闭源文化。预计 2024 年将有更多大型语言模型和数据集免费向研究人员发布。
随着法学硕士变得更加先进(并且存在潜在危险),人工智能安全工作将在 2024 年第二季度加大力度。我们应该会看到一些基础论文的发表,这些论文破解了大型语言模型的黑匣子,并提高了我们对它们行为方式的理解。这将实现更安全的模型架构和训练实践。
全球还将齐心协力收集培训数据,专门旨在让法学硕士受益。像嵌入价值观对齐和尊重规范的指令调整数据集之类的东西将限制不需要的行为。
在安全方面,大学和公司将联手系统地记录法学硕士的网络攻击漏洞,并开发新颖的保护措施。随着模型部署在更加关键的任务场景中,经过验证的完整性和入侵防御将变得与准确性同样重要。
尽管人们担心法学硕士会使白领工作自动化,但人工智能模型开云网址 kaiyun官方入口将继续证明对增强人类研究人员和工程师的作用是有用的。开放科学运动将进一步发展,更多高中生在人工智能的帮助下做出可验证的贡献。
法学硕士将加速数学的发现,解锁证明定理的新技术。神经网络增强的物理模拟将揭示传统研究看不见的现象。生物科学将受益于人工智能的蛋白质折叠预测。
预计著名的研究型大学将大力投资于专注于将法学硕士应用于其领域的中心,同时无缝记录证据和逻辑链以确保学术严谨性。
Grok 是 xAI 法学硕士,专注于科学推理能力,得益于宪法人工智能技术,他将得到显着提高。通过提供数学证明作为其新颖的预测和结论的理由,与仅以预测目标训练的不太严格的法学硕士相比,Grok 将独树一帜。
许多专家会呼吁所有法学硕士的科学主张都附有一些正式的逻辑论证或数学证明,而不仅仅是引用精选的文献。由于这一推动,致力于理性和推理基准的初创公司将会蓬勃发展。
在 2024 年上半年与法学硕士的斗争之后,由于专注于严格测试模型声明和量化现实世界的性能,人工智能社区将在第三季度重新站稳脚跟。
OpenAI 将于 2024 年第三季度发布 GPT-5,以弥补因 GPT-4 的动荡推出而造成的声誉损失。此次模型更新最终将不负众望,与 GPT-3 和 GPT-4 相比,连贯性、事实准确性和基本常识显着提高。
当然,随着 Anthropic、谷歌和其他公司的竞争模型提高了期望,“改进”能力的标准不断提高。尽管如此,GPT-5 目前仍应该牢牢巩固 OpenAI 作为行业领导者的地位。
2024 年上半年关于模型误导性说法的法学硕士大辩论将在第三季度迎来性能验证的时代。大学和公司的团体将发布全面的基准套件,用于量化语言模型输出。
政策制定者也将参与其中,要求对医疗、教育和金融等敏感领域部署的模型的一致性、准确性和偏差等指标进行透明报告。
法学硕士的标准化安全表将列出已知的故障模式,就像机械一样。测试机构将审核和验证生产环境中的性能,而不仅仅是在受控条件下。
由于 Mistral 推动人工智能开发的开放性,改进的开源模型将在 2024 年第三季度达到甚至超过 GPT-4 的原始能力。当然,领先的专有模型仍将在高级认知基准上占据主导地位。但对于许多现实世界的用例来说,开源就足够了。
通过高质量开放模型生态系统实现的人工智能商品化将引发一波创新浪潮,因为初创企业和学生可以在这些模型的基础上进行构建,而不是从头开始重新创建基础。
虽然法学硕士抓住了所有的炒作,但视觉人工智能也将继续稳步发展。随着研究人员更加关注元数据和视频一致性,2023 年人工智能生成的令人担忧的图像将会消退。
到 2024 年第三季度,由于模拟数据的进步和偏差测试制度的改进,视觉模型最终将可用于现实世界的产品,而不会出现令人尴尬的错误。关于上下文和意图仍然存在许多未解决的问题,但视觉和语言模型将开始从彼此的进步中受益更多。
专门生成计算机代码(如 GitHub 的 Copilot)的法学硕士将通过代码行为超过 50% 的现实软件项目做出贡献。用自然语言编写规范和填写必要代码之间的快速迭代将加速开发。
当然,验证自动生成代码的正确性、安全性和来源仍然存在巨大风险。但生产力的好处是如此巨大,以至于几乎每个大型开源项目都会包含一些机器生成的逻辑。软件工程师的角色将永久转向验证和优化,而不是原始流失。
到 2024 年底,人工智能炒作可能开始让位于部署挑战的现实。虽然原始能力呈指数级提高,但融入社会却充满了陷阱。指导这些改变世界的技术的安全和道德采用将需要社会科学家和政策专家与计算机科学家一起工作。
谷歌将于 2024 年第四季度发布 Gemini 的下一代版本。在 Sundar Pichai 的新领导议程下,谷歌投入了大量资源来开发宪法人工智能技术,例如自我监督和外部同行反馈。
更新后的 Gemini 在透明度、监督和可靠性方面大大缩小了与行业领导者的差距。谷歌希望这些严格措施将有助于缓解北美和欧洲政策制定者的反垄断担忧。
当然,有些人认为,对于一家长期被指控窃取用户数据以获取利润的公司来说,这太少了,也太晚了。但随着谷歌开创了在缺乏大规模数据收集的情况下开发强大人工智能的方法,行业情绪开始发生转变。
到第四季度,开源人工智能模型将成为可靠的选择,甚至对于大公司来说也是如此。Mistral 的持续进步加上模型验证标准的增长,有助于大型银行、保险机构和其他受监管行业适应开放生态系统。
当然,国防和情报领域最敏感的应用程序仍将利用基于机密数据训练的闭源模型。但开放性达到了合法性的新高度,而不仅仅是学术界的玩物。
标准小组围绕开放模型的测试、报告和合规性组建。专注于部署工具的领先 MLOps 初创公司会快速更新其产品,以支持开放生态系统作为一流的集成目标,而不仅仅是专有模型。
ChatGPT 于 2022 年底席卷全球。到 2024 年第四季度,随着争夺这个市场的竞争的垂直化,用户将被竞争性的选择淹没。Microsoft 推出了与 Teams 和 Outlook 集成的下一代聊天机器人。谷歌通过 Bard 进行反击,这是一个搜索领域的人工智能助手门户。Meta 通过 Facebook、Instagram 和 WhatsApp 的对话伙伴参与其中。
2024年无疑标志着人工智能发展和部署的又一个拐点。但与之前繁荣和萧条周期的预测相反,即使公众舆论暂时降温,这条趋势线仍保持其指数轨迹。随着人工智能的变革性质在未来十年继续在行业和学术界显现,任务绩效、安全和道德等支柱的持续进步将引导商业努力。
轻抖云作为国内最早的一批AI入局者,凭借其丰厚的互联网从业经验,于2023年5月推出轻抖云AI开放平台,该AI平台可链接OpenAI、阿里通义、百度文心、华为盘古、腾讯混元等当下最流行的AI模型,他可以完成所有场景的虚拟对话,包括但不限于跟你聊天,帮你写论文,写代码,充当人工客服、虚拟数字人直播等。轻抖云的愿景就是打造一个中国最惠民的AI生态系统2.0