探索人工智能:培训系统进行推理

在一项引人入胜的新研究中,研究人员发现给予人工智能(AI)系统“内心独白”可以显著提升其推理能力。通过教导AI在回应提示之前先思考,类似于人类在说话之前考虑下一句话的方式,他们开发出了一种名为“Quiet-STaR”的开创性方法。这一创新方法指导AI系统在制定回应之前同时生成多个内在推理,从而使AI能够提供最佳答案。

不同于像ChatGPT这样的传统AI聊天机器人,后者不考虑回应或预料不同的对话可能性,Quiet-STaR算法使AI代理具备生成一系列预测并附带推理的能力。在提供回应时,AI结合并呈现最合适的答案,随后可以根据问题的性质由人类参与者进行评估。通过这一过程,不正确的推理被丢弃,使AI能够预料未来的对话并从持续互动中学习。

在利用Mistral 7B开源大语言模型(LLM)时,研究人员应用Quiet-STaR算法并观察到显著改进。Mistral 7B经过Quiet-STaR训练后达到了47.2%的推理得分,而之前的训练分数为36.3%。尽管在学校数学测试中仍存在困难,得分只有10.9%,但这是从基础版本最初的5.9%得分中有了显着改进。

值得注意的是,研究人员已经专注于解决现有AI模型在理解常识推理和情景化方面的局限性。像ChatGPT和Gemini这样基于试图模拟人类大脑结构和学习模式的神经网络的语言模型目前无法进行真正的理解。先前对提高推理能力的尝试主要是基于特定领域的,限制了它们对各种AI模型的适用性。

Quiet-STaR方法因其多功能性、静默背景运行的能力以及与不同类型的LLM实现的潜力而脱颖而出。通过构建在自学推理者(STaR)算法基础上,研究人员旨在弥合基于神经网络的AI系统和类人推理能力之间的差距。这一前景光明的研究在推进AI技术的发展道路上开启了新的大门。

常见问题解答

1. 什么是Quiet-STaR?
Quiet-STaR是一种训练AI系统在回应提示之前生成内在推理以提升其推理能力的方法。它涉及丢弃不正确的推理并利用各种预测的组合来提供最佳答案。

2. Quiet-STaR与传统AI聊天机器人有何不同?
与传统的AI聊天机器人不考虑或预料对话中的不同可能性的方式不同,Quiet-STaR使AI代理能够同时考虑各种推理并生成更好的回应。

3. 当前AI模型的局限性是什么?
现有的AI模型在常识推理和情景化方面存在困难。基于神经网络的模型,例如ChatGPT和Gemini,缺乏真正的理解能力。

4. Quiet-STaR如何增强AI推理能力?
通过训练AI系统在回应之前进行思考,Quiet-STaR使其能够预料未来的对话,从持续互动中学习,并提高推理得分。

来源:
arXiv Database
Live Science

The source of the article is from the blog myshopsguide.com

Privacy policy
Contact