苹果创新高效AI以进行移动集成

全球科技领军企业苹果公司正在制定对抗微软和谷歌在生成式人工智能领域广泛影响的应对策略。人们寄予厚望,认为苹果将推出适用于iOS设备的神经网络人工智能技术,其战略迹象正在逐渐显露。

苹果公司野心勃勃地推出了OpenELM,这是一个能直接在移动设备上运行的大型语言模型,结合了斯坦福等知名机构的研究以及谷歌的深度学习专家的见解。OpenELM的所有代码以及详尽的训练文档均公开在GitHub上供开发人员和研究人员使用,体现了对开源原则的承诺。

这篇题为“OpenELM:一个带有开源训练和推理框架的高效语言模型系列”的论文是由Sachin Mehta及其团队撰写,通过arXiv预印服务器进行了分享。该研究突出了在移动设备上部署神经网络的实用性,其模型参数达到了13亿个,与OpenAI的GPT-4等模型相比,参数规模有很大差异。

这款精简版模型通过在神经网络深度上进行创新性调整,优化了训练期间的数据计算,从而提高了效率。OpenELM模型在只需一半典型的预训练标记数的情况下,就能胜过几个移动计算神经网络。

OpenELM的核心是变压器架构,与自2017年以来成为语言模型的标准结构相似。通过整合DeLighT方法,OpenELM的每一层都拥有一套独特的神经参数配置,提高了准确度而不增加参数数量。

OpenELM在基准测试中表现出色,与OLMo等竞争对手相比表现优异,尽管模型规模较小,训练数据需求也较少。然而,该模型的有效性并非没有挑战,某些测试发现其预测输出速度较慢。

苹果在iOS人工智能探索中一个重要问题尚未解答:公司是选择许可现有的人工智能技术,还是引领开放式人工智能生态系统的发展,从中其设备可以获益匪浅?苹果对开源软件的前瞻性投资可能表明其对于为所有移动用户打造更具协作和可访问的人工智能未来的战略取向。

给定文章讨论苹果正在创新高效AI以实现移动集成的背景下,可以识别出一些相关事实、问题、答案、主要挑战或争议,以及优势和劣势来增进对该主题的理解。

Privacy policy
Contact