Apple avanza en la inteligencia artificial en dispositivos con modelos de lenguaje de código abierto.

Apple Mejora las Suites de IA con Modelos de Ejecución Local

Apple ha presentado recientemente un conjunto de nuevos modelos de inteligencia artificial (IA) llamados OpenELMs, un conjunto de ocho modelos diversos diseñados para su ejecución en dispositivos. Esta innovación marca un paso anticipado hacia una posible integración de IA en iOS 18.

Los OpenELMs (Modelos de Lenguaje Eficiente de Código Abierto) son completamente de código abierto, ofrecidos en Hugging Face Hub, una plataforma comunitaria dedicada a entusiastas y desarrolladores de IA. Apple también ha publicado un documento detallando estos nuevos modelos.

Cuatro de los OpenELMs han sido preentrenados utilizando CoreNet (anteriormente conocido como CVNets), una amplia biblioteca de datos aprovechada para el entrenamiento de modelos de lenguaje de IA. Los otros cuatro han sido ajustados con orientación específica de Apple. Este ajuste mejora los modelos de IA para responder mejor a ciertas consultas.

Estos modelos vienen en cuatro tamaños, definidos por la cantidad de parámetros que poseen (270 millones, 450 millones, 1.1 mil millones y 3 mil millones de parámetros), haciéndolos más pequeños que muchos modelos de alto rendimiento que suelen tener alrededor de 7 mil millones de parámetros. Tanto las versiones preentrenadas como las ajustadas de cada tamaño están disponibles para su uso.

En lo que se considera un movimiento inusual para el ecosistema de software típicamente cerrado de Apple, la compañía ha elegido distribuir los OpenELMs como software de código abierto. Apple declara su intención de potenciar y enriquecer la investigación en IA en el dominio público. El preentrenamiento se realizó con 1.8 billones de tokens de conjuntos de datos públicos que incluyen contenido de Reddit, Wikipedia y arXiv.org.

El compromiso de Apple con la IA ha sido significativo, en medio de una fuerte competencia de smartphones y laptops con chips de IA como el Tensor de Google y el último chip de IA de Qualcomm presente en dispositivos Surface.

Apple espera que al compartir sus modelos de IA en dispositivos abiertamente, los desarrolladores ambiciosos ayuden a mejorar el software, lo que podría ser crucial para futuras integraciones de herramientas de IA en iOS y macOS. Mientras tanto, los dispositivos actuales de Apple están repletos de capacidades de IA impulsadas por el Motor Neural de Apple en sus chips de la serie A y M, potenciando características como Face ID y Animoji. Además, se espera que los próximos avances en el chip M4 de Mac muestren nuevas capacidades de procesamiento relacionadas con la IA esenciales para el creciente uso de herramientas de aprendizaje automático en software profesional.

Preguntas Clave y Respuestas:

1. ¿Cuál es la importancia de que los OpenELMs de Apple sean de código abierto?
Las iniciativas de código abierto como los OpenELMs permiten a los desarrolladores e investigadores fuera de Apple acceder, modificar e innovar en base a los modelos de lenguaje de Apple. Esto puede llevar a una colaboración más amplia en la comunidad de IA, acelerando potencialmente los avances en IA. Además, muestra transparencia en el desarrollo de IA, invitando a la examinación y mejoras de la comunidad en general.

2. ¿Por qué es importante la IA en dispositivos?
La IA en dispositivos ofrece varios beneficios, como una mayor privacidad, ya que los datos no necesitan enviarse a la nube para su procesamiento. También permite una menor latencia ya que la computación ocurre localmente, y puede reducir las necesidades de ancho de banda. Además, la IA en dispositivos no depende de una conexión a internet constante, lo que permite funcionalidad incluso sin conexión.

3. ¿Cómo podría influir la apertura de estos modelos de IA en la industria tecnológica?
Al compartir sus modelos de IA públicamente, Apple podría sentar un precedente para que otras grandes compañías tecnológicas sigan, lo que potencialmente conduciría a un ecosistema más abierto donde la innovación se comparta en lugar de mantenerse detrás de puertas cerradas. Esto podría impulsar servicios y aplicaciones de IA de mayor calidad y ampliar la gama de dispositivos capaces de realizar cálculos avanzados de IA.

Desafíos Clave y Controversias:

El desarrollo de modelos de IA en dispositivos conlleva el desafío de equilibrar el rendimiento con las restricciones de recursos. Los modelos más pequeños, aunque necesarios para dispositivos móviles con potencia y almacenamiento limitados, pueden no ofrecer las mismas capacidades que los modelos más grandes basados en la nube.

La privacidad de los datos puede ser una preocupación. La divulgación de modelos de IA de código abierto puede plantear preguntas sobre las fuentes de los datos de entrenamiento y si se obtuvieron de manera ética y se anonimizaron correctamente.

La calidad de las respuestas generadas por la IA es otra área de controversia potencial. Los modelos más pequeños pueden no ser tan precisos o capaces como sus contrapartes más grandes, y esto puede resultar en experiencias de usuario deficientes o resultados sesgados.

Ventajas y Desventajas:

Ventajas:

– Privacidad: El procesamiento en dispositivos mantiene los datos del usuario en el dispositivo, lo que es más seguro y privado.
– Rendimiento: La computación local elimina la necesidad de latencia de red, lo que se traduce en tiempos de respuesta más rápidos.
– Accesibilidad: Las funcionalidades de IA se pueden utilizar sin conexión.
– Eficiencia Energética: Las tareas de IA locales se pueden optimizar para consumir menos energía en comparación con la transmisión constante de datos hacia y desde la nube.

Desventajas:

– Limitación de Recursos: Los dispositivos tienen un poder de procesamiento y almacenamiento limitados en comparación con la nube, lo que puede limitar la complejidad y las capacidades de los modelos de IA.
– Desafíos de Desarrollo: Construir modelos de IA efectivos que se ajusten a las restricciones en dispositivos requiere una importante experiencia técnica e innovación.
– Disponibilidad de Datos: Los modelos deben ser lo suficientemente generales para manejar una amplia variedad de tareas sin la ventaja de acceder a grandes bases de datos basadas en la nube en tiempo real.

Para obtener más información sobre temas relacionados, puede visitar los siguientes enlaces:
– Apple
– Hugging Face