Компания Apple не слишком распространяется о своих планах относительно генеративного ИИ, но проявляет заметный интерес к возможности запускать ИИ-модели на своих устройствах локально.
Источник изображения: Bangyu Wang / unsplash.com
Сегодня исследователи Apple представили восемь крайне малых языковых моделей OpenELM, добавив их в библиотеку Hugging Face. В комментариях Apple сообщила, что эти «эффективные языковые модели с открытым исходным кодом» (Open-source Efficient Language Models, OpenELM) отлично справляются с текстовыми задачами, например, написанием электронных писем. И все эти модели уже доступны для разработчиков.
Серия ИИ-моделей OpenELM имеет разновидности с разным набором параметров: 270 и 450 миллионов, 1,1 и 3 миллиарда. Под параметрами здесь подразумевается количество переменных, которые модель использует, принимая решения на основе обучающих наборов данных. Например, у недавно выпущенной модели Phi-3 от Microsoft — 3,8 млрд параметров, а у Gemma от Google — 2,2 млрд. При этом модели меньшего размера дешевле в использовании и оптимизированы для работы на телефонах и ноутбуках.
Apple разрешает использовать OpenELM по «лицензии на образец кода» совместно с различными контрольными точками обучения, статистикой работы моделей, инструкциями по предварительному обучению, оценке и настройке. Данная лицензия не запрещает коммерческого использования или модификации кода, однако требует распространять программное обеспечение Apple совместно с текстами самой лицензии и отказа от ответственности. Последний подразумевает отсутствие гарантий безопасности и вероятность неточных, необъективных, неприемлемых и даже вредных ответов на запросы пользователя.
Источник: 3DNews