
Компания Nvidia, известная своими чипами для искусственного интеллекта, сделала шаг в сторону создания моделей, выпустив серию передовых открытых моделей Nemotron 3, а также предоставив данные и инструменты для их использования. Этот шаг может быть стратегическим ответом на развитие собственных чипов такими компаниями, как OpenAI и Google.
Новые возможности и подходы
Открытые модели играют важную роль в экосистеме ИИ, позволяя исследователям и стартапам экспериментировать и создавать новые решения. В то время как OpenAI и Google предлагают небольшие открытые модели, китайские компании более активно обновляют свои версии. По данным Hugging Face, китайские модели пользуются большей популярностью.
Модели Nemotron 3 от Nvidia доступны для скачивания и модификации и, по данным компании, являются одними из лучших по своим показателям. Генеральный директор Nvidia Дженсен Хуанг отметил, что "открытые инновации являются основой прогресса ИИ" и описал Nemotron как платформу, предоставляющую разработчикам прозрачность и эффективность.
Технические характеристики и архитектура
Компания Nvidia использует более прозрачный подход, чем многие её американские конкуренты, предоставляя данные, использованные для обучения Nemotron. Это облегчает инженерам модификацию моделей. В числе инструментов для настройки моделей представлены новая архитектура гибридной латентной смеси экспертов и библиотеки для обучения агентов с помощью усиленного обучения.
Модели Nemotron 3 предлагают три варианта: Nano с 30 миллиардами параметров, Super с 100 миллиардами и Ultra с 500 миллиардами параметров. Чем больше параметров, тем мощнее и сложнее модель, требующая значительных ресурсов для работы.
Рынок и конкуренция
Вице-президент по генеративному ПО для предприятий в Nvidia, Кари Энн Бриски, подчеркивает важность открытых моделей для трех ключевых аспектов: настройка под задачи, распределение запросов между различными моделями и получение более интеллектуальных ответов благодаря симулированному рассуждению.
В то время как Meta выпустила свои передовые открытые модели Llama в феврале 2023 года, компания намекнула, что будущие релизы могут стать закрытыми. Это отражает тенденцию в ИИ-индустрии, где многие компании становятся более закрытыми в своих исследованиях. Однако китайские компании, такие как DeepSeek, Alibaba, Moonshot AI, Z.ai и MiniMax, продолжают активно развивать и публиковать свои открытые модели.
Эти изменения на рынке могут представлять вызов для Nvidia, чьи чипы стали важной частью ИИ-индустрии. Недавние шаги правительства США, например разрешение на экспорт чипов H200 в Китай, демонстрируют стремление к сохранению конкурентоспособности, несмотря на растущую независимость Китая в области технологий.



