Компания Элона Маска xAI сделала еще один шаг вперед в мире искусственного интеллекта, добавив в свой API возможность создания изображений. Эта новая функция позволяет пользователям создавать изображения из текстовых описаний с помощью разработанной компанией модели grok-2-image-1212. Этот шаг свидетельствует о том, что xAI становится важным игроком в области создания изображений с помощью искусственного интеллекта.
Что такое модель Grok-2-Image-1212?
Модель grok-2-image-1212, которую xAI добавила в свой API, позволяет пользователям создавать изображения в формате JPG с использованием текстовых описаний. Модель может создавать до 10 изображений за один запрос. Однако эта функция ограничена 5 запросами в секунду. Это ограничение призвано защитить производительность системы и предотвратить перегрузку.
Стоимость создания изображений составляет 0,07 доллара США за одно изображение. Эта цена находится на среднем уровне по сравнению с конкурентами. Например, FLUX.1 от Black Forest Labs стоит около $0,05 за изображение, а популярные генераторы изображений, такие как Ideogram, — $0,08.
Цели xAI в формировании изображений
В прошлом году xAI начал использовать FLUX.1 от Black Forest Labs для рендеринга на платформе X. Эта модель оказала большое влияние, особенно в поддержке Grok-2 и превзошла конкурентов, таких как Midjourney. Новая модель xAI grok-2-image-1212 призвана продолжить этот успех.
Однако цели xAI в этой области не ограничиваются созданием изображений. Компания также делает важные шаги в области производства видео с помощью искусственного интеллекта. На этой неделе xAI приобрела Hotshot, стартап по производству видео с помощью искусственного интеллекта, и готовится стать активным игроком и в этой области.
Текущие возможности и ограничения API
В настоящее время API xAI имеет некоторые ограничения на создание изображений. Например, пользователи не могут настраивать качество, размер или стиль изображений. Однако запросы в API могут быть пересмотрены моделью чата. Это позволяет пользователям добиваться более стабильных и удобных результатов.
Как утверждает компания в своей документации, эти ограничения будут устранены в будущих обновлениях. xAI планирует сделать API более гибким и удобным, принимая во внимание отзывы пользователей.
Добавление xAI в свой API функции создания изображений в очередной раз демонстрирует притязания компании в области искусственного интеллекта. Модель Grok-2-image-1212 позволяет пользователям быстро и эффективно создавать изображения из текстовых описаний. Однако компании еще предстоит преодолеть значительные препятствия.
Усилия xAI по расширению инфраструктуры и потенциальный раунд инвестиций могут стать важным шагом для компании в достижении ее будущих целей. В этот период, когда конкуренция в секторе искусственного интеллекта обостряется, мы увидим, как xAI будет следовать своему пути.