Tencent представляет HunyuanImage 3.0: новая эра мультимодальных моделей с открытым исходным кодом

Компания Tencent сделала важный шаг в развитии искусственного интеллекта, представив мультимодальную модель HunyuanImage 3.0 с открытым исходным кодом. Эта модель построена на архитектуре Mixture of Experts (MoE) и включает в себя 64 эксперта. Общее количество параметров достигает 80 миллиардов, но при генерации задействуется лишь 13 миллиардов, что позволяет значительно снижать нагрузку на систему без потери качества генерации. 🚀 Tencent заявляет, что HunyuanImage 3.0 не уступает по производительности проприетарным аналогам, а также открытым конкурентам от Alibaba. Среди ключевых особенностей модели: — Поддержка расширенного контекстного окна — Минимальная задержка в обработке пользовательских запросов — Поддержка движка vLLM для локального инференса и дообучения Веса нейросети уже доступны для скачивания на Hugging Face и GitHub, что открывает широкие возможности для разработчиков и исследователей. 🌟 HunyuanImage 3.0 представляет собой значительный шаг вперед в области искусственного интеллекта, предлагая мощные инструменты для работы с мультимодальными данными.