
Alibaba представила Qwen3-Omni — первую модель большого языка с архитектурой, изначально рассчитанной на полную мультимодальность. 🌟 Эта инновационная модель способна обрабатывать и генерировать текст, речь, изображения и видео в рамках одного ядра без необходимости переключения между режимами. Qwen3-Omni построена на основе архитектуры Mixture of Experts (MoE) с 30 миллиардами параметров, из которых 3 миллиарда активны. Модель поддерживает работу как локально при наличии 32-64 ГБ оперативной памяти, так и на GPU с поддержкой CUDA. 💻 Одним из ключевых преимуществ Qwen3-Omni является её скорость. Время отклика составляет 211 мс для аудио и 507 мс для аудиовидео, что значительно быстрее, чем у GPT-4o и Gemini 2.5-Pro. При этом стоимость использования модели также впечатляет — всего 0,35 доллара за 1 миллион токенов. 💰 Три версии Qwen3-Omni уже доступны на платформах Hugging Face, GitHub и ModelScope. Это действительно революционный шаг в мире искусственного интеллекта, который можно сравнить с ИИ-швейцарским ножом. 🔧