Топ трендов HuggingFace за неделю — разбираем, что нового
TL;DR
Новое: ZAYA1-8B — 8,4B/760M MoE от Zyphra, бьёт модели в 10 раз больше. MiniCPM-V-4.6 — 1B мультимодалка для телефона. HiDream-O1-Image — #8 в Arena, open-source T2I лидер. Gemma 4 MTP assistants — ускоряют Gemma в 3 раза. OmniVoice — TTS на 600+ языков, 2,2M загрузок. Supertonic-3 — TTS на 31 язык, на CPU. LTX2.3-10Eros — I2V merge.
Держится: DeepSeek V4, Qwen 3.6, Gemma 4, Sulphur-2, Privacy Filter, SenseNova-U1.
LLM
http://huggingface.co/Zyphra/ZAYA1-8B — 8,4B/760M активных, MoE от Zyphra, обучена end-to-end. GPQA 71, MMLU Pro 74,2, AIME ’25 93,1. Конкурентоспособна с моделями в несколько раз больше себя, включая frontier-scale reasoning models. Лезет на устройство, работает в test-time compute harnesses. 66K загрузок, 10 квантизаций уже на HF. Apache 2.0.
Мультимодал и edge
http://huggingface.co/openbmb/MiniCPM-V-4.6 — 1B, мультимодальная модель для edge и телефонов. SigLIP2-400M + Qwen3.5-0.8B LLM. Использует в 19 раз меньше токенов, чем Qwen3.5-0.8B, при лучшем скоре на Artificial Analysis Intelligence Index (13 vs 10). LLaVA-UHD v4 сокращает FLOPs визуального энкодинга на 50%. iOS, Android, HarmonyOS, все адаптации открыты. vLLM, SGLang, llama.cpp, Ollama. Apache 2.0.
Изображения
http://huggingface.co/HiDream-ai/HiDream-O1-Image — 9B, unified image generative model. Pixel-level Unified Transformer (UiT) без внешних VAE и text encoders. Кодирование сырых пикселей, текста и условий в одном token space. Text-to-image, image editing, subject-driven personalization до 2048х2048. #8 в Artificial Analysis Text to Image Arena, лидер среди open weights T2I. Есть http://huggingface.co/HiDream-ai/HiDream-O1-Image-Dev и Reasoning-Driven Prompt Agent. MIT.
Ускорители для Gemma 4
Gemma 4 MTP assistants — Multi-Token Prediction drafters для speculative decoding. Маленькие модели предсказывают несколько токенов вперёд, большая Gemma 4 верифицирует параллельно. Ускорение до 3х без потери качества. Для 31B: http://huggingface.co/google/gemma-4-31B-it-assistant, 66,6K загрузок. Для 26B A4B: http://huggingface.co/google/gemma-4-26B-A4B-it-assistant, 47,7K. Apache 2.0.
Аудио
http://huggingface.co/k2-fsa/OmniVoice — zero-shot TTS на 600+ языков. Diffusion language model архитектура, voice cloning из короткого референса, voice design через атрибуты (gender, age, pitch, accent, whisper). Невербальные символы [laughter], коррекция произношения через pinyin/phonemes. RTF 0,025, в 40 раз быстрее реального времени. 2,22M загрузок, 100 Spaces, 19 файнтюнов, 12 адаптеров. Apache 2.0.
http://huggingface.co/Supertone/supertonic-3 — лёгкий TTS для локального инференса через ONNX Runtime. 5 языков расширили до 31, улучшили стабильность чтения, сократили повторы и пропуски. Работает на CPU без GPU. OpenRAIL.
Видео
http://huggingface.co/TenStrip/LTX2.3-10Eros — image-to-video merge на базе Sulphur-2/LTX 2.3. Layer-scaled merges вместо прямого weight merge, лучше уважает промпт. 64K загрузок. ComfyUI nodes, GGUF квантизации.
Разное
http://huggingface.co/Jackrong/Qwopus3.6-35B-A3B-v1-GGUF — GGUF квантизация Qwopus 3.6, community merge Qwen + Octopus. 67,2K загрузок.
Держится в топе
http://huggingface.co/deepseek-ai/DeepSeek-V4-Pro — 2,02M загрузок. http://huggingface.co/deepseek-ai/DeepSeek-V4-Flash — 1,16M. http://huggingface.co/Qwen/Qwen3.6-27B — 2,45M. http://huggingface.co/Qwen/Qwen3.6-35B-A3B — 3,86M. http://huggingface.co/google/gemma-4-31B-it — 9,12M. http://huggingface.co/openai/privacy-filter — 191K. http://huggingface.co/SulphurAI/Sulphur-2-base — 158K. http://huggingface.co/sensenova/SenseNova-U1-8B-MoT — 4,53K.
Хорошей недели! 👾
@neuro_channel (теперь ещё в https://tprg.ru/0zr5 и https://tprg.ru/bfu0)