✔️ xAI релизнула флагманскую голосовую модель
xAI открыла API-доступ к голосовому агенту grok-voice-think-fast-1.0, который позиционируется для клиентского сервиса и телемаркетинга.
В бенчмарке τ-Voice Bench на дуплексный режим с шумом, акцентами и перебиваниями, модель набрала 67,3%, оставив позади gpt-realtime-1.5 (35,3%), gemini-3.1-flash-live-preview-thinking-high(43,8%).
Архитектура поддерживает фоновый инференс без задержки ответа на 25+ языках, включая русский. Модель разработана совместно со Starlink, провайдер уже использует её в клиентской поддержке.
Протестировать новую модель можно в https://console.x.ai/playground/voice/agent.
https://x.ai/news/grok-voice-think-fast-1
✔️ OpenAI выпустила ChatGPT для врачей
ChatGPT for Clinicians - версия ассистента на базе GPT-5.4, адаптированная под клинические задачи. Сервис бесплатно доступен верифицированным медработникам в США. На внутренних тестах от практикующих врачей клиническая модель обошла по точности базовый GPT-5.4, сторонние решения и самих врачей.
Модель должна снять с врачей административную рутину: разбор профильной литературы, направления, инструкции пациентам, отчёты со ссылками на рецензируемые источники. Чаты не используются для обучения следующих моделей, поддержка HIPAA доступна опционально.
Вместе с релизом OpenAI открыла набор данных https://cdn.openai.com/dd128428-0184-4e25-b155-3a7686c7d744/HealthBench-Professional.pdf для оценки ИИ в здравоохранении.
https://openai.com/index/making-chatgpt-better-for-clinicians/
✔️ Microsoft 365 Copilot превратился из чат-бота в полноценного ИИ-агента
Microsoft открыла общий доступ к агентным функциям Copilot в Word, Excel и PowerPoint. Раньше ассистент жил в боковой панели и отвечал на вопросы - теперь он действует в приложениях и сам меняет содержимое файлов.
Обновленный Copilot может переформатировать и переписать текст, собрать сводную таблицу или применить формулу в Excel, сверстать презентацию по корпоративному шаблону. Все правки агента можно просмотреть, скорректировать или откатить до применения.
Функция уже работает по умолчанию на подписках Microsoft 365 Copilot, Premium, Personal и Family.
https://www.microsoft.com/en-us/microsoft-365/blog/2026/04/22/copilots-agentic-capabilities-in-word-excel-and-powerpoint-are-generally-available/
✔️ ByteDance обновил Seed3D до версии 2.0
Обновление принесло крупные изменения - модель больше не собирает объект за один проход: сначала формирует общую структуру, затем на её основе прорабатывает грани, стенки и сложную топологию.
За текстурирование отвечает PBR-модель с архитектурой MoE. VLM анализирует физические свойства поверхностей на исходном изображении, поэтому материалы адекватно реагируют на смену освещения в сцене.
В системе появилась декомпозиция: Seed3D 2.0 разделяет объект на функциональные и подвижные элементы и выгружает их с кинематическими связями в формате URDF. Ассеты экспортируются напрямую в игровые движки и физические симуляторы. Доступ открыт на https://exp.volcengine.com/ark/vision?_vtm_=0.0.c70961.d701978.0&mode=vision&modelId=doubao-seed3d-2-0-260328&tab=Gen3D ByteDance.
https://seed.bytedance.com/en/blog/seed3d-2-0-released-higher-precision-and-greater-usability
✔️ Джерри Творек запустил лабораторию Core Automation
Бывший сотрудник OpenAI,
https://t.me/ai_machinelearning_big_data у Сэма Альтмана 7 лет, открыл исследовательскую лабораторию https://www.coreauto.com/. Заявленная цель - автоматизировать процесс разработки ИИ.
Команда будет работать над новыми алгоритмами обучения за пределами RL и над архитектурами, которые масштабируются лучше трансформеров. Планируется, что небольшая группа инженеров плюс автономные ИИ-агенты закроют объём, который сегодня тянут крупные корпорации.
Core Automation встаёт в один ряд с Safe Superintelligence Ильи Суцкевера и Thinking Machines Lab Миры Мурати, стартапами выходцев из OpenAI, которые ищут архитектурную альтернативу подходу "больше параметров, больше железа".
https://x.com/MillionInt/status/2046659157688996251
https://t.me/ai_machinelearning_big_data
#news #ai #ml