Speechify сегодня показала раннюю версию новой системы голосового управления компьютером под кодовым именем Jarvis — голосового интерфейса, позволяющего управлять компьютером с помощью голосовых команд. Демонстрация показывает будущее, где пользователи могут запускать приложения, выполнять задачи и проходить рабочие процессы без ввода, кликов и прикосновений.
Прототип недавно был представлен внутри компании и опубликован основателем и CEO Speechify Клиффом Вайтцманом. С системой можно общаться естественно, а Speechify выполняет действия в приложениях и окнах в реальном времени.
В демонстрации голосовые инструкции запускают такие действия, как открытие приложений, поиск контактов, навигация по интерфейсу и отправка сообщений. Вместо ручного переключения окон и взаимодействия с программами всё делается голосом.
Раннее видео с обзором системы можно посмотреть здесь от нашего CEO Клиффа Вайтцмана.
Голосовой интерфейс для всего компьютера
Обычные ИИ-ассистенты обычно ограничены ответами на вопросы или генерацией текста. Даже с ИИ в ПО пользователям всё равно приходится вручную открывать приложения, искать пункты меню и самим всё делать.
Speechify Jarvis предлагает иной подход.
Пользователи говорят, а система выполняет команды прямо на компьютере. Приложения открываются сами, рабочие процессы запускаются, задачи завершаются — всё без ручного управления.
Голос становится активным уровнем управления всей системой, а не просто пассивным собеседником.
От ИИ-чата к голосовому управлению ПК
Большинство ИИ-инструментов построены на текстовых запросах и чат-интерфейсах. Они генерируют ответы и тексты, но обычно не могут действовать в реальных приложениях.
Speechify Jarvis расширяет Speechify Voice AI платформу до прямого управления компьютером.
Вместо того чтобы спрашивать помощника и потом выполнять шаги вручную, можно сразу поручить системе выполнить задачу. Голос становится основным интерфейсом для работы с программами.
Speechify называет это частью общей цели — уменьшить зависимость от клавиатур и традиционных устройств ввода.
«Мы создали нечто, чего раньше не было», — говорит Клифф Вайтцман, основатель и CEO Speechify. «Вы просто говорите компьютеру, и он всё делает. Не нужно ни кликать, ни печатать, ни трогать. Ваш голос управляет всей машиной».
Дизайн на основе естественного общения
Speechify Jarvis основан на голосовой платформе Speechify, которая сочетает текст-в-речь, диктовку и разговорного ИИ-ассистента.
Новая система расширяет эти возможности, предоставляя прямое управление рабочими процессами: открытие и навигацию по приложениям, отправку сообщений, выполнение автоматизированных задач, переключение окон и контроль за программами в живой речи.
Действия запускаются обычной разговорной речью, а не командами или «горячими клавишами».
Система сейчас используется внутри компании на компьютерах Speechify и является ранним прототипом будущего продукта.
К голосоцентричной операционной модели
Speechify демонстрирует тенденцию перехода на голосовое управление компьютерами. Клавиатуры и графические интерфейсы остаются стандартом, но Speechify считает, что голос станет основным интерфейсом для многих процессов.
Представленный прототип Jarvis показывает, что в будущем можно будет общаться с компьютером как с собеседником, а не через ручной ввод.
Speechify называет эту технологию шагом к превращению голоса в основной инструмент для продуктивности и работы с информацией. Новые обновления уже в планах.
О Speechify
Speechify — голосовой ИИ-ассистент, помогающий читать, писать и лучше понимать информацию. Им пользуются более 50 млн человек по всему миру. Speechify предлагает озвучивание текста, диктовку и разговорного ИИ-ассистента для iOS, Android, Mac, веба и Chrome. В 2025 году Speechify получила Apple Design Award за вклад в доступность и продуктивность. Speechify используют почти в 200 странах; более 1 000 естественных голосов на 60 языках, включая голоса Snoop Dogg и Гвинет Пэлтроу.