Speechify представляет систему голосового управления компьютером Jarvis

Speechify сегодня показала раннюю версию новой системы голосового управления компьютером под кодовым именем Jarvis — голосового интерфейса, позволяющего управлять компьютером с помощью голосовых команд. Демонстрация показывает будущее, где пользователи могут запускать приложения, выполнять задачи и проходить рабочие процессы без ввода, кликов и прикосновений.

Прототип недавно был представлен внутри компании и опубликован основателем и CEO Speechify Клиффом Вайтцманом. С системой можно общаться естественно, а Speechify выполняет действия в приложениях и окнах в реальном времени.

В демонстрации голосовые инструкции запускают такие действия, как открытие приложений, поиск контактов, навигация по интерфейсу и отправка сообщений. Вместо ручного переключения окон и взаимодействия с программами всё делается голосом.

Раннее видео с обзором системы можно посмотреть здесь от нашего CEO Клиффа Вайтцмана.

Голосовой интерфейс для всего компьютера

Обычные ИИ-ассистенты обычно ограничены ответами на вопросы или генерацией текста. Даже с ИИ в ПО пользователям всё равно приходится вручную открывать приложения, искать пункты меню и самим всё делать.

Speechify Jarvis предлагает иной подход.

Пользователи говорят, а система выполняет команды прямо на компьютере. Приложения открываются сами, рабочие процессы запускаются, задачи завершаются — всё без ручного управления.

Голос становится активным уровнем управления всей системой, а не просто пассивным собеседником.

От ИИ-чата к голосовому управлению ПК

Большинство ИИ-инструментов построены на текстовых запросах и чат-интерфейсах. Они генерируют ответы и тексты, но обычно не могут действовать в реальных приложениях.

Speechify Jarvis расширяет Speechify Voice AI платформу до прямого управления компьютером.

Вместо того чтобы спрашивать помощника и потом выполнять шаги вручную, можно сразу поручить системе выполнить задачу. Голос становится основным интерфейсом для работы с программами.

Speechify называет это частью общей цели — уменьшить зависимость от клавиатур и традиционных устройств ввода.

«Мы создали нечто, чего раньше не было», — говорит Клифф Вайтцман, основатель и CEO Speechify. «Вы просто говорите компьютеру, и он всё делает. Не нужно ни кликать, ни печатать, ни трогать. Ваш голос управляет всей машиной».

Дизайн на основе естественного общения

Speechify Jarvis основан на голосовой платформе Speechify, которая сочетает текст-в-речь, диктовку и разговорного ИИ-ассистента.

Новая система расширяет эти возможности, предоставляя прямое управление рабочими процессами: открытие и навигацию по приложениям, отправку сообщений, выполнение автоматизированных задач, переключение окон и контроль за программами в живой речи.

Действия запускаются обычной разговорной речью, а не командами или «горячими клавишами».

Система сейчас используется внутри компании на компьютерах Speechify и является ранним прототипом будущего продукта.

К голосоцентричной операционной модели

Speechify демонстрирует тенденцию перехода на голосовое управление компьютерами. Клавиатуры и графические интерфейсы остаются стандартом, но Speechify считает, что голос станет основным интерфейсом для многих процессов.

Представленный прототип Jarvis показывает, что в будущем можно будет общаться с компьютером как с собеседником, а не через ручной ввод.

Speechify называет эту технологию шагом к превращению голоса в основной инструмент для продуктивности и работы с информацией. Новые обновления уже в планах.

О Speechify

Speechify — голосовой ИИ-ассистент, помогающий читать, писать и лучше понимать информацию. Им пользуются более 50 млн человек по всему миру. Speechify предлагает озвучивание текста, диктовку и разговорного ИИ-ассистента для iOS, Android, Mac, веба и Chrome. В 2025 году Speechify получила Apple Design Award за вклад в доступность и продуктивность. Speechify используют почти в 200 странах; более 1 000 естественных голосов на 60 языках, включая голоса Snoop Dogg и Гвинет Пэлтроу.