The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Представлена система для управления интерфейсом KDE через голосовые команды

23.08.2009 19:16

Проект KDE представил стабильную версию Simon, программы для распознавания речи, которая интегрирована с KDE и позволяет организовать управление рабочим столом посредством речевых команд. Толчком к созданию Simon послужило то, что один из разработчиков является учителем детей с ограниченными возможностями, для которых письмо и набор на клавиатуре вызывает большие трудности, а речь нарушена. В KDE провели исследования и пришли к выводу, что ни одна из существующих программ не может адаптироваться к нарушениям речи учеников. Так, и было положено начало созданию Simon.

Simon представляет собой подсистему распознавания речи, имеющую возможность взаимодействовать с X11 или Windows. В настоящий момент система выполнена в виде набора плагинов к KDE, что позволяет организовать контроль над базовым пользовательским интерфейсом. После завершения работы над плагином для передачи команд посредством dbus, станет возможным более тесная интеграция с внешними приложениями. Процесс распознавания в Simon построен на статических алгоритмах - для начала поддержки нового языка достаточно сформировать речевую модель, которая в свою очередь состоит из акустической и языковой модели. После этого, для распознавания команд, достаточно пятиминутной тренировки с микрофоном для подстройки системы под особенности речи пользователя.

Познакомиться с возможностями, которые предоставляет последний релиз Simon, можно просмотрев специально подготовленный видеоролик.

  1. Главная ссылка к новости (http://www.kdenews.org/2009/08...)
Автор новости: wrnews
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/23123-kde
Ключевые слова: kde, voice, sound, audio
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (21) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, SwitNJ (??), 19:51, 23/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    вот! это мне очень даже нравится! очень надеюсь функционировать это будет надежно и главное с пониманием русского языка :)
     
  • 1.3, Iv945n (ok), 20:31, 23/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Вспомнилась сцена из полнометражки Star Trek IV где комманда Энтерпрайза вернулась в прошлое в середину 20-го века и Скотти пытаясь использовать компьютер того времени начинает коммандовать ему "Компьютер, сделайте то-то...", потом, когда ему дают в руки мышку он переворачивает её и обращается в неё как в микрофон: Компьютер, ...

    :-)

     
  • 1.5, Необъективный_ (?), 21:00, 23/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    http://ru.wikipedia.org/wiki/Симона_(фильм)
     
  • 1.6, noname (??), 21:13, 23/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >Так, и было

    Запятая не нужна.

     
  • 1.7, Zenitur (?), 21:22, 23/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Хоть одно нововведение. А есть что-нибудь ещё такого типа?
     
  • 1.8, Аноним (-), 22:06, 23/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Наконец-то! Давно мечтаю управлять компьюетером голосом, сейчас пытаюсь настроить пульт.
     
     
  • 2.19, Aleksey (??), 12:56, 24/08/2009 [^] [^^] [^^^] [ответить]  
  • +/
    >Наконец-то! Давно мечтаю управлять компьюетером голосом, сейчас пытаюсь настроить пульт.

    Боюсь качество опознования (судя по другим аналогичным системам) будет не на высоте. А для поддержки русского придется ждать, когда кто-нить из соотечественников решит потратить кучку времени на доводку.

     
  • 2.22, Alatar (??), 21:56, 24/08/2009 [^] [^^] [^^^] [ответить]  
  • +/
    Лет эдак 7-8 назад игрался с такими системами (правда под офтопик, но это не суть важно). Работало нормально, конечно полноценного распознования речи там небыло, но команды вполне адекватно распозновались и выполнялись стабильно. В общем поигрался и бросил - надоело давольно быстро - мало того, что сидишь в пустой комнате и, как идиот, разговариваешь с компом, так ещё и пока выговоришь команду на клаве можно успеть штук пять таких набрать.
     

  • 1.10, Аноним (-), 23:24, 23/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Simon says...
     
  • 1.13, Sergey_vl (?), 05:42, 24/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Ухты! Скоро по функцианалу догоним четвёртую полуось 95-го года...
     
     
  • 2.14, Вова (?), 10:16, 24/08/2009 [^] [^^] [^^^] [ответить]  
  • +/
    только сдержался от коммента. Помнится, даже анек ходил, "шатдаун!ес!нау!" про разработчиков, нашепчивающих код и врывающегося террориста.
     
  • 2.15, Zenitur (?), 10:33, 24/08/2009 [^] [^^] [^^^] [ответить]  
  • +/
    И Горыныча в винде в 2002-м.
    Или всё же есть что-то ещё?
     
     
  • 3.23, СуперАноним (?), 22:26, 24/08/2009 [^] [^^] [^^^] [ответить]  
  • +/
    Горыныч в Винде каким боком? Вы имели в виду подключение к системному блоку нескольких наборов мониторов, клавиатур, мышей?
     
     
  • 4.25, Sergey_vl (?), 03:03, 25/08/2009 [^] [^^] [^^^] [ответить]  
  • +/
    >Вы имели в виду подключение к системному
    >блоку нескольких наборов мониторов, клавиатур, мышей?

    А мониторы/клавиатуры/мышы каким боком как к "Горынычу", так и к теме? :)

    Про распозновалки тут http://speech-soft.ru/index.php?a=inf&inf=view&id_razdel=1181017375&id_prazde
    Рекомендую взглянуть на "Перпетуум мобиле". :) При хорошем микрофоне достадочно неплохо распознаёт, а далее "эроглиф" (http://www.adelaida.net/hieroglyph/) автоматом правит ошибки/опечатки.

     
  • 3.24, Sergey_vl (?), 02:37, 25/08/2009 [^] [^^] [^^^] [ответить]  
  • +/
    Горыныч - не система распознования голоса, а програмка записывающая с микрофона "шаблоны" и ищющия в них соответствие с входным сигналом... Это мой старый simens me45 мог, причём многим лучше.
    В полуоси было полноценное распознование, в том числе и набор в поддиктовку без предварительного "обучения".
    Небольшой фрагмент, правдо про третью полуось, но про "голос" там есть http://www.archive.org/details/OS2Warp
     

  • 1.16, kegf (ok), 10:49, 24/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    наконец-то с удовольствием поору на свой комп, и сделаю чтобы по восклицанию @#$! он отменял последнее действие.
     
  • 1.17, Аноним (17), 11:07, 24/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В отличие от распознавалки в Висте, презентация которой успешно провалилась, Саймон очень даже неплох для беты.
     
     
  • 2.18, аноним (?), 11:26, 24/08/2009 [^] [^^] [^^^] [ответить]  
  • –1 +/
    несморя на то, что с какого-то хера потерты комментарии, виста весьма прилично распознает английский язык.
     

  • 1.20, Freesplinman (?), 14:33, 24/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    очень даже приятная новость, надо сею фичу заюзать!:)
     
  • 1.21, stamnik (?), 14:49, 24/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Ой, а я сразу вспомнил Экслера:
    http://exler.ru/novels/voice.htm
    )))
     
  • 1.26, OldDiesel (??), 04:35, 26/08/2009 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    1. Все вышеперечисленные программы "Аналоги" для Windows а не для *nix. Данная же софтина под Гном.
    2. Создавалась, на сколько я понял, не для нас с вами, кто может свободно работать с мышкой и клавиатурой, или как минимум может научиться это делать, а для людей с физическими недостатками, которым это может быть действительно трудно. Для остальной публика это игрушка.

    P.S. Если использовать софт для набора текстов.
    Я печатаю в слепую в английской и русской расскладке достаточно быстро. Попробовал сейчас на скорость, чтоб проверить на сколько медленнее печатать чем говорить. Получилось по скорости равно размеренному проговариванию. Я подозреваю что чтобы любая софтина хорошо распознавала, будет необходимо говорить еще медленне и четче. И тут уже вопрос что легче, печатать или наговаривать.
    Подозреваю что текст после придется еще корректировать вручную.

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру