The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Система распознавания речи Simon перешла под крыло проекта KDE

09.04.2012 13:59

Проект KDE объявил о включении в состав своей экосистемы платформы Simon, в рамках которой развивается система распознавания речи, позволяющая организовать управление десктопом при помощи голосовых команд, без необходимости использования клавиатуры и мыши.

В настоящее время кодовая база Simon уже переведена с Sourceforge в Git-репозиторий KDE. В KDE Extragear создана страница проекта, что ознаменовало успешное прохождение всех тестов на соответствие кода критериям качества KDE и официальное включение Simon в иерархию проектов KDE. Перед включением в Extragear разработчикам Simon потребовалось устранить проблемы, всплывшие после проведения статического анализа кода, также пришлось пройти процесс двухнедельного рецензирования. Связанные с разработкой и поддержкой обсуждения перенесены в список рассылки kde-accessibility и форум KDE Accessibility, который был создан по инициативе разработчиков Simon. В ближайшее время планируется завершить переход на использование системы отслеживания ошибок KDE (миграция задерживается из-за желания перенести все ранее заведённые отчёты об ошибках).

Среди результатов, которых уже удалось добиться, присоединившись к KDE, отмечается привлечение к проекту новых разработчиков. Например, после помещения кода Simon в Git-репозиторий KDE первый патч от нового разработчика был получен спустя всего день. В течение первой недели было осуществлено 54 коммита, к проекту присоединилось 6 новых участников, пять из которых впервые участвуют в разработке Simon. Одновременно был форсирован процесс адаптации новых языков для работы с Simon. Сформирована полноценная поддержка для украинского, шведского, бразильского и португальского языков. Улучшены языковые модели для ранее поддерживаемых языков (чешский, немецкий, голландский, испанский и французский). На различной степени готовности находится поддержка польского, словацкого и ирландского языков. Требуются энтузиасты для начала работы над обеспечением поддержки русского языка.

Процесс распознавания в Simon построен на статических алгоритмах - для начала поддержки нового языка достаточно сформировать акустическую и языковую модели, которые в совокупности составляют речевую модель. Если речевая модель уже создана, для начала распознавания команд достаточно пятиминутной тренировки для адаптации системы к особенностям речи конкретного пользователя. Simon может быть легко адаптирован для голосового управления любым приложением, в том числе для организации голосового ввода текста, что, например, позволяет обездвиженным инвалидам просматривать сайты и отправлять электронные сообщения. Из интересных проектов, реализованных на базе Simon можно отметить робота ECHORD для помощи по дому и медиа-центр для дома престарелых.



  1. Главная ссылка к новости (http://dot.kde.org/2012/04/08/...)
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/33562-simon
Ключевые слова: simon, speech, recognition, kde
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (41) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, reboot (?), 15:10, 09/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    кстати, распознование речевых команд было еще аж в 1996 году в OS/2... но с тех пор как-то не прижилось.

    то, что перешло под крыло КДЕ, по-моему, не совсем хорошо. обложат ненужными "перделками" и зависимостями.

     
     
  • 2.4, Викрам (?), 15:16, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    главное, чтобы работало и было просто в настройке. Я как-то пытался его юзать так и неудалось его заставить его что-то распознавать, бум надеяться что после присоединения к кде его допилят до юзабельного состояния
     
     
  • 3.5, reboot (?), 15:22, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    еще неплохо было бы если бы оно работало и тогда, когда КДЕ/ГНОМ не используешь... тянуть кучу софта от КДЕ только для одной распознавалки - не очень удобно.
     
     
  • 4.8, Аноним (-), 15:40, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Что значит "когда КДЕ не используешь", если это часть КДЕ? Ставь, значит, другое решение, которое не привязано к таким ДЕ... Либо осиль и напиши свое.
     
     
  • 5.19, rshadow (ok), 17:28, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    QT по твоему тоже должно циклически от КДЕ зависеть? Низкоуровневые либы еще никто не отменял.
     
     
  • 6.21, Анонимуз (?), 17:47, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    А что, Qt уже тоже "перешла под крыло проекта KDE"?
     
  • 6.29, Аноним (-), 01:33, 10/04/2012 [^] [^^] [^^^] [ответить]  
  • –5 +/
    При чём тут QuickTime???
     
     
  • 7.31, jesust (?), 09:30, 10/04/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    фанатики не могут в контекст и ищут только к чему бы прицепиться?
     
     
  • 8.40, arisu (ok), 18:31, 12/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    мы можем мы просто вполне обоснованно сомневаемся в том, что человек, не знающи... текст свёрнут, показать
     
  • 3.6, Аноним (-), 15:26, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Допилят до уровня плазмы, аконади и непомука.
     
     
  • 4.10, антоним (?), 15:45, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Допилят до уровня плазмы, аконади и непомука.

    К плазме никаких претензий, но к списку выпиливаемых юзерами в первую очередь, но прибиваемых девелоперами гвоздями к кде фишек (аконади / непомук), теперь похоже добавится и симон.

     
     
  • 5.25, омоним (?), 21:39, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    >> Допилят до уровня плазмы, аконади и непомука.
    > К плазме никаких претензий, но к списку выпиливаемых юзерами в первую очередь,
    > но прибиваемых девелоперами гвоздями к кде фишек (аконади / непомук), теперь
    > похоже добавится и симон.

    А вот сие уже печально.

     
  • 4.37, Аноним (-), 17:25, 11/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > плазмы, аконади и непомука.

    Т.е. до уровня невыпиливаемости? O_O. Я уже и так свалил с кед потому что мне не нужен мускуль для хранения пары десятков контактов. Вместе с аконадями и непоймуками. Лучше пусть пульт управления ядерными ракетами встроят если совсем уж нефиг делать.

     
  • 2.7, Вы забыли заполнить поле Name (?), 15:35, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >то, что перешло под крыло КДЕ, по-моему, не совсем хорошо. обложат ненужными "перделками" и зависимостями.

    то, что перешло под крыло КДЕ, по-моему, очень хорошо. будет прямая безкостыльная интеграция со всеми приложениями родной среды.

    >"перделками"

    Кто о чём, а гномер о перделках

     
     
  • 3.9, pekwm_user (?), 15:45, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    простите, но я не гномер, и вообще пользуюсь старым-добрым WM без навороченных граф. сред (зачем мне Kate/Kmail когда есть Vim/Mutt). Кстати, удобства и эстетики побольше будет, о не говоря уж о простоте (KISS).

    Что до интеграции с родной средой, опять-таки, она не для всех "родная". Не надо всех мерить одним аршином. То, что к проекту подключится много народу - это хорошо, а вот то, что (глядя на монструозность графических окружений) накодят лишнего - это как пить дать...

     
     
  • 4.12, Аноним (-), 16:36, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Ратующие за консоль когда-нибудь объяснят, почему обычный пользователь должен вникать в дебри команд, их ключей и прочего, вместо простого использования флажков и кнопок?
     
     
  • 5.13, arisu (ok), 16:42, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +3 +/
    ратующие за русский язык когда-нибудь объяснят, почему обычный пользователь должен вникать в дебри правил, их применения и прочего, вместо простого использования всем понятного «ыыыыы», «ааааа», «эээээ» и «пнх!»?
     
  • 5.14, гость (?), 16:51, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > Ратующие за консоль когда-нибудь объяснят, почему обычный пользователь должен вникать
    > в дебри команд, их ключей и прочего, вместо простого использования флажков
    > и кнопок?

    И как это отвечает на вопрос о том, что КДЕ всем не нужен ? Распотрашить проект на либы, а потом пусть уже делают нужную морду под любую де - вот это правильный выход.

     
  • 5.16, R (?), 17:02, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Ратующие за консоль когда-нибудь объяснят, почему обычный пользователь должен вникать
    > в дебри команд, их ключей и прочего, вместо простого использования флажков
    > и кнопок?

    Я попробую.
    Если рассмотреть в исторической перспективе развитие человеческого общения, то мы увидим очень интересную штуку: сначала общались жестами, потом - наскальная живопись (пиктограммы), потом возникла письменность. Правда, и жесты ;) и пиктограммы тоже иногда используются.
    Если посмотреть на развитие общения человек-компьютер - то увидим, что процесс идет почти "с точностью до наоборот". Сначала общались с помощью урезанной письменной речи (так нелюбимая Вами консоль), потом перешли на пиктограммы (причем, сами не рисуем, просто тыкаем в предложенном наборе), а теперь и вообще, до жестов опустились ;)
    Безобразие! ;)
    А если серьезно, то в консоли проще объяснить компьютеру почти человеческой речью, а чего же мы, собственно, от него хотим, чем показывать "на мигах". Ну да, речь приходится учить английскую. Мы ж собственные отечественные разработки (да ту же Рапиру возьмите) забросили - значит, сами ж и виноваты. Не нравится общаться на английском - никто ж не мешает создать русскоязычную среду по образу и подобию BASH, например. И будет у нас какой-нибудь ЕОБС ;) (Еще Одна Борновская Среда) с русскими командами и русскими сообщениями.

     
     
  • 6.17, незнайка (??), 17:16, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    хорошо сказал! :-)))
     
     
  • 7.20, анонимс (?), 17:34, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Так оптель - узайте фидо - найух хтмл - этож лишние навороты да и ресурсы жрет неимоверно и трафик, лишние свистоперделки
     
  • 6.22, Аноним (-), 17:58, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    плохо сказал, ведь если подумать немного, то станет ясным, что упрощение взаимодействия с пользователем было нужным для увеличения аудитории, снижая порог вхождения. И ещё ,напоследок, предположения об отсутствии использования людьми речи во время создания наскальной живописи проверить нельзя, а потому истиной не считаются.
     
  • 6.23, жабабыдлокодер (ok), 19:02, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +6 +/
    Вааще-то, консоль гую  отнюдь не противоположность, они друг друга дополняют. Если речь идет о типовых, регулярно выполняемых операциях - там рулят консольные команды. Там, где нужно один раз что-то сделать и забыть на долгое время - там лучше использовать гуй. Сравните, для примера, ман на двадцать листов, с одним окошком.
    И, вааще, само участие в холиваре "гуй против консоли" на одной стороне может свидетельствовать только о недостатке профессионализма.
     
  • 6.27, Fazer (?), 23:32, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Это у вас гдето так разбирался человек? Аххх да, да, Дарвин. Ну ну. А консоль сила, хотя выбор должен быть.
     
     
  • 7.28, Fazer (?), 23:37, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Т9 мать его:) *развивался
     
  • 5.38, Аноним (-), 17:29, 11/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > вместо простого использования флажков и кнопок?

    Потому что когда тебе надо чуть больше чем хватило фантазии у разработчиков, в консоли можно сгруппировать программы, подав одним на вход вывод других и получить то что надо. В гуе - жесточайше обламываемся и курим бамбук. Или в лучшем случае идем изучать ...цатиметровый код программы являющей собой швейцарский нож на все случаи жизни. Что немного утомительно.

    Ну вот например я бы не отказался от speech recognizer для умных девайсов с пингвином на борту. Это не значит что мне там нужны кеды, флажки и кнопочки. А ничего что допустим робот может просто не оперировать такими сущностями? :)

     
  • 2.32, KBAKEP (ok), 16:20, 10/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Если углубляться в историю, то у Apple это было в 1993 (PlainTalk). А синтез речи с 1984 (MacInTalk).
     
  • 2.33, kurokaze (ok), 16:34, 10/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >то, что перешло под крыло КДЕ, по-моему, не совсем хорошо. обложат ненужными "перделками" и зависимостями.

    Это только в фантазиях ДЕ-фатаиков

     
     
  • 3.39, Аноним (-), 17:29, 11/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > ДЕ-фатаиков

    А это кто такие? Какое-то новое слоово в науке и технике...

     
  • 2.34, Аноним (-), 17:19, 11/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > кстати, распознование речевых команд было еще аж в 1996 году в OS/2...
    > но с тех пор как-то не прижилось.

    Обычные интерфейсы оказались удобнее и быстрее. Но в ряде применений (например, роботы) оно могло бы даже не так уж плохо смотреться.

     
  • 2.43, zerot (ok), 14:22, 15/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    почему не прижилось. английская версия распознавалки во "вражеской" операционке неплохо зарекомендовала себя при вводе текстов в ворде ... если сделают нормальную распознавалку с поддержкой русского в юниксах - это будет гут
     

  • 1.15, antiroot (?), 17:00, 09/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Замечательная новость
     
     
  • 2.35, Аноним (-), 17:21, 11/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Замечательная новость

    Такой проект по уму должен быть просто движком, а кеды и прочие донавешиваться светху. А кдешники чего доброго обвесят все своими кутями и кделибсами, вот нафиг нужно такое счастье?

     

  • 1.18, faithman (??), 17:21, 09/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Это плохо, RIP!

    Лучше отдельный сервис и фронтенды под разные среды, в том числе WM. KDE отдаляется от остальной программной среды GNU/Linux став больше чем DE, вбирая в себя всё больше приложений. Да, он будет модульный, но такой подход однозначно не поддерживаю.  

     
     
  • 2.26, NavDotRu (?), 21:49, 09/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Если посмотреть исходники, то видно, что GUI и распознавание речи там отлично разнесены. И распознавательная часть очевидно является более сложной задачей. Так что желающие дописать фронтенд для интеграции в их любимую ДЕ с большими проблемами не встретятся.
     
  • 2.30, хренсгары (ok), 09:04, 10/04/2012 [^] [^^] [^^^] [ответить]  
  • +4 +/
    >Лучше отдельный сервис и фронтенды под разные среды, в том числе WM. KDE отдаляется

    Возьми код, раздели. Если будет что-то толковое, то и КДЕ подхватят. А пока вы только стонете, КДЕ берет и делает так как им надо, и тупые сопли стонот их волновать не должны.

     

  • 1.24, Аноним (-), 19:47, 09/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Где-то в году 2009 я писал обзор Симоны. На тот момент авторы Симон рассказывали, что их проект полностью завязан на библиотеке KDE4, так как они не видят смысла изобретать свой велосипед. Ну вот собственно и логическое продолжение. На самом деле это большой плюс, а именно: поддержка сообщества, техническая и в какой-то мере финансовая. На тот момент мне удалось поработать с версией 0.2 и к моему удивлению система распознавания речи корректно понимала простые слова, и даже фразы. KDE быстро развивается, стал более легкий, универсальный. Понимает сенсорные жесты, а теперь и будет управляться простыми голосовыми командами.

    Так что пожалуйста не нойте, всё будет хорошо!

     
     
  • 2.36, Аноним (-), 17:23, 11/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Так что пожалуйста не нойте, всё будет хорошо!

    А можно сие выдернуть и юзать отдельно от кед? А то "система распознавания голоса + кеды" мне никуда не уперлась. А вот "система распознавания голоса" - могла б и пригодиться в принципе. Для развлечений типа роботов, в которых никакими кедами и не пахнет.

     
     
  • 3.44, АлеВ (?), 12:47, 21/08/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Так ведь можно использовать Сфинкс- являющийся движком распознавателя, без оболочки Симоны. Но в этом случае резко осложнится настройка и прочие вещи. Не нравится Симона, делайте для своей любимой DE свою оболочку, или пишите скрипты или используя ncursesw консольные приложения на С++, Pythone или на чем заблогарассудится. Симона оболочка, заточенная на КДЕ к Сфинксу с дополнительными возможностями, поэтому нечего стонать- пишите свою оболочку к Сфинксу.
     
  • 2.41, arisu (ok), 18:32, 12/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > стал более легкий

    отличная шутка!

     

  • 1.42, Аноним (-), 20:26, 13/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    как часть accessibility очень даже логично, думаю там самое место, для тех кому действительно необходимо. а конструктор сочинить никто не запрещает.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру