вівторок, 21 серпня 2012 р.

GSoC Midterm report



Ukrainian:

Отже пройдена половина шляху в GSoC проекті "Simon SPHINX support":
як кажуть, час підвести деякі підсумки :). Хоч на початку і були деякі проблеми, пов'язані з браком часу, але зараз розробка йде повним ходом :), і багато чого вже зроблено. Давайте ж подивимося що саме зроблено:
  •  Simon зберігає дані для створення акустичних і мовних моделей у своєму власному форматі. Отже для того щоб HTK або SPHINX могли створювати власні моделі на підставі цих даних, ці дані необхідно привести до зрозумілого їм виду. Отже був створений адаптер, який приводить дані для зрозумілого для SPHINX вигляду;
  •  Наступним кроком було, власне, створення модуля, який за допомогою спеціального ПЗ (sphinxtrain), створює акустичну модель SPHINX;
  • Також архітектура Simon передбачає створення моделі "у фоні". Отже було створено модуль, який працює у окремому потоці і, за допомогою вище названих модулів, створює акустичну та мовну модель з даних Simon;
  • Додана можливість вести розпізнавання, зо допомогою SPHINX, базуючись на створених користувачем моделях;
  • Було додано можливість вибору між двома backend-ами для створення моделей та розпізнавання;
  • Був проведений рефакторинг деяких існуючих модулів Simon (більшою частиною - пов’язаних із новими модулями).
  • Що планується робити надалі:
  • додати підтримку SPHINX у Sam;
  • додати можливість тестування SPHINX моделей;
Які складнощі виникли під час розробки проекту? Ну по перше це критична недостача часу на ранньому етапі. З приводу саме розробки, мабуть - початкове ознайомлення з внутрішнім устроєм Simon.
Але мій ментор оперативно відповідав на усі питання, що зникали, під час цього процесу. Дякую Peter!


English:

So passed half way in the GSoC project, "Simon SPHINX support":
as they say, time to bring some results :). Although at the beginning had some problems with lack of time, but now the development is in full swing :), and much has been done right now. Let us see what is done:
  • Simon saves the data to create acoustic and language models in their own format. So in order to HTK and SPHINX can create their own models based on these data, these data should be converted to the right format. Thus was created an adapter that brings data to clear for SPHINX appearance;
  • The next step was, a module that is using a special software (sphinxtrain), creates an SPHINX acoustic model (at this stage, the quality of models is poor. now i'm working to determine the causes of this.);
  • Simon architecture also provides background model training. Thus was created a module that runs in a separate thread and by using the above mentioned modules, provides acoustic and language model from Simon data;
  • Ability to recognize, using SPHINX back-end, based on models created by the user;
  • Added a choice between two backends for model creation and recognition (in the testing process by now);
  • Carried out refactoring of some existing modules Simon (the most part - associated with new modules).
  • What i'm planing to do next:
  • Add SPHINX support to Sam;
  • Add the ability to test SPHINX models;
What difficulties arose during the project development? Well firstly this is a critical shortage of time at an early stage of project. Regarding the actually development, perhaps - initial familiarization with the internal Simon architecture.But my mentor promptly answered all the questions that disappeared during this process. Thank you Peter!

Немає коментарів:

Дописати коментар