Классификация речи по энергии в полосе частот

Энергия вокализованных звуков, обычно, выше энергии невокализованных звуков и пауз. Значение энергии можно найти так

, (4.1)

где x(n) - отсчет речевого сигнала; i1, i2 - границы кадра анализа; KE ‑ нормирующий множитель. KE=3.

Рис. 4.1 Слово "Четыре" диктор мужик: а) осциллограмма начального произнесения; б) функция энергии начального произнесения; в) функция энергии начального произнесения, прошедшего ФНЧ с Классификация речи по энергии в полосе частот частотой среза 1000Гц.

На рис. 4.1 представлены осциллограммы произнесения слова "Четыре", функции энергии начального произнесения и функции энергии начального произнесения, прошедшего через ФНЧ с частотой среза 1000Гц. Энергию вычисляли синхронно с ОТ. Марками 2‑5 показаны границы участков с различным источником возбуждения речевого тракта. Участок сигнала меж марками 2‑3 соответствует шумовому звук "ч Классификация речи по энергии в полосе частот", участок сигнала меж марками 3‑4 соответствует взрывной звук "т", участок 4‑5 соответствует вокализованным звукам "ыре". Стрелкой показана пауза, соответственная смычке "т". Остальная часть звука "т" соответствует взрыву и имеет шумовое возбуждение.

Из рис. 4.1б видно, что звук "ч" имеет энергию, сравнимую с энергией вокализованных звуков. В этом случае проблемно провести Классификация речи по энергии в полосе частот однозначное разделение звуков на тональные и нетональные.

На рис. 4.1в энергия звука "ч" в значимой степени подавлена фильтром нижних частот. В этом случае можно просто отделить шипящий звук "ч" от вокализованных звуков.

Для оценки способности использования энергии сигнала в полосе частот, как признака Т/НТ нужно познание рассредотачиваний энергии для рассматриваемых Классификация речи по энергии в полосе частот классов зависимо от частоты среза ФНЧ. На рисунке 4.2. показаны гистограммы рассредотачивания энергии звуков для полной полосы частот и для ограниченной полосы частот.

На рисунке 4.3 показан процесс выбора частоты среза ФНЧ для ограничения полосы частот обрабатываемого речевого сигнала. По рис. 4.3а видно, что сужение полосы пропускания ФНЧ Классификация речи по энергии в полосе частот до 300Гц приводит к неспешному понижению вероятности ошибки систематизации, а предстоящее сужение полосы пропускания приводит к очень резвому росту вероятности ошибки систематизации. Т.о. частота среза ФНЧ установленного перед вычислением функции энергии должна гарантировать попадание хотя бы одной гармоники ОТ в поло су пропускания ФНЧ, т.е. должна быть более 300 Гц Классификация речи по энергии в полосе частот для исследуемых сигналов. При всем этом, из рис. 4.3б следует, что величина порога систематизации фактически не меняется при частотах среза от 300 Гц, что гласит о том, что порог систематизации по энергии в полосе частот слабо находится в зависимости от частоты среза ФНЧ.


5. Систематизация речи по
частоте скрещения нулевого Классификация речи по энергии в полосе частот уровня

Частоту пересечений нулевого уровня сигналом можно найти как

, (5.1)

где t ‑ продолжительность интервала анализа; m ‑ количество переходов через нулевой уровень за время t.

Рис. 5.1 Частота скрещения нулевого уровня речевого сигнала: а) осциллограмма слова "четыре ", диктор мужик; б) ЧПН сигнала, изображенного на рис. 5.1а.

На рис. 5.1 изображены осциллограмма изолированного слова "четыре" и соответственный ей Классификация речи по энергии в полосе частот график ЧПН. Марки 3,4,5 и 6 установлены на границах интервалов вокализации. Частота пересечений нуля вокализованных звуков ниже частоты пересечений нуля невокализованных звуков.

Атал и Рабинер в работе [11] сделали вывод, что большая часть ошибок систематизации возникают на границе меж тональными и нетональными звуками. В работе [4], также говорится о том, что фактически Классификация речи по энергии в полосе частот все способы систематизации речи по признаку Т/НТ на стационарных интервалах тональных звуков работают с большей надежностью, чем на переходах меж звуками, в особенности тональными и нетональными. Из рис. 5.1б видно, что график признака ЧПН существенно изрезан, как на тональном, так и на нетональном участках. Изрезанность графика ЧПН Классификация речи по энергии в полосе частот гласит о том, что недлинные интервалы анализа при синхронном с ОТ методе вычисления ЧПН недостаточно сглаживают значения ЧПН, единичные случайные скрещения нулевого уровня на маленьких интервалах анализа могут существенно поменять значение ЧПН на данном интервале.


klassifikaciya-sdelok-v-zemelnom-prave.html
klassifikaciya-setej-po-oblasti-dejstviya-po-masshtabu-proizvodstvennogo-podrazdeleniya-po-sposobam-administrirovaniya-po-topologii.html
klassifikaciya-shem-provetrivaniya-viemochnih-uchastkov.html