Chapter 4.3 Audio interfaces. Add subsections and key concepts (ostis…

…-ai#215) * feat: add subsections and key concepts * Update author/part4/chapter_audio_interfaces.tex --------- Co-authored-by: Daniil Shunkevich <shu.dv@tut.by>
NikitaZotov · Apr 3, 2023 · 6370076 · 6370076
1 parent d732503
commit 6370076
Showing 1 changed file with 31 additions and 12 deletions.
diff --git a/author/part4/chapter_audio_interfaces.tex b/author/part4/chapter_audio_interfaces.tex
@@ -21,30 +21,46 @@ \chapter{Аудиоинтерфейс ostis-систем}
 
 \bigskip
 
+\begin{scnrelfromlist}{подраздел}
+    \scnitem{\ref{sec_audio_interfaces_review}~\nameref{sec_audio_interfaces_review}}
+    \scnitem{\ref{sec_audio_interfaces_ostis_approach}~\nameref{sec_audio_interfaces_ostis_approach}}
+    \scnitem{\ref{sec_audio_interfaces_subject_area_problems}~\nameref{sec_audio_interfaces_subject_area_problems}}
+    \scnitem{\ref{sec_audio_interfaces_subject_area_signal_models}~\nameref{sec_audio_interfaces_subject_area_signal_models}}
+    \scnitem{\ref{sec_audio_interfaces_conclusion}~\nameref{sec_audio_interfaces_conclusion}}
+\end{scnrelfromlist}
+
+\bigskip
+
 \begin{scnrelfromlist}{ключевое понятие}
-    \scnitem{аудио интерфейс интеллектуальных компьютерных систем}
-    \scnitem{речевой интерфейс интеллектуальных компьютерных систем}
-    \scnitem{цифровая обработка сигналов}
-    \scnitem{обработка речевых сигналов}
+    \scnitem{сигнал}
+    \scnitem{звуковой сигнал}
+    \scnitem{речевой сигнал}
+    \scnitem{модель сигнала}
+    \scnitem{аудиоинтерфейс}
+    \scnitem{речевой нтерфейс}
 \end{scnrelfromlist}
 
 \bigskip
 
 \begin{scnrelfromlist}{библиографическая ссылка}
-        \scnitem{\scncite{Pearl2016}}
-        \scnitem{\scncite{Chen2021audio}}
-        \scnitem{\scncite{Lu2002content}}
-        \scnitem{\scncite{Fernandes2022}}
+    \scnitem{\scncite{Pearl2016}}
+    \scnitem{\scncite{Chen2021audio}}
+    \scnitem{\scncite{Lu2002content}}
+    \scnitem{\scncite{Fernandes2022}}
+    \scncite{\scncite{Popov2020interspeech}}
+    \scncite{\scncite{Povey2011ASRU}}
+    \scncite{\scncite{Deepa2021}}
 \end{scnrelfromlist}
 
 \end{SCn}
 
 
-\section{Анализ существующих подходов к разработке аудиоинтерфейсов интеллектуальных компьютерных систем}
+\section{Введение в \textit{Главу \ref{chapter_audio_interfaces}~\nameref{chapter_audio_interfaces}}}
+\label{sec_audio_interfaces_review}
 
-Разговорная речь является одной из наиболее естественных и эффективных форм передачи информации между людьми. Этот факт объясняет значительный интерес исследователей к вопросам развития и применения речевых интерфейсов для обеспечения человеко-машинного взаимодействия в составе современных коммуникационных, мультимедийных и интеллектуальных систем (см. \scncite{Pearl2016}, \scncite{Chen2021audio}).
+Разговорная речь является одной из наиболее естественных и эффективных форм передачи информации между людьми. Этот факт объясняет значительный интерес исследователей к вопросам развития и применения \textit{речевых интерфейсов} для обеспечения человеко-машинного взаимодействия в составе современных коммуникационных, мультимедийных и интеллектуальных систем (см. \scncite{Pearl2016}, \scncite{Chen2021audio}).
 
-Более всеобъемлющей формой обеспечения взаимодействия с пользователем и окружающей средой посредством анализа и синтеза акустических сигналов является аудиоинтерфейс. Данную разновидность интерфейса, выступающей родительской по отношению к речевым, можно кратко определить  как аппаратно-программный комплекс осуществляющий анализ и синтез сигналов во всем доступном спектре параметров носителей акустической информации. Например, для решения задач анализа обстановки и событий происходящих в акустическом окружении системы, синтеза  неречевых сигналов (звуков техногенного и природного характера, сигналов оповещения, музыки, и т.д.) (см. \scncite{Lu2002content}).
+Более всеобъемлющей формой обеспечения взаимодействия с пользователем и окружающей средой посредством анализа и синтеза акустических сигналов является \textit{аудиоинтерфейс}. Данную разновидность интерфейса, выступающей родительской по отношению к речевым, можно кратко определить  как аппаратно-программный комплекс осуществляющий анализ и синтез сигналов во всем доступном спектре параметров носителей акустической информации. Например, для решения задач анализа обстановки и событий происходящих в акустическом окружении системы, синтеза  неречевых сигналов (звуков техногенного и природного характера, сигналов оповещения, музыки, и т.д.) (см. \scncite{Lu2002content}).
 
 Об актуальности направления разработки аудио и речевых интерфейсов  свидетельствуют следующие основные тенденции развития данного направления:
 \begin{textitemize}    
@@ -73,6 +89,7 @@ \section{Анализ существующих подходов к разраб
 
 
 \section{Применение принципов онтологического проектирования при разработке аудиоинтерфейсов}
+\label{sec_audio_interfaces_review}
 
 Для достижения поставленной цели предлагается прибегнуть к подходу на основе принципов лежащих в основе ``Стандарта открытой технологии онтологического проектирования, производства и эксплуатации семантически совместимых гибридных интеллектуальных компьютерных систем'' или кратко ``Стандарта технологии OSTIS'' (см. \scncite{Standart2021}).
 
@@ -109,7 +126,7 @@ \section{Применение принципов онтологического
 	\end{scnrelfromset}
 \end{SCn}
 
-Согласно общим принципам организации интерфейсов ostis-систем, изложенным в  \textit{Главе\ref{chapter_interfaces}}, аудио- и речевой интерфейс относятся к подмножеству SILK-интерфейсов \textit{пользовательских интерфейсов} \textit{интеллектуальных компьютерных систем}. 
+Согласно общим принципам организации интерфейсов ostis-систем, изложенным в  \textit{Главе\ref{chapter_interfaces} \nameref{chapter_interfaces}}, \textit{аудио- и речевой интерфейс} относятся к подмножеству SILK-интерфейсов \textit{пользовательских интерфейсов} \textit{интеллектуальных компьютерных систем}. 
 
 Для решения задачи построения пользовательского интерфейса в базе знаний
 пользовательского интерфейса ostis-системы необходимо наличие \textit{sc-модели} компонентов \textit{пользовательского интерфейса}, интерфейсных действий пользователей, а также классификации пользовательских интерфейсов
@@ -134,6 +151,7 @@ \section{Применение принципов онтологического
  Далее перейдём непосредственно к рассмотрению конкретных предметных областей и построению онтологии аудиоинтерфейса.
 
 \section{Предметная область и онтология задач аудиоинтерфейса ostis-систем}
+\label{sec_audio_interfaces_subject_area_problems}
 
 Первым шагом на пути к построению базы знаний подсистемы аудиоинтерфейса \textit{интеллектуальных компьютерных систем нового поколения} является формализация онтологии верхнего уровня. В основе данной онтологии предлагается положить формализованное представление основных сущностей предметной области и их свойств, а также функциональных задач, которые аудио и речевой интерфейс призваны решать. 
 
@@ -440,6 +458,7 @@ \section{Предметная область и онтология задач а
 
 
 \section{Предметная область и онтология моделей параметрического представления сигнала}
+\label{sec_audio_interfaces_subject_area_signal_models}
 
 Все вышеперечисленные задачи взаимосвязаны, поскольку относятся к одному и тому же объекту исследования – речевому сигналу. Решение каждой из них непосредственно либо косвенно зависит от эффективности моделирования речи как сложного феномена в различных аспектах: параметрическое представление речевого сигнала и выделение его свойств, моделирование процесса фонации, восприятия и интерпретации содержания речевого сообщения (в том числе фонетического, смыслового, эмоционального). Это делает создание универсальных способов обработки речевых сигналов перспективным научным направлением.
 В контексте перечисленных задач моделирование речи можно условно разделить на три уровня: