Análise acústica tem sido sugerida como uma ferramenta auxiliar não invasiva e de baixo custo ao diagnóstico de patologias laríngeas. Diversas são as técnicas empregadas, entre as quais técnicas baseadas no modelo linear de produção da fala e na análise dinâmica não linear de sinais de vozes. O primeiro método é baseado na Teoria fonte-filtro, em que a fonte é a laringe e o filtro é o trato vocal. Nesse modelo, os sons surdos são modelados por uma fonte de ruído aleatório e os sons sonoros por um trem de impulsos na frequência fundamental do locutor. Na abordagem não linear são considerados aspectos da voz humana, não explorados no modelo linear, tais como: variação temporal da forma do trato vocal, as ressonâncias associadas à sua fisiologia, as perdas devido ao atrito nas paredes internas do trato vocal, a radiação do som nos lábios, o acoplamento nasal e o comportamento dinâmico associado à vibração das pregas vocais. Neste trabalho são associadas as duas abordagens e avaliado o desempenho na classificação com as características, de forma individual, e a partir da combinação das mesmas. São empregadas oito medidas oriundas da análise dinâmica não linear (dimensão de correlação, quatro medidas de entropia, expoente de Hurst, maior expoente de Lyapunov e o primeiro mínimo da função de informação mútua), além de coeficientes LPC, obtidos a partir da análise preditiva linear. Os resultados sugerem a viabilidade da técnica empregada para a discriminação entre vozes saudáveis e patológicas em geral, como também entre vozes afetadas por patologias laríngeas distintas como edema, nódulos e paralisia nas pregas vocais.
Acoustic analysis has been suggested as a noninvasive aiding and low cost tool for laryngeal disease diagnosis. Several techniques are employed using either the linear model of speech production, or the nonlinear dynamic analysis of voice signals. The first method is based on source-filter theory, in which the source is the larynx and the filter is the vocal tract. In this model, the unvoiced sounds are modeled by a random noise source and the voiced ones by impulse train at the speaker fundamental frequency. In nonlinear approach, aspects of the human voice are considered, not explored in the linear model, such as temporal variation of the vocal tract shape, resonances associated with its physiology, losses due to friction in the vocal tract inner walls, sound radiation in the lips, nose coupling and dynamic behavior associated with vocal fold vibration. This work combines the two approaches and evaluates the performance in classifying the features individually, and from their combination. Eight measures are employed derived from the nonlinear dynamic analysis (correlation dimension, four entropy measures, Hurst exponent, the largest Lyapunov exponent and the first minimum of mutual information function), besides LPC coefficients obtained from linear predictive analysis. The results suggest the feasibility of the employed technique to discriminate between healthy and pathological voices in general, but also among specific laryngeal diseases as vocal fold edema, nodules and paralysis.