| Home | E-Submission | Sitemap | Editorial Office |  
top_img
Korean Journal of Otorhinolaryngology-Head and Neck Surgery > Volume 43(1); 2000 > Article
Korean Journal of Otorhinolaryngology-Head and Neck Surgery 2000;43(1): 80-85.
A Comparative Acoustic Study of Voice Rehabilitation After Total Laryngectomy.
Hyun Min Park, Bong Hyung Song, Hyun Soo Moon, Dae Hyun Kim, Cheol Woo Jo, Woo Young Shim, Seu Gyu Kim, Moo Jin Baek, Hwan Jung Roh, Eui Kyung Goh, Kyung Myong Chon, Soo Geun Wang
1Department of Otolaryngology, College of Medicine, Pusan National University, Pusan, Korea.
2Department of Control & Instrumentation Engineering, Changwon National University, Korea.
3Department of Otolaryngology, Choon Hae Hospital, Pusan, Korea.
4Department of Otolaryngology, College of Medicine, Sungkyunkwan University, Masan Samsung Hospital, Masan, Korea.
5Department of Otolaryngology, College of Medicine, Inje University, Pusan Paik Hospital, Pusan, Korea.
후두전적출술후 재활음성의 음향학적 연구
박현민1 · 손봉형1 · 문현수3 · 김대현2 · 조철우2 · 심우영1 · 김서규4 · 백무진5 · 노환중1 · 고의경1 · 전경명1 · 왕수건1
부산대학교 의과대학 이비인후과학교실1;창원대학교 제어계측공학과2;춘해병원 이비인후과3;성균관대학교 의과대학 마산삼성병원 이비인후과학교실4;인제대학교 의과대학 부산백병원 이비인후과학교실5;
주제어: 후두전적출술후음향학적 연구.
ABSTRACT
BACKGROUND AND OBJECTIVES:
Acoustic parameters of maximal phonation time, sound intensity, fundamental frequency, voice range, jitter and shimmer were analyzed in order to evaluate voice quality and differences among esophageal speech (ES), tracheoesophageal shunt speech (TES), pneumatic aid speech (PA), electrolaryngeal speech (EL) according to phonetic rehabilitation methods in 16 cases of laryngectomees.
MATERIALS AND METHODS:
We acquired acoustic data on alaryngeal voice by different methods, and analysed each of those using specially designed programs (Laryngeal analyser V1.0 base on Matlab V5.0).
RESULTS:
Maximal phonation time was significantly longer in TES voice and PA speech than in ES voice (p<0.05). Jitter and shimmer were significantly regular and stable in the EL and PA speech than in the ES and TES voice (p<0.05). Voice range was significantly wider in TES voice and PA speech than in EL and ES voice (p<0.05). In two cases capable of bi-modal speech of ES and TES voice, maximal phonation time was longer with wider voice range in TES voice than in ES voice. Jitter and shimmer were regular and stable in ES voice than in TES voice.
CONCLUSION:
PA speech displays phonetically more natural laryngeal speech than other rehabilitation methods. But this methods is inconvenient and cosmetically unacceptable, because patients have to bite intraoral vibrator in the patient's mouth. So, we recommend TES voice rather than ES voice, without the use of speech-making device such as EL and PA speech.
Keywords: Alaryngeal voiceAcoustic analysisLaryngectomees

서     론

   

   1873년 후두전적출술을 처음 시행한 이래 후두 기능의 상실로 인한 장애에 대한 관심이 높아지면서 보다 나은 음성재활을 위한 많은 연구가 진행되었다. 후두전적출술후 음성재활법은 크게 공기를 이용하는 방법과 전기를 이용하는 방법으로 나눌 수 있다. 공기를 이용하는 방법에는 식도발성과 폐공기를 이용하는 방법으로 기관식도발성이 있으며 전기를 이용한 방법으로 전기후두발성이 있다. 그러나 이러한 음성은 정상적인 발성과는 청각심리학적, 음향학적으로 상당한 차이가 있다. 1993년 Baek 등1)은 음성재활에 의한 발성이 정상발성에 비해 명료도에 있어서 의미있는 차이가 있었다고 하였으며 이는 수술로 인한 성도의 변형과 음원의 변화로 음의 고저조절이 어렵고 음의 강도가 감소되며 발성시간이 감소된 것에 기인된 것이라고 보고하였다. 재활음성에 대한 수많은 연구에도 불구하고 음향학적 분석 보고는 미미한 실정이다. 이는 재활음성이 주파수가 매우 낮고 가성대의 진동이 매우 불규칙하여 기존의 음성분석기기로는 측정하기 힘들기 때문이었다.
   본 연구에서는 저자가 고안한 프로그램을 이용하여 각각의 음성재활방법에 따른 음성의 음향학적, 공기역학적 변수를 측정하여 재활음성을 분석하고 어떤 발성이 가장 자연스러운지를 알고 또한 기관식도발성과 식도발성이 동시에 발성가능한 환자에서도 음향학적인 차이를 비교하고자 하였다.

대상 및 방법


   부산대학교병원에서 후두전적출술후 음성재활을 시행받은 식도발성과 기관식도발성이 동시에 가능한 2명을 포함한 16명을 대상으로 하였으며 평균 전기후두발성군(electrolaryngeal speech,EL), 인공후두발성군(pneumatic aid speech,PA), 기관식도발성군(tracheoesophageal shunt speech,TES), 식도발성군(esophageal speech,ES)으로 분류하였다(Table 1).
   모든 대상은 술후 평균 2.3년이 지난 환자로 모두 남자였으며 평균연령은 전기후두발성군은 63.3세, 기인공후두발성군은 66.7세, 기관식도발성군은 58.8세, 식도발성군은 62.3세였다. 술후 방사선 치료를 받은 환자는 식도발성군 2예와 전기후두발성군 1예에서 있었다. 전기후두발성군의 환자들이 사용한 전기후두는 Servox type speech aid를 사용하였으며 인공후두발성군은 pneumatic speech aid(Tokyo type)을 사용하였다. 기관식도발성군은 Amatu 술식을 이용하여 기관식도누공을 재건하였다.
   재활음성의 분석은 최대발성지속시간(Maximal phonation time, sec), 음의 강도(Sound intensity, dB), 기본주파수(Fundamental frequency, Hz), 음역(Voice range), jitter(%), shimmer(%)의 변수2)를 사용하였다. 방음실에서 피검자에게 숨을 깊게 들어마시게 한 후 모음 /a/와 /i/를 편안한 상태, 저음 및 고음으로 각각 3회씩 연속하여 발성토록하여 녹음한 후 녹음된 음성을파형분석 및 계측프로그램 저작도구를 기반으로 하여 저자가 고안한 Laryngeal analyser(Mathworks사의 Matlab® V5.1)를 이용하여 분석하였다(Fig. 1). 본 프로그램은 소음이 심한 음이나 주파수가 낮은 음에서도 정점을 인위적인 방법으로 찾아내어 분석이 가능하여 기존의 음성 분석기로는 분석이 불가능한 음성재활환자군에서도 분석이 가능하다. 녹음된 음성은 16 KHz의 sampling rate로 채취하였고 음성 표본중 비교적 안정적인 목소리의 일부분을 채택하였다. Laryngeal analyser의 방법을 기술하면 다음과 같다. 화면에 나타난 웨이브(Wave)의 각각의 정점을 컴퓨터가 표시하면 검사자가 직접 화면에서 최정점(highest peak point)으로 간주되는 20개에서 30개의 점을 선택한 후 확인하면 Laryngeal analyser 프로그램에 미리 입력된 jitter, shimmer, 기본주파수의 연산식2)에 대입하여 계산되도록 하였다(Fig. 2).
기본주파수(Fo), jitter, shimmer의 연산식은 다음과 같다.

   (1) Fo(Hz) = 1/N N∑i=1 Fo(i)
      Fo(i)=1/To(i) - period-to-period fundamental frequency
      T0(i), i=1,2....N-extracted pitch period data
      N=PER - number of extract pitch periods
   (2)  Jitter(%)=1/N-1 N-1∑i=1|T0(i)-T0(i+1)|/1/N-1 N∑i=1 T0(i)
      T0(i), i=1,2....N-extracted pitch period data
      N=PER - number of extract pitch periods
   (3)  Shimmer(%)=1/N-1 N-1∑i=1|A(i)-A(i+1)|/1/N-1N∑i=1 A(i)
      A(i), i=1,2....N-extracted peak to peak amplitude data
      N=number of extracted impulses
   

   그 외 음의 강도는 Sound level meter (LA220, Onosokki Japan)로 측정하였고 최대발성지속시간은 초시계로 측정하였다. 분석된 음성데이터는 통계프로그램인 SPSS (v7.5)로 짝지은 표본검사(paired samples test)로 통계처리하였으며 p값이 0.05 미만인 경우에 한해 유의성이 있다고 하였다.

결     과


최대발성지속시간(Maximal phonation time, sec)

   /a/와 /i/ 모두에서 기관식도발성군, 인공후두발성군, 식도발성군순으로 길었으며 기관식도발성군과 인공후두발성군 사이에는 통계학적인 차이는 없었다. 식도발성군과 기관식도발성군, 식도발성군과 인공후두발성군간에 통계학적으로 유의한 차이가 있었고(p<0.05) 각 군간 발성법에 따른 차이는 없었다(Table 2).

음의 강도(Sound intensity, dB)

   /a/와 /i/ 모두에서 인공후두발성군, 기관식도발성군, 전기후두발성군, 식도발성군순으로 강한 경향을 보였으나 각 군간의 통계학적으로 유의한 차이는 없었고 각 군간 발성법에 따른 차이는 없었다(Table 2).

기본주파수(Fundamental frequency, Hz)

   /a/ 발성시 인공후두발성군, 전기후두발성군, 기관식도발성군, 식도발성군순의 경향이었으나 각 군간에는 의미있는 차이가 없었다.
   /i/ 발성시 인공후두발성군, 식도발성군, 전기후두발성군, 기관식도발성군순의 경향이었으나 각 군간에는 의미있는 차이가 없었다(Table 2).

Jitter(%)

   /a/와 /i/ 모두에서 전기후두발성군, 인공후두발성군, 식도발성군, 기관식도발성군순으로 안정된 양상을 나타내었고 전기후두발성군와 인공후두발성군에서 규칙적인 양상을 나타내었으며 불규칙한 양상을 보인 식도발성군과 기관식도발성군과는 의미있는 차이를 나타내었다(p<0.05)(Table 2).

Shimmer(%)

   /a/와 /i/ 모두에서 전기후두발성군, 인공후두발성군, 기관식도발성군, 식도발성군순이었으며, 규칙적인 양상을 나타낸 전기후두발성군, 인공후두발성군과 불규칙한 양상을 나타낸 식도발성군과 기관식도발성군과는 의미있는 차이를 나타내었다(p<0.05)(Table 2).

음역(Voice range)

   /a/ 발성시 기관식도발성군과 인공후두발성군에 있어서는 고음과 저음 발성시에 의미있는 차이가 있었다(p<0.05).
   /i/ 발성시 인공후두발성군에 있어서는 고음과 저음 발성시에 의미있는 차이가 있었다(p<0.05)(Table 2).

기관식도발성과 식도발성이 모두 가능한 2예의 발성별 비교

   /a/ 발성의 비교에서 최대발성지속시간은 기관식도발성군이 길었으나 음의 강도는 차이가 없었다. 기본주파수는 기관식도발성군과 식도발성군에서 차이가 없었으나, 음역은 기관식도발성군이 다소 양호한 양상을 보였으며 jitter와 shimmer는 식도발성군이 기관식도발성군에 비해 안정된 양상을 나타내었다.
   /i/ 발성의 비교에서는 최대발성지속시간에서 기관식도발성군이 길었으며 음의 강도는 식도발성군이 약간 높았다. 또한 기본주파수는 기관식도발성군과 식도발성군에서 차이가 없었으며, 음역은 기관식도발성군이 다소 양호한 양상을 보였고 jitter와 shimmer는 식도발성군이 기관식도발성군에 비해 보다 안정된 양상을 보였다(Table 3).

고     찰


   1873년 Billroth가 처음으로 후두암에 대해 후두전적출술을 시행한 이래 후두적출로 인한 후두기능의 상실은 기능적, 사회적으로 심각한 장애를 초래하고 이로 인한 심리적 장애는 질병에 대한 치료 이상으로 고려되어졌다. 따라서 이러한 환자의 음성보존을 위한 여러 수술방법이 제시되고 그것의 음향학적인 장점에 대한 보고가 많이 되고 있다.3) 폐공기를 이용한 수술적 방법으로서 안전하고 효과적인 것으로 식도발성과 기관식도발성법등이 있고4)5) 이러한 수술적 방법의 적응이 되지 못하는 경우에 전기후두발성과 인공후두발성(pneumatic speech aid)를 이용하게 된다.5-7)
   식도발성은 흡입법(inhalation methods)과 주입법(injection methods)을 통하여 발성하게 되며 흡입법은 흡기운동과 비슷하게 윤상인두괄약근이 이완되면서 횡경막의 하강으로 흉곽내가 음압이 되면서 식도내로 공기가 들어오게 되어 발성을 하게 되며 주입법은 공기를 의도적으로 삼켜 식도내로 주입하여 발성하는 방법이며 숙련된 식도발성자는 주로 흡입법을 사용한다.4)6) 기관식도발성은 기관과 식도 혹은 인두 사이에 수술 혹은 보철(prosthesis)을 이용하여 션트를 만들어 하인두와 식도의 경계부위, 즉 4번째 경추와 6번째 경추 사이의 인두괄약근으로 구성되는 위성대에 일정한 압력으로 공기를 보냄으로서 발성하게 되는 방법이며 언어의 습득을 위해 특별한 훈련이 필요하지 않고 언어습득이 빠른 장점이 있다.4)5) 전기후두는 전지로 진동판을 진동시켜 윙-윙 소리를 내도록 하고 이것을 경부에 부착시켜 그 음이 인두로 전달되게 하여 발성케 하는 장치이다. 이것은 경부형(neck type)과 구강형(mouth type)으로 나눌수 있다. 이 방법은 치유와 관계없이 조기에 사용이 가능하고 빨리 배울 수 있는 장점이 있으나 음이 너무 단조롭고 음량이 작다는 결점이 있다.5) 인공후두란 기도와 구강을 진동장치가 장착된 언어보조기로 연결하여 발성하는 장치로서 사용하기 편리하고 쉽고 빨리 음성을 배울수 있으며 음의 질이 우수한 것이 장점이나 항상 입에 튜브를 물고 있어야 하기 때문에 미용상 좋지 못하다.5)
   음성재활방법별 최대발성지속시간을 보면 Christensen과 Weinberg8)는 식도발성군과 정상군과의 비교에서 자음(consonant)이 없는 단순모음발성시 모음발성시간은 정상인보다도 길었으며 이것은 모음발성시 산소공급의 감소에 대한 보상작용이 없기 때문인 것으로 추정하였다. Pindazola와 Cain4)은 기관식도발성과 식도발성, 정상인의 비교에서 최대발성지속시간, 1음절 및 2음절 발성능력은 기관식도발성이 정상군보다 더 우수하였다고 보고하였으나 본 연구에서는 인공후두발성과 기관식도발성이 식도발성보다 의미있게 길었으나 정상치보다는 낮았다. 전기후두발성은 폐 혹은 식도공기를 사용하지 않기 때문에 시간의 측정이 불가능하며, 인공후두발성과 기관식도발성의 경우는 폐공기를 이용함으로서 정상인보다는 못하지만 적은 폐공기를 이용하는 식도발성에 비하여 발성지속시간이 훨씬 길다.
   음의 강도에 대해 Robbins,9) Robbins,10) Kinishi와 Amatsu11)는 식도발성의 음의 강도가 정상발성의 음의 강도보다 6~10 dB정도 낮았고 이에 반하여 기관식도발성이 정상발성보다 10 dB 높게 나왔으며 식도발성보다는 20 dB 높았다고 하였다. 이는 식도발성이 낮은 공기압에 기인하며 이와는 반대로 기관식도발성의 경우는 폐와 식도의 압력이 동시에 가해 지면서 저항이 증가되어 강도가 증가하는 것으로 해석하였다. 그러나 저자의 경우 각 방법별 의미있는 차이는 보이지 않았다.
   기본주파수는 Robbins 등10)11)이 기관식도발성과 식도발성, 그리고 정상발성을 비교한 결과 기관식도발성이 정상발성과 가장 유사하고 식도발성에 비하여 기본주파수가 더 높았으며 이것은 이용되는 공기양의 차이에 의한 것이라고 보고하였다. Leipzig12)는 식도발성보다 기관식도발성이 기본주파수가 높은 것은 풍부한 폐공기를 이용하여 위성대를 더 길게 진동시킬 수 있기 때문이라고 하였다. 반면 Pindazola와 Cain4)은 식도발성과 기관식도발성과는 의미있는 차이가 없었다고 하였다. Singer 등6)은 효율적인 면에서는 기관식도발성과 실리콘 이중밸브 튜브를 사용하여 기본주파수가 정상발성과 유사하였다고 기술하였으며 Curry 등13)은 Asai 술식으로 97Hz 이상의 높은 기본주파수를 얻었다고 보고하였다. Leipzig12)는 기관식도발성과 식도발성에서 안정된 진동주파수를 유지하지 못하는 것은 진동시 접촉면이 불규칙하기 때문이라 하였는데 본 연구에서는 인공후두발성이 가장 높게 나타났으나 각 군간에는 유의한 차이는 없었으며(p>0.05), 성역에 대하여 인공후두발성과 기관식도발성이 타발성방법보다 다소 넓어 보다 자연스러운 발성이 가능하다는 것을 알 수 있었다.
   Jitter와 shimmer에 대하여 Horii14)는 정상인의 jitter 평균이 0.75%, shimmer가 0.17 dB이었으며 식도발성에서 정상발성에 비하여 jitter가 의미있게 증가되었다고 보고하였다. Pindazola와 Cain4)은 정상발성과 기관식도발성군 사이에는 jitter와 shimmer가 의미있는 차이가 없었으나 정상발성과 식도발성군 사이에는 의미있는 차이가 있었다고 보고하였다. 본 연구에서는 전기후두발성군 및 인공후두발성군과 기관식도발성군 및 식도발성군 두 군사이에는 의미있는 차이가 있었으나 전기후두발성군과 인공후두발성군, 그리고 기관식도발성군과 식도발성군 사이에는 의미있는 차이가 없었다. 이는 불규칙한 면을 가진 가성대로 발성하는 기관식도발성이나 식도발성에서 불안정한 발성이 유발되기 때문인 것으로 추정된다. 기관식도발성과 식도발성이 동시에 가능하였던 2명의 jitter와 shimmer값의 결과를 볼 때 기관식도발성이 식도발성보다 더 규칙성이 없는 불규칙한 발성양상을 보였다. 하지만 기관식도발성에서 음역의 폭이 식도발성보다 넓어 보다 자연스러운 발성이 가능할 것으로 사료되었다.
   Clements15)는 전기후두발성자, 식도발성자, 기관식도발성자에서 환자가 느끼는 대화시의 만족도, 음성의 질, 전화로 통화할 수 있는 정도, 삶의 질을 설문조사하여 비교한 결과 기관식도자발성자가 타 발성자에 비해 의미있게 좋은 것으로 보고하였다.
   결론적으로 전기후두발성과 인공후두발성은 음향학적으로는 안정적이고 사용하기 간편하고 말을 빨리 배울수 있으며 저렴하지만 전기후두발성의 경우 자연스러운 음역을 제공하지 못하며 음이 매우 단조로울 뿐 아니라 인공후두발성의 경우 진동부분을 구강내에 항상 삽입해 있어야 하는 불편함과 타액이나 음식물이 언어보조기로 들어가 막히기도 하며, 완전히 밀착시키지 않으면 그 사이로 공기가 누출되어 잡음이 나며 미용상으로도 좋지 않고 한손을 사용해야 하는 단점이 있다.5-7) 이에 비하여 식도발성은 양손을 사용할 수 있는 최대의 장점이 있지만 상당기간의 훈련이 필요하며 실패율이 높아 숙달된 언어의 표현은 약 반수에서만 가능하다는 단점이 있다.5) 기관식도발성은 흡인, 션트의 협착, 폐쇄될 위험성이 있으며 시술이 다소 복잡하고 발성시 한손을 사용해야 하는 불편함이 있는 반면에 적절한 발성훈련으로 80%에서 98%까지 성공적인 음성재활이 가능하다.16)17) 본 연구에서도 기관식도발성이 타 발성에 비해 고음과 저음을 잘 표현해 주며 자연스러운 발성이 가능하였다.

결     론


   후두전적출술후 음성재활을 시행받은 식도발성과 기관식도발성이 동시에 가능한 환자 2명을 포함한 16명의 환자를 대상으로 하였으며 각각의 음성재활방법에 따라 최대발성지속시간, 음의 강도, 기본주파수, 음역, jitter, shimmer등의 음향학적 수치를 구하여 비교 분석하였다. 각각의 비교에서 인공후두발성이 음향학적으로 볼 때 가장 안정되고 정상 발성과 유사하였으나, 사용상의 문제점이 가장 큰 단점으로 생각되며, 전기후두 발성법은 안정적인 발성법이기는 하지만 자연스러운 음역을 제공하지 못하며 음이 매우 단조롭다. 그 이외의 방법으로서 기관식도발성이나 식도발성이 사용하기에 편리하며 음향학적인 면에서는 기관식도발성이 식도발성에 비해 효율적일 것으로 사료되었다.


REFERENCES
  1. Baek MJ, Oh IJ, Wang SG, Chon KM. Comparison of the amatsu tracheoesophageal shunt speech and esophageal speech after total laryngectomy. Korean J Otolaryngol 1993;36:102-9.

  2. Davis S. Acoustic characteristics of normal and pathological voices. Speech language: Advances in the basic research and practice 1979;1:271-314.

  3. Keith RL, Leeper HA, Doyle PC. Microanalytic acoustical voice characteristics of near-total laryngectomy. Otolaryngol Head Neck Surg 1995;113:689-94.

  4. Pindazola RH, Cain BH. Duration and frequency characteristics of tracheoesophageal speech. Ann Otol Rhinol Laryngol 1989;98:960-4.

  5. Hong WP. Voice vehabilitation after total laryngeromy. Seoul symposium 1985;1:275-307.

  6. Singer MI, Blom ED, Hamaker RC. Voice rehabilitation after total laryngectomy. J Otolaryngol 1983;12:329-34.

  7. Bennetts S, Weinberg B. Acceptability ratings of normal, esophageal and artificial larynx speech. J Speech Hear Res 1973;16:608-15.

  8. Christensen JM, Weinberg B. Vowel duration characteristics of esophageal speech. J Speech Hear Res 1976;19:678-89.

  9. Robbins J, Fisher HB, Blom ED, Singer MI. Selected acoustic features of tracheoesophageal, esophageal and laryngeal speech. Arch Otol 1984;110:670-2.

  10. Robbins J, Fisher HB, Blom ED, Singer MI. A comparative acoustic study of normal, esophageal, and tracheoesophageal speech production. J Speech Hear Disord 1984;49:202-10.

  11. Kinishi M, Amatsu M. Pitch perturbation measures of voice production of laryngectomees after the Amatsu tracheoesophageal shunt operation. Auris Nasus Larynx 1986;13:53-62.

  12. Leipzig B. Neoglottic reconstruction following total laryngectomy. Ann Otol 1980;89:534-7.

  13. Curry ET, Snidecor JC, Isshiki N. Fundamental frequency characteristics of Japanese Asai speakers. Laryngoscope 1973;83:1759-63.

  14. Horii Y. Jitter and shimmer differences among sustained vowel phonations. J Speech Hear Res 1982;25:12-4.

  15. Clements KS. Communication after laryngectomy : An assessment of patient satisfaction. Arch Otolaryngol Head Neck Surg 1997;123:493-6.

  16. Izdebski K, Reed CG, Ross JC, Hilsinger RL. Problems with tracheoesophageal fistula voice restoration in totally laryngectomized patients. Arch Otolayngol Head Neck Surg 1994;120:840-5.

  17. Callaway E, Truelson JM, Wolf GT, Kincaid LT, Cannon S. Predictive value of objective esophageal insufflation testing for acquisition of tracheoesophageal speech. Laryngoscope 1992;102:704-8.

Editorial Office
Korean Society of Otorhinolaryngology-Head and Neck Surgery
103-307 67 Seobinggo-ro, Yongsan-gu, Seoul 04385, Korea
TEL: +82-2-3487-6602    FAX: +82-2-3487-6603   E-mail: kjorl@korl.or.kr
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Copyright © Korean Society of Otorhinolaryngology-Head and Neck Surgery.                 Developed in M2PI
Close layer
prev next