SRTは単語認識能力全体とはほとんど関係がない。 私たちの分野では、50%のデータポイントを使用して最大の音声処理性能を予測するという仮定やアプローチがあるように見えますが、これは実際には、臨床的または理論的な根拠のない努力です
個人の単語認識スコア(WRS)の予測指標として音声認識閾値(SRT)を使うことは可能ですか? 補聴器選びの過程で、2つの補聴器、または1つの補聴器の性能設定のどちらかを決定する必要があります。 ある性能設定が他より優れたSRTをもたらす。 今日の調剤薬局では、臨床的な判断のためにどのような要素が重要視されるのでしょうか? 他の補聴器と比較して、より低い信号提示レベル、またはより良い信号対雑音比(SNR、S/N比)でより良いSRTを提供できる機器を見たとき、専門家はより良いSRTを持つ機器に何を期待するべきでしょうか? 専門家の判断で予想されるように、実世界でより良い音声理解性能につながるから、この装置を選択するのでしょうか。
指向性システムを搭載したデジタル補聴器が、SNRの点でわずかに優れたSRTと関連することがわかった場合、多くの人はその補聴器を選び、指向性システムが作動したときに、より良い音声明瞭度スコアを期待することでしょう。 同様に、FMシステムなどの聴覚補助機器(ALD)が他の機器よりもSRTでわずかに優れている場合、多くの臨床医はALDが優れた音声理解性能をもたらすと合理的に推測する傾向があります1
実際、文の認識閾値を取得した性能-強度 (P-I) 関数の曲線の傾きに基づき、文の認識閾値から被験者の音声理解性能を予測しようとした文献さえ存在します。 一例を挙げると、テストマニュアルによると、S/N比1dBの差は文の理解度9ポイントに相当する、という文献があります。 したがって、グループ間の S/N 比の差が 4 dB の場合、バイリンガルのネイティブスピーカーの音声明瞭度が、モノリンガルのネイティブスピーカーよりも約 36% 低いことを意味します
確かに、これらのアプローチの根底には、SRT から個人の音声明瞭度を予測または推定することができるという前提があります。 しかし、この広く受け入れられているアプローチは、臨床で使用するのに十分な精度があるのでしょうか。
Theoretical Considerations
純音閾値 (PT) のように、音声認識閾値 (SRT) は、純音信号が50%の時間でほとんど認識できない最も低いレベルを意味します3-5。 繰り返しますが、純音信号に対する個人の聴覚感度を表す純音閾値と同様に、SRTは音声信号に対する個人の聴覚感度を表しています。 閾値の定義と検査方法の性質から、SRTは閾値レベルの音声信号に対する個人の反応を示す。 これは重要なニュアンスである。 SRTは、音声信号が約50%の時間、ほぼ知覚できる/認識できるような、かなりソフトなレベルで提示されたときの音声信号に対する反応を示す。 音声信号はほとんど認識できないレベルであり、テストでは当然推測が入るため、SRTは閾値レベルの反応であり、個人の閾値より高いレベルの反応とは区別される。
一方、単語認識スコア(WRS)は、音声信号が個人の閾値を超える様々なラウドネスレベルで提示されたときに、考えられるすべての反応を示します。3-5 WRSは、患者が閾値より上のレベルの音声信号をどれだけ聞いて処理できるかを示し、これに対してSRTは、特定のほとんど知覚できないレベルの音声信号に対してどれだけ敏感であるのかを示しています。 したがって、信号提示レベルの関数として可能な限りのWRS反応をプロットするのに比べ、SRTは性能-強度曲線の50%ポイントとしてこの分野では知られています。 ここで重要なのは、SRTが閾値レベルの応答であるのに対し、WRSは音声刺激に対する閾値以上の応答であるということです。
異なるタイプの難聴に対するSRTとWRSの検討
以上のことを説明するために、図1は4点のデータとしてWRS(音声信号の提示レベルに対する)の関数として表示した、仮想のSRTを示します。 4つのデータポイントは、正常な聴覚感度を持つ人と、50 dB、70 dB、90 dB HL程度の様々な難聴の人が、50%の時間で音声信号をほとんど認識できない最も低い信号レベルを表しています。 また、4つのデータポイントは、4種類の聴覚状態の個人が、それぞれ音声信号がその閾値レベルで提示されたときに、50%の精度でしか音声信号を認識できないことから、単語認識性能が50%であることを示しています。
figure 1. 正常な聴力と様々な難聴の程度について4つのデータポイントとして表示された仮想の音声認識閾値(SRT)
では、音声信号をその閾値より上のレベルで提示した場合、パフォーマンス-強度曲線はどのようになるだろうか。 これらの4つのデータポイントに基づいて、音声信号が様々な高いレベルで提示されたときの彼らの最大単語認識スコアを推定することができるでしょうか。 同様に、これらの4つのデータポイントが適切に装着された補聴器を使用した場合のSRTを表している場合、補聴器の恩恵を受けた後の被験者の最大音声明瞭度スコアを予測することができるでしょうか?
FIGURE 2. 図2.図1に示した4つの仮想的な音声認識閾値(SRT)に対する様々な最大単語認識スコア(Y軸)を表示した仮想的な性能-強度曲線は、音声が50%の時間でほとんど認識できない提示レベルを表しています。 ここで示した曲線は、難聴の程度がさまざまであっても可能な、あらゆる音声処理性能の系列の限られた部分であることに留意する必要があります
図2は、これらの疑問に答えるのに役立つでしょう。 臨床経験と理論的考察に基づいて、いくつかの仮説的な性能-強度(P-I)曲線の例をプロットし、健常な聴覚状態と様々な程度の難聴を持つ個人の被験者単語認識スコアの相互関係や反応パターンを示した
For normal hearing status. 図2において、左端の曲線(例えば、0dBの提示レベルを通過する)を健聴者を表す曲線として使用することができる。 これは、教科書によく出てくるもので、一定の検査手順と与えられた音声検査材料で測定した場合、信号提示レベルの上昇に伴い、一定の傾きで性能が上昇することを示すものである。 SRTから約40dB感覚レベル(SL)上がったところでWRSは最大となる。 図2において、健聴者の曲線の右側にある、50dB提示レベルを通過する曲線群は、50dB聴力喪失のカテゴリーの聴者のWRSにおける典型的な応答を表している。 この50dB難聴カテゴリー(5本の実線の曲線)のうち、左の曲線は、50dB難聴がもともと伝導性難聴である場合のP-I関数を示しています。 導電性難聴は本来、内耳や高次構造の病理を伴わない感度低下であるため、この曲線は健聴者のものと全く同じ傾きで、同じ最大WRSに達していることに注意されたい。
50dBの難聴が混合性難聴を含む場合(例えば、感音性難聴の軽い成分)、被験者の信号処理能力は低下する。 そのP-I曲線(この曲線群の他の4本の実線)は、健常者または伝音性難聴の曲線と比較して、依然として上昇するが、傾斜がより急で、より低い最大WRSで平坦になる可能性がある。
この50dB難聴の場合、すべての曲線が同じSRTを示すが、最大WRSには大きな個人差があり、70%近くから100%まで幅があることがわかる
70dB難聴の場合。 図2の右側には、70dBのSRTのデータポイントを通過する4本の破線の曲線があり、最大WRSは異なっている。 これらは、70dB難聴のカテゴリーで考えられるP-I関数の反応パターンと個人差を表している。 一般的な補聴器クリニックでは、70dB SRT前後の難聴者が大半を占めます。
図2に示すように、最大WRSの大きな変動は、このタイプの損失から生じることがすぐに明らかになるはずです。 また、いくつかの破線曲線は 50 dB の難聴カテゴリーよりも高い WRS パフォーマンスに達していますが、他の曲線は一般的に低いパフォーマンスを示していることに注目するのも興味深いことです。 ある曲線(一番下の破線の曲線)では、ロールオーバー現象がわずかに見られます。つまり、最高のWRSに達した後、より高い提示レベルではWRSが悪くなっているのです。
P-I曲線から明らかになった多くの個人差は、有毛細胞や神経線維の病理が関与する感音性難聴(SNHL)に関連していることが多いようです。 これらの損失は、しばしば感度損失と明瞭度損失の両方の成分を特徴とし、音声信号における明瞭度損失は、難聴の程度、難聴の形状、難聴の病因、耳-脳構造の病的状態、外毛細胞および/または内毛細胞への損傷の程度、能動蝸牛増幅に対する損傷と影響、内毛細胞の残存機能などの要因によって大きく異なるが、これらに限定されるものではない。 後蝸牛神経線維の損傷、神経放電の同期性への影響、後蝸牛病変と蝸牛病変の割合、聴覚皮質のトノトピック再構成の影響、難聴期間、補聴器使用歴、(不十分な)聴覚刺激に伴う時間、前舌語と後舌語の場合、ライフスタイルや生活環境、個人の言語能力(サイドバー、典型的な70dB難聴というものがあるのか?を参照)。).
明らかに、病理学的および言語学的な領域を含む、サイドバーで述べたような無数の要因が、音声信号処理性能に影響を与える根本的なメカニズムとして互いに作用しています。 したがって、音声信号処理の応答パターン、P-I曲線の傾き、最大WRSは、被験者によって大きな個人差があることが合理的に予想される。 図2に示したのは、70dBのSNHLの場合、同じSRTで得られる様々な最大WRSを持つP-I関数の一部である。
したがって、図2と常識は、SRTから可能な最大WRSを予測することは、適切な注意事項なしに無謀なアプローチであることを示唆している
90dBの聴覚損失の場合。 難聴の程度が90dBのカテゴリーに移行すると、SNHLは通常、感覚成分を補完するために神経成分を含み、感度損失とともに信号の明瞭度がはるかに大きく低下する。 このような損失は、後蝸牛領域および高次聴覚経路に沿った他の神経中継ステーションにおけるより多くの損傷を示唆している。 したがって、より高次の経路でより多くの神経学的障害が発生し、神経放電の同期不全や聴覚処理障害が発生する可能性が高くなり、(70dBの聴覚損失カテゴリーと比較して)さらに劣った信号処理性能が明らかになるかもしれません。 上記で述べたすべての要因、たとえば周波数ごとの難聴の程度、特定の病因、内耳と聴覚経路の損傷の場所と程度、トーントピックの再編成、個人の言語能力などは、相互に作用し、異なる反応パターンとP-I曲線の傾きをもたらすであろう。 この場合も、音声信号処理の最大性能に大きなばらつきが生じることが予想される。
図 2 では、3 つの曲線 (90 dB のデータ点を通過する 2 つの破線と 1 つの実線の曲線) をプロットして、このカテゴリの難聴者が達成できるさまざまな最大 WRS で異なる傾きを示しています。 実線の曲線は、70dBの難聴の場合と比較して、さらに大きなロールオーバー現象を示しています。 3つの曲線はすべて、最大WRSが70dB難聴のカテゴリーよりも低くなる可能性があることを示すために配置されています。
もちろん、90dB前後の難聴の被験者の中には、軽度の難聴の人に比べて、極めて例外的に良好なWRSを示す人がいることは承知している。 このような例外は全く珍しいことではなく、信号処理性能の機能や聴覚システムに大きなばらつきがあることをさらに裏付けるものである。 ここでユニークな点は、これらの曲線がすべて同じ90dB SRTのデータポイントを通過し、根本的に異なる最大WRSを生み出していることである。 70dBロス群と同様、大きな個人差がある。
図2の右下には、さらに3つの曲線が表示され、90 dB HL以上の難聴者のP-I曲線の可能性が示されています。 このような深い難聴の程度と交絡因子(上述)により、応答曲線の傾きと最大WRSに大きな個人差があることが予想される。
これら3つの曲線のユニークな点は、被験者の上昇する音声認識性能が50%ポイントにさえ到達できない可能性があることです。 さらに、最大 WRS とロールオーバー現象は、それぞれ 70 dB の損失よりもさらに悪い、またはより顕著になる可能性があります。 傾きと最大音声処理性能が明らかに異なる一方で、50% のポイントがちょうど 10 dB SPL にあることに注意してください。
Clinical Evidence
上記を実証するために、いくつかの経験的臨床データが役に立ちます。 音声明瞭度に対する圧縮閾値の影響を調べるため、2kHz以上の軽度から重度のSNHLを持つ12人の被験者が、Speech In Noise(SIN)テストのターゲットセンテンスをプログラム可能な補聴器で聴取しました。 これらの被験者の音声処理性能の例を選び、SNRに対するP-I曲線としてプロットしました(図3-6)。
figure 4. S/N比で表された2人の個人のPerformance-Intensity曲線。 図3-5を参照すると、異なる被験者のWRS性能が50%点で全く同じであっても、曲線の傾きと最大性能は互いに全く異なることが明らかである。 このことから、SRTはあくまで応答曲線の50%点であり、曲線の傾きや最大処理能力は実世界で大きく異なることがわかる。 この図から、50%のデータポイントは、その人が達成できる最大の処理能力とは密接な関係がないことがわかる。 したがって、SRTは性能-強度の反応を代表するものとして使用すべきではない。 傾斜と最大音声処理性能が明らかに異なる一方で、50%ポイントが10.75 dB SPL付近にあることに注意してください。
この情報はまた、大学院生に助言を与え、研究プロジェクトを策定する場合、SRTを研究の主要基準として使用するのは賢明ではない可能性を示唆している。 現在では、被験者の音声処理能力の50%ポイントを求めるテストが数多く考案されていますが、提示レベルやSNRで表される50%ポイントやSRTの解釈には、注意が必要です。 8540>
図6では、3つのP-I曲線は、50%ポイントが全く異なっている。 赤い曲線は軽度の高周波のSNHLの個人を表し、他の2つの曲線は中度から重度の高周波のSNHLの個人から得られたものである。 実際、赤い曲線で示された急勾配とほぼ完璧な音声処理性能は、健聴者が達成した反応に類似しています。
Figure 6. 50%ポイントがそれぞれ3.35, 8.51, 9.83 dB SPLにある3つの性能-強度曲線。 塗りつぶされた円の赤いものは、その傾きと最大音声処理性能が健聴者の達成したものと同様であるが、軽度の感音性高周波難聴の個人によって達成され、他の 2 つの曲線は中程度から重度の感音性高周波難聴の個人から得られた。
このことは、軽度感音性聴覚障害の被験者は耳脳系に受ける損傷が少ないことから予想されるかもしれない。 中等度から重度の高周波数帯のSNHLの個人から得られた曲線については、先に述べたように、より大きな個人差が見られるかもしれない。 この2つの曲線を観察すると、緑色の曲線と比較して、50%ポイントの良い方(青色の曲線)は、WRSが良くなっていないことに注意してください。 これは、個人差のある現実世界では、50%ポイント(SRT)の良し悪しが、必ずしも最大音声処理性能の良し悪しと関連するとは限らないことを示しています。
Summary
1) 個人の音声処理能力は、難聴の程度、タイプ、形状、難聴期間、耳・脳システムの他の多くの病態生理条件、さらには個人の言語能力・プロフィールなど多くの要因によって動的に影響される。
2) 音声認識閾値は、被験者の音声処理性能のP-I曲線における50%のデータポイントに過ぎない。
3) ある個人のP-I曲線上の50%データポイント(SRT)は、別の患者と一致することがありますが、この2人の患者の傾きと処理性能は互いにまったく異なる可能性があります。
4) 応答パターン、SRT、P-I曲線の傾き、最大処理能力の関係は、個人差により非常にダイナミックで予測不可能である。
5) SRTが良い応答は必ずしもWRSが良いとは限らない。 私たちの分野では、50%のデータポイントを用いて最大音声処理能力を予測するという作業仮説・アプローチがしばしば見られるが、これは実際には臨床的・理論的根拠と精度のない取り組みである。
6) 補聴器やALDのフィッティング(選定、変更、微調整など)を行う際、あるいは増幅の効果に対する現実的な期待を確立する際には、50%というデータポイントに過度に依存しないようにすべきです。 その代わりに、音声処理性能を最大限に発揮する、より完全なP-Iカーブを得ることが、実際の臨床医にとってより現実的なアプローチとなります。
典型的な70dB難聴は存在するのか?
より重度の難聴は、WRSにかなり顕著な変化をもたらすことが明らかです。 70dB以上の難聴は、しばしば複雑で多面的なものとなります。 例えば、70dBのSRTスコアの患者さんは、周波数によって純音閾値が全く異なる場合があります。 言い換えれば、個々の純音周波数において様々な難聴の程度があっても、SRTが70dB HL程度に見える場合があるのです。 また、平坦、傾斜、低周波、高周波、析出型、クッキーバイト型など、さまざまなオージオグラムの形状があるが、それでもSRTは約70dB HLとなる。
このことは、内耳の脳底膜の高域と低域(例えば、基底部と頂部)の損傷の位置と重症度が、これらの被験者間でかなり異なっている可能性があることを意味している。 さらに、蝸牛の増幅機能にもさまざまな損傷が生じ、外有毛細胞電位の違いにより、聴覚感度や信号の周波数弁別能力も異なるだろう。6-9 これらの病的状態により、聴覚感度の低下や周波数分析の低下、さらに子音や母音の処理における歪みの量が異なる信号処理が生じるだろう。 聴覚神経線維の 95% が内耳有毛細胞からの情報を伝達し、聴覚神経の 5% だけが外耳有毛細胞を神経支配しているからです9-10。 蝸牛よりも後蝸牛に病変がある場合、音声認識における明瞭度の低下やロールオーバー現象がより大きくなることが予想されます。 また、高次聴覚経路の障害では、聴覚の図地分離、両耳統合、両耳分離、マスキングからの解放などの高次過程に影響が及ぶことが知られている。 このため、騒音下での聴解作業において、音声認識が不均衡に低下する可能性があります11,12。 細菌・ウイルス性内耳炎、騒音・薬剤性難聴、血液循環・出血現象、音響神経腫、APD・聴覚同期障害、自己免疫性内耳疾患、遺伝性難聴など様々な病因により、感覚・神経構造上の損傷の位置や程度が異なる病態が生じ、結果として音声認識能力は70dB SRTと関連している可能性がある。
もうひとつの要因は、SNHLに苦しむ動物被験者の聴覚皮質のトノトピック再編成の領域から来るものである。 SNHL が長期にわたって持続すると、聴覚皮質に拡大した単調領域が形成され、そこでは、ニューロンが本来の特性周波数を新しい(低い)周波数に変更されることが知られている。 その同調曲線は、閾値の上昇、周波数弁別能の低下、本来の特性周波数以外の周波数に対する過敏性を示している13,14。
また、このトノトピックの再編成は、単音節の単語や文章に対するWRS、さらには両耳分離・統合を含む他の高度な信号処理能力を持たないヒト被験者の聴覚剥奪・適応と密接な関係があることが示唆されている13-17。 ここで、70dB難聴の被験者については、周波数による難聴の程度の違い、損傷の場所や程度、その他多くの変数が、聴覚皮質のトノトピック再編成の形成の交絡因子として加わっている可能性がある。
つまり、このカテゴリーの被験者のうち、個人の聴覚皮質の異なる単調な領域が、本来の信号処理能力を失うということである。 それは異なる周波数に同調するようになり、ニューロンのさまざまな割合があまり鋭く同調しなくなり、皮質における等周波数輪郭の配置に独特の変化が生じ、その最適周波数以外の周波数に対するニューロンの閾値上昇や過感応の程度もさまざまでありうる。 そして周波数識別や他の高等神経処理能力のさまざまな低下が予想されるはずである。 このようなトーントピックの再編成の特徴の違いにより、背景雑音、信号処理、周波数と強度の分解能など、被験者の性能にばらつきが生じ、結果として音声認識に違いが生じるのです。
さらに、各個人の言語能力が、その人の音声理解性能の大きなマクロ変数であることに疑いの余地はありません。 人々の言語能力、すなわち意味形式、構文構造、語用論的言語使用などのスキルは異なり、コミュニケーションの断絶時(たとえば、言語的および文脈的な手がかりを使って空白を埋めようとするとき)には助けになったり妨げになったりするかもしれません。 70dBの難聴者は、すでに音声を理解することが困難であり、言語能力は、特にWRSが背景騒音の中で文章資料を用いて測定される場合、難聴と相互作用しWRSに影響を与えるマクロ変数になると思われます。 さらに、バイリンガルの言語プロファイルは、第二言語習得年齢、両親の言語、習得の地理的起源、言語使用、第二言語への暴露期間などの変数によって複雑になり、これらすべての変数が、特に騒音下リスニング課題中の音声/言語処理性能に影響を与えます18-20
1. ルイスMS、クランデルCC. 周波数変調(FM)技術応用。 で発表した。
2. Von Hapsburg D, Pena E. Understanding bilingualism and its impact on speech audiometry(バイリンガリズムの理解と音声聴力測定への影響). 2002; 45: 202-213.
3. ニュービー・ハー、ポペルカ・グループ. 聴力学. 第6版. Englewood Cliffs, NJ: Prentice Hall Inc; 1992:126-201.
4.スタックBA. 臨床聴覚学. An Introduction. San Diego, Calif: を参照。
5. DeBonis DA, Donohue CL. サーベイ・オブ・オージオロジー。 Audiologists and Health Professionalsのための基礎知識. ボストン、マサチューセッツ州。 このような場合、「痒いところに手が届く」「痒いところに手が届く」「痒いところに手が届く」「痒いところに手が届く」「痒いところに手が届く」「痒いところに手が届く」「痒いところに手が届く」「痒いところに手が届く」「痒いところに手が届く」……痒いところに手が届く、痒いところに手が届く。 サイエンス。 1985;227(11):194-196.
7. Dallos P, Evans B, Hallworth R. Nature of the motor element in electrokinetic shape changes of cochlear outer hair cells.蝸牛外毛細胞の動電型形状変化における運動要素の性質. Nature. 1991;350(14):155-157.
8. Dallos P, Martin R. The new theory of hearing. Hear Jour. 1994; 47(2):41-42.
9. ライアンAF. 蝸牛機能の新しい見方。 In: Robinette MS, Glattke TJ, eds. 音波音響エミッション。 臨床応用。 第1版。 New York, NY: Thieme Medical Publishers Inc; 1997:22-45.
10. ゲルファンドSA. 聴覚: 心理学的・生理学的音響学入門. 第3版 ニューヨーク、NY。 Marcel Dekker Inc; 1998:47-82.
11. Mencher GT, Gerber SE, McCombe A. Audiology and Auditory Dysfunction. Needham Heights, Mass: Allyn and Bacon; 1997:105-232.
12. マーティンFN、クラークJG. オーディオロジー入門. 第9版.マサチューセッツ州ボストン: Allyn and Bacon; 2006:277-346.
13. ハリソンRV、長澤篤史、スミスDW、スタントンS、マウントRJ. 新生児高周波人工内耳喪失後の聴覚皮質の再組織化。 Hearing Res.1991;54:11-19。
14. 聴覚皮質のトノトピック構成に対する末梢性難聴の影響. Hear Jour. 1997;50(9):49-54.
15. シルマンS、ゲルファンドSA、シルバーマンCA. 遅発性聴覚遮断。 モノラル補聴器とバイノーラル補聴器の効果。 J Acoust Soc Amer. 1984;76(5):1357-1362.
16. パーマーCV. Deprivation, Acclimatization, Adaptation(剥奪、順応、適応)。 補聴器のフィッティングにどのような意味があるのか? Hear Jour. 1995;47(5):10,41-45.
17. ノイマンAC. 遅発性聴覚遮断。 過去の研究のレビューと今後の研究の必要性の評価。 Ear Hear. 1996;17(3):3s-13s.
18. Grosjean F. Processing mixed language: issues, findings, and models. ド・グルートAMB,クロールJF,編. バイリンガルのためのチュートリアル: 心理言語学的視点. Mahwah, NJ: Lawrence Erlbaum Associates; 1997:225-251.
19. 第二言語習得年齢と騒音下での音声知覚. J Speech Lang Hear Res.1997;40:686-693。
20. Von Hapsburg D, Champlin CA, Shetty SR. スペイン語と英語の二ヶ国語話者と英語一ヶ国語話者における文の受容閾値. J Amer Acad Audiol. 2004;15(1):88-98.