Anunciese Aquí

Registro automático

Acceder con Twitter

top articulo
twitter
facebook
Rss
lunes 30 de noviembre del 2020
Lea, publique artículos gratis, y comparta su conocimiento
Usuario Clave ¿Olvidó su clave?
¿Iniciar sesión automáticamente en cada visita?
Inserte su correo electronico

Como percibe un implantado coclear el sonido

veces visto 684 Veces vista   comentario 0 Comentarios

La cóclea sana realiza un proceso de análisis del sonido que permite extraer información relativa a la intensidad, la distribución espectral y la distribución temporal de la energía acústica. Esta información queda representada en forma de potenciales de acción en el nervio auditivo, y es transmitida al cerebro donde es procesada e interpretada.

En una cóclea dañada, el implante coclear trata de imitar el mecanismo de conversión del sonido en potenciales de acción, proporcionando al paciente implantado una representación del sonido lo más parecida posible a la que tendría con una cóclea sana.

Procesamiento del sonido con el implante coclear

En la actualidad, cuando se coloca un implante coclear, se aloja en la cóclea un conjunto de electrodos. De acuerdo con el principio tonotópico de la percepción auditiva, a cada uno de los electrodos se le asigna una banda de frecuencia, de modo que el paciente implantado percibe los estímulos de las distintas frecuencias en distintos puntos de la cóclea (en terminaciones nerviosas asociadas a las distintas regiones cocleares), de forma análoga a la percepción en una cóclea sana. Cada uno de los electrodos proporciona una estimulación en cada instante de tiempo de acuerdo con la intensidad que hay en la señal de audio en la banda espectral correspondiente. De este modo, los pacientes implantados reciben una estimulación que les proporciona información espectral, relativa a los niveles de intensidad, y su evolución temporal.

Sin embargo, hay algunas diferencias entre la generación de los potenciales de acción y la estimulación eléctrica del nervio auditivo mediante electrodos. La conexión sináptica entre las células ciliadas y las fibras nerviosas permite que la vibración de la membrana basilar en un punto determinado de la cóclea produzca potenciales de acción únicamente en las terminaciones que inervan las células ciliadas en ese punto de la cóclea. Sin embargo, la estimulación eléctrica mediante electrodos produce un campo de corriente en una región no confinada, que da lugar a la generación de potenciales de acción en una región relativamente extensa de la cóclea (mucho más que en el caso de la estimulación natural), por lo que la estimulación con implantes cocleares lleva implícita una pérdida importante de resolución espectral tonotópica.

Por otra parte, la generación de potenciales de acción en una célula ciliada no afecta a las células ciliadas situadas en su periferia, por lo que en la estimulación natural, los estímulos se generan independientemente en las distintas regiones de la cóclea sin interferir unas células ciliadas con otras. En el caso de los implantes cocleares (también debido a que no existe sinapsis entre los electrodos y las terminaciones nerviosas), si se estimulan simultáneamente dos electrodos, se produce una interferencia entre ambas estimulaciones. Esto es debido a que se ha establecido una diferencia de potencial entre el primer electrodo y el de referencia, y otra diferencia de potencial entre el segundo electrodo y el de referencia, y puesto que en general la estimulación en el primer y el segundo electrodo son distintas, va a aparecer una diferencia de potencial también entre el primer y el segundo electrodo, que va a dar lugar a una interferencia entre canales estimulando de forma incontrolada las terminaciones situadas entre ambos electrodos. Este fenómeno se conoce bien desde las primeras investigaciones en el campo de los implantes cocleares y se denomina efecto de suma de campos. Como consecuencia de esto, no deben estimularse simultáneamente dos electrodos, y por tanto, el proceso de estimulación de electrodos debe realizarse de forma secuencial, estimulando en cada instante de tiempo un único canal. Es, además, conveniente dejar un intervalo de tiempo entre dos estimulaciones consecutivas para garantizar la repolarización de las terminaciones nerviosas estimuladas.

Debe tenerse en cuenta que estas dos limitaciones que presentan los implantes cocleares en la actualidad son comunes a todos los implantes cocleares y son consecuencia del hecho de utilizar electrodos que suministran corriente eléctrica para generar los potenciales de acción en el nervio auditivo. La tecnología actual no permite por el momento realizar una conexión con el nervio auditivo que permita una estimulación selectiva de las distintas fibras nerviosas o que permita la estimulación simultánea en varios puntos de la cóclea sin producir interferencia. En la actualidad se realiza un esfuerzo investigador para mejorar los implantes cocleares en este sentido.

Compromisos y soluciones en el diseño de los implantes cocleares

Un equipo para un implante coclear es un sistema que debe proporcionar al paciente una estimulación del nervio auditivo que represente el sonido con la máxima calidad posible. El sistema debe realizar todas las operaciones necesarias sobre la señal de audio en tiempo real y debe ser diseñado de forma que resulte cómodo para el paciente (tratando de minimizar el consumo eléctrico, el peso, etc.).

En el diseño del implante y el procesador existen, pues, compromisos que deben resolverse, buscando la solución más razonable. Por ejemplo, la incorporación en el procesador de una técnica de procesamiento de señal que mejore la calidad de la percepción va a suponer un incremento del tamaño del circuito electrónico y del consumo eléctrico del sistema, lo que va a ocasionar mayor tamaño en el equipo y la necesidad de utilizar baterías más pesadas o tener que sustituirlas más a menudo. Durante el diseño del sistema deberían evaluarse los beneficios e inconvenientes derivados de la incorporación de la técnica de procesamiento de señal considerada, adoptando la solución más razonable.

Por otra parte, los avances tecnológicos hacen que continuamente se puedan considerar nuevas posibilidades. Por ejemplo, la evolución de las tecnologías electrónicas ha hecho que cada vez los circuitos sean más pequeños y tengan menor consumo eléctrico, permitiendo además la incorporación de técnicas de procesamiento de señal cada vez más refinadas.

Los principales aspectos que deben considerarse en el diseño de los implantes cocleares se refieren a los siguientes aspectos: número de electrodos, tasa de estimulación, configuración eléctrica de la estimulación, estrategia de estimulación, consumo, tamaño y peso.

Número de electrodos

En cuanto al número de electrodos, debido a las consideraciones expuestas anteriormente, los implantes fabricados actualmente tienen un número bajo de electrodos (entre 8 y 24 según modelos), muy reducido en comparación con las cerca de 4.000 células ciliadas y alrededor de 40.000 terminaciones que hay en la cóclea. Hay varias razones por las que no tiene sentido aumentar excesivamente el número de electrodos:

Puesto que los campos eléctricos no están confinados, la corriente eléctrica que inyecta cada electrodo se difunde en una zona amplia de la cóclea, lo que limita la resolución espectral de la cóclea. Por tanto, el hecho de utilizar un número elevado de electrodos no supone mejorar la resolución espectral tonotópica. Se han realizado numerosos estudios comparativos sobre el rendimiento auditivo en función del número de electrodos. Estos estudios concluyen que a partir de tan solo 4 electrodos se puede obtener un rendimiento aceptable. Al aumentar el número de electrodos, se aprecia una mejora progresiva en el rendimiento auditivo. Esta mejora se satura al llegar a 7 u 8 electrodos, no observándose mejoras por el hecho de utilizar mayor número de electrodos. La utilización de un número elevado de electrodos supone un consumo importante de recursos del sistema (aumenta el número de operaciones de procesamiento de señal, y por tanto el consumo del sistema, el tamaño dedicado a circuitos, el tamaño dedicado a baterías y el peso). Debido al efecto de suma de campos, no se pueden estimular simultáneamente dos electrodos (si se hiciera se produciría una interferencia entre electrodos). Por esta razón, la utilización de un número elevado de electrodos supone repartir la tasa total de estimulación entre un número elevado de electrodos, lo que da lugar a una tasa de estimulación por electrodo excesivamente baja.

Por estos motivos, la fabricación de los implantes de mayor número de electrodos responde más a motivos comerciales que a razones técnicas y se apoya en la idea errónea (aunque muy difundida) de que un implante, por el hecho de incorporar muchos electrodos debe funcionar mejor que uno con menor número de electrodos. De hecho, los implantes con mayor número de electrodos se ven obligados a paliar los inconvenientes asociados mediante diversos mecanismos, que conducen a pérdidas de calidad en determinados aspectos (por ejemplo, estimular en cada ciclo únicamente algunos de los electrodos, de modo que algunos aspectos de la señal de audio no quedan representados, o reducir la tasa de estimulación por debajo de la tasa de disparo de las neuronas, ocasionando sincronización artificial de los disparos en el nervio auditivo, o mantener la tasa de estimulación alta a costa de solapar parcialmente los estímulos en los distintos electrodos, dando lugar a problemas de suma de campos y la consiguiente pérdida de resolución espectral).

Tasa de estimulación

El siguiente aspecto crítico en el diseño de los implantes es la tasa de estimulación, y como se ha visto anteriormente, está íntimamente relacionado con el número de electrodos que se estimulan en cada ciclo. Se denomina tasa de estimulación al número de descargas que realiza cada electrodo por unidad de tiempo. Para obtener una correcta representación de la señal de audio es importante que la tasa de estimulación sea muy superior a la tasa de disparo de las neuronas (que está situada en torno a 400 ó 500 disparos por segundo). Algunos estudios recomiendan que la tasa de estimulación por electrodo sea entre 2 y 4 veces la tasa de disparo para evitar la sincronización de los disparos con la estimulación eléctrica. Si la tasa de estimulación es inferior, el lapso de tiempo entre dos estímulos de un electrodo permite que las neuronas se relaricen y estén preparadas para un nuevo disparo, de modo que los disparos de todas las neuronas estimuladas por el electrodo se sincronizan con la estimulación del electrodo. La sincronización de los disparos con los estímulos del electrodo impiden que los disparos se sincronicen con los máximos de energía de la señal asociados al tono fundamental, y dificulta o impide la percepción del tono fundamental de la señal de audio basada en el principio de codificación temporal. En estos casos, los pacientes perciben, en lugar del tono fundamental de la señal, un pseudo tono fundamental, de frecuencia constante e igual a la tasa de estimulación. Los pacientes que han utilizado procesadores o estrategias con tasas bajas de estimulación muestran frecuentemente un escaso control del tono en el habla (presentan un habla robotizada) si han desarrollado las habilidades lingüísticas después de ser implantados, o bien, si las habilidades lingüísticas las tenían desarrolladas antes de la sordera,  se quejan de percibir una voz muy desnaturalizada. Una estrategia que se ha utilizado para evitar este efecto en los procesadores de baja tasa de estimulación ha sido estimar la frecuencia fundamental de la señal de audio y estimular con una tasa de estimulación igual a la frecuencia fundamental estimada. De este modo se consigue una percepción por principio de codificación temporal del tono fundamental, aunque con una representación muy pobre de la envolvente de la señal en cada banda espectral. El problema principal de esta estrategia es que, aunque proporciona una representación aceptable del tono fundamental cuando la voz es pronunciada en silencio, el detector de tono fundamental es muy ineficaz en presencia de varias fuentes de sonido o en condiciones de ruido, debido a que la estimación del tono fundamental en el procesador pierde mucha precisión. En la actualidad, las tendencias en el diseño de los implantes cocleares y procesadores se orientan a proporcionar una alta tasa de estimulación.

Configuración de la estimulación

La configuración eléctrica de la estimulación se refiere a la disposición de los electrodos. La estimulación monopolar utiliza un electrodo de referencia común situado fuera de la cóclea y, por cada canal, un electrodo activo dentro de la cóclea. La configuración bipolar utiliza por cada canal una pareja de electrodos situados muy próximos entre sí. La pequeña distancia entre electrodos en la configuración bipolar hace que el campo eléctrico quede confinado en una región muy pequeña, lo que permite realizar una estimulación selectiva de una región reducida de la cóclea. Sin embargo esto hace que el número de fibras estimuladas por la pareja de electrodos sea reducido, de modo que para obtener una sensación de estimulación aceptable, se requieren niveles de corriente muy altos en comparación con la estimulación monopolar. La configuración bipolar requiere además una aproximación de los electrodos al modiolo (el eje de la cóclea, hacia donde se encuentran las fibras nerviosas) ya que si los electrodos quedan muy lejos del nervio auditivo la producción de potenciales de acción es muy ineficaz. La aplicación de estimulación bipolar está contraindicada en los casos de cóclea osificada debido a la imposibilidad de aproximar los electrodos al nervio auditivo.

La estimulación monopolar tiene el inconveniente de requerir un electrodo adicional de referencia. Debido a que durante la estimulación se produce un flujo de corriente entre los electrodos activos y el de referencia, la estimulación monopolar produce una inyección de corriente en la región donde está alojado el electrodo de referencia, de modo que algunos pacientes notan, durante los primeros meses de utilización del implante coclear, sensaciones tactiles en dicha región (descrito en ocasiones como calambres o picores) que tienden a desaparecer progresivamente. La estimulación monopolar hace que los campos de corriente se distribuyan en una región amplia de la cóclea, permitiendo la estimulación de un gran número de fibras nerviosas y una producción más eficaz de potenciales de acción en el nervio auditivo con menor consumo de corriente.

Estrategias de estimulación

Se denomina estrategia de codificación al conjunto de operaciones que se realizan con la señal de audio desde su adquisición por el micrófono hasta la determinación de los estímulos a generar en cada uno de los electrodos en cada instante de tiempo.

Las primeras estrategias de codificación que se aplicaron son las denominadas analógicas. Bajo estas estrategias, cada electrodo es estimulado con una intensidad proporcional a la señal de voz, filtrada con el filtro paso-banda que caracteriza al canal asociado a dicho electrodo. Las estrategias analógicas tienen la ventaja de requerir muy poco cálculo en el procesamiento de la señal. Sin embargo, por el hecho de realizar la estimulación simultáneamente en todos los canales, las estrategias analógicas presentan el problema de la suma de campos, dando lugar a una fuerte interacción entre canales. En un principio se diseñó esta estrategia pensando que en el proceso de transducción auditiva, el potencial en cada neurona era proporcional al desplazamiento de la membrana basilar en la región coclear que inerva. Más adelante se descubrió que las células ciliadas producen pulsos mediante procesos de despolarización y repolarización, y se desarrollaron las estrategias de estimulación pulsátiles, que tienden a imponerse en la actualidad.

Entre las estrategias pulsátiles se puede establecer una clasificación atendiendo a las operaciones de preprocesamiento que se realizan. En las estrategias de extracción de características (como la estrategia F0-F2 o la F0-F1-F2) se estiman parámetros que caracterizan a la señal de voz y se realiza la estimulación teniendo en cuenta únicamente los parámetros estimados. En el otro extremo están las estrategias de forma de onda, en las que no se realiza ninguna estimación de parámetros y la estimulación depende únicamente de la energía que hay en cada banda espectral en cada instante de tiempo (en este grupo están las estrategias CIS y CIS+ por ejemplo). Las estrategias híbridas realizan la estimación de algunos parámetros característicos de la voz y en la estimulación combinan los parámetros estimados con la energía en las bandas (en este grupo se encuentran las estrategias SMSP, MPEAK, SPEAK, etc.). De este modo, por ejemplo, la estrategia F0-F1-F2 realiza una estimación de la frecuencia fundamental (F0), y de los dos primeros formantes (F1 y F2) y estimula los electrodos asociados a F1 y F2 con la tasa de estimulación correspondiente a la frecuencia fundamental estimada. Las estrategias MPEAK, SPEAK y n-of-m realizan un análisis de la energía en las distintas bandas espectrales y seleccionan, con distintos criterios, cuáles son, en cada ciclo de estimulación, los canales que deben ser estimulados.

Las estrategias que realizan estimación de parámetros están orientadas a mejorar el funcionamiento de los procesadores que por su diseño presentan una tasa de estimulación baja o un número de electrodos demasiado elevado. Presentan en general dos inconvenientes: por una parte, estas estrategias suplen mediante la extracción de características parte de la información contenida en la señal de audio original, dando lugar a una pérdida de calidad (con respecto a las estrategias de codificación de forma de onda) que puede ser más o menos importante dependiendo de la estrategia considerada y el papel que juegue la extracción de características. Por otra parte, la estimación de características está orientada a mejorar la percepción de la voz, por lo que estas estrategias parten de la premisa de que la señal de audio procesada es voz adquirida en un entorno silencioso. Por esta razón, cuando la señal procesada no es voz o está adquirida en un entorno ruidoso, la estimación de las características puede ser ineficaz proporcionando al paciente una estimulación que no representa correctamente la señal de audio. Este efecto es particularmente acusado en las estrategias de extracción de características puras (actualmente en desuso) como la estrategia F0-F1-F2, debido a que, por ejemplo, en presencia de ruidos impulsivos o ruidos estacionarios el algoritmo de estimación de F0 tarda mucho en estabilizarse, proporcionando una estimulación que no representa el tono fundamental de la señal de voz. En general, la aplicación de estrategias basadas en la extracción de características responde a la necesidad de paliar las limitaciones técnicas buscando soluciones que proporcionen una representación más inteligible de la voz en condiciones de silencio a costa de reducir la calidad de la representación de la señal de audio. A medida que progresa la tecnología, hay una tendencia entre los diseñadores de procesadores a reducir las operaciones basadas en la extracción de características, consiguiéndose una representación de la señal de más calidad y una mayor inteligibilidad de la voz cuando es adquirida tanto en condiciones de silencio como de ruido.

Consumo, tamaño y peso

La energía eléctrica de las baterías se utiliza fundamentalmente (a) para realizar el procesamiento de señal de acuerdo con la estrategia de estimulación, (b) para realizar la transmisión de radio frecuencia (en esta transmisión hay pérdidas cuya magnitud depende del acoplamiento entre las antenas del transmisor y del receptor-estimulador) y (c) para realizar la estimulación eléctrica de los electrodos (que requiere el establecimiento de una corriente eléctrica entre los electrodos activos y el de referencia). El consumo del sistema del implante coclear viene determinado por un conjunto amplio de factores. La tecnología electrónica utilizada va a determinar el consumo de corriente de cada microoperación de procesamiento de señal. Los avances en esta línea proporcionan continuamente circuitos de menor consumo lo que permite simultáneamente reducir el consumo total del sistema y aumentar el número de operaciones que se realizan en el procesador. La estrategia de codificación, teniendo en cuenta el número de electrodos estimulados en cada ciclo, la tasa de estimulación, etc. va a determinar el número de operaciones necesarias y por tanto va a afectar al consumo total del sistema. El uso de DSP's (Digital Signal Processors) de propósito específico con un diseño muy cuidadoso de las técnicas de procesamiento de señal ha permitido reducciones muy importantes del consumo frente a la utilización de DSP's de propósito general. El número de electrodos y tipo de estimulación, así como los requerimiento de corriente en cada electrodo, específicos para cada paciente, determinará el consumo de corriente asociado a la estimulación eléctrica.

El tamaño y peso del procesador están condicionados por el tamaño y peso de los circuitos electrónicos y de las baterías. El peso dedicado a las baterías depende de la autonomía que se quiera dar al equipo y la capacidad de las baterías utilizadas. De igual modo que el progreso en el campo de la electrónica proporciona circuitos cada vez más pequeños y con menor consumo, el trabajo de investigación en el campo de los acumuladores de energía eléctrica está proporcionando baterías con mayor capacidad y menor peso y tamaño, lo que permite simultáneamente mayor autonomía y comodidad de los sistemas. La reducción del peso y tamaño del sistema ha permitido, en la década de los 80, el cambio de los procesadores de maletín a los de petaca y recientemente el cambio de los procesadores de petaca a los retroauriculares. Aunque algunos fabricantes han reducido prestaciones en las versiones retroauriculares con respecto a las de petaca, los avances en las tecnologías electrónicas permiten el diseño de procesadores retroauriculares con las máximas prestaciones y en algunas marcas, la utilización de un procesador retroauricular no supone una renuncia a la calidad en la percepción.

En la actualidad todos los sistemas para implantes cocleares que se fabrican proporcionan un grado de calidad aceptable, de modo que llevando un procesador de petaca o retroauricular, el sistema proporciona una representación de la señal de voz con calidad suficiente como para mantener una conversación fluida sin apoyo visual. Aunque existen diferencias en la cuanto a la calidad que proporcionan los distintos modelos, dependiendo de la solución adoptada frente a los distintos compromisos, la estrategia de codificación utilizada y la tecnología electrónica aplicada, debe tenerse en cuenta que el objetivo principal de los implantes cocleares es permitir la comunicación oral y el desarrollo de habilidades comunicativas en los pacientes implantados. Los constantes avances tecnológicos que se realizan en la actualidad hacen que continuamente se puedan incorporar mejoras en distintos aspectos de los sistemas de implantes cocleares. En este sentido, la situación actual de competencia entre los distintos fabricantes de implantes cocleares está siendo muy beneficiosa pues está garantizando la transferencia rápida de los nuevos avances tecnológicos a los equipos de los implantes cocleares y está impulsando la investigación orientada a mejorar los distintos aspectos comentados anteriormente.

Posibilidades y limitaciones de los implantes cocleares

Cuando se analizó el procesamiento de la señal de audio que se realiza en el oído, se vio que el oído normal permite la percepción de la frecuencia a través de los mecanismos tonotópico y de codificación temporal, con un rango espectral de 20 Hz a 20 kHz y una resolución espectral próxima a 1/10 de tono. También permite percepción de la intensidad, con resoluciones que pueden llegar a 1 dB, en el rango entre 0 dB y 120 dB SPL. Finalmente, el mecanismo de transducción auditiva permite representar en el nervio auditivo la evolución temporal de las propiedades espectrales de la señal de audio.

Se ha visto también que el diseño de los electrodos tiene implícita una reducción importante de la resolución espectral tonotópica. Por esta razón, el rango espectral en los implantes cocleares está reducido a la banda entre 250–300 Hz y 5000–8500 Hz, según los modelos. El implante coclear permite resolver distintos niveles de intensidad, siendo posible alcanzar resoluciones próximas a 3 dB. Finalmente, dependiendo de la tasa de estimulación, los implantes proporcionan una representación de la evolución temporal de la señal de audio, alcanzándose una representación temporal similar a la audición normal en los sistemas de alta tasa de estimulación. Se ha observado los pacientes implantados, ante la imposibilidad de obtener una buena resolución espectral tonotópica, desarrollan la capacidad de extraer información a partir de la codificación temporal.

Estos aspectos condicionan las posibilidades y limitaciones de la audición con implante coclear. En la actualidad los implantes cocleares permiten una percepción auditiva con calidad suficiente para la comprensión del habla cuando es pronunciada en ausencia de ruido. En general en condiciones de ruido la comprensión de la voz se dificulta mucho más que en el caso de la audición normal, si bien dependiendo de la estrategia de codificación se aprecian diferentes comportamientos frente a los distintos niveles de ruido. Debido a la pérdida de resolución espectral tonotópica, la percepción de la música con el implante coclear pierde mucha calidad con respecto a la audición normal, encontrándose también diferencias importantes dependiendo de la estrategia de codificación.

Visita este enlace

Clasificación: 2.4 (14 votos)
Está prohibido copiar este artículo. Artículo.org no permite la sindicación de sus artículos.
Acerca del autor

www.rofimo.com

¿Tiene comentarios o preguntas para el autor?

Lo sentimos, pero no podemos procesar su petición en este momento. Por favor pruebe mas tarde. Si el problema persiste, puede contactar con nosotros pinchando sobre el enlace aquí.