variable | sex=female & education=high | sex=male & education=high | sex=female & education=low | sex=male & education=low | sex=female & education=medium | sex=male & education=medium | Total |
---|---|---|---|---|---|---|---|
18-35 | 17 | 10 | 1 | 1 | 4 | 1 | 34 |
35-55 | 2 | 7 | 1 | 1 | 2 | 1 | 14 |
55- | 3 | 1 | 1 | 1 | 3 | 1 | 10 |
Total | 22 | 18 | 3 | 3 | 9 | 3 | 58 |
Aproximación al análisis sociolingüístico del rango tonal y la velocidad de habla en el corpus PRESEEA-Valencia
Proyecto de investigación (PID2023-148371NB-C42). Estudio de los condicionantes sociales del español actual en el centro y norte de España: NUEVAS IDENTIDADES, NUEVOS RETOS, NUEVAS SOLUCIONES (ECOS-C/N)
Universitat de València
Email: adrian.cabedo@uv.es
Copyright y derechos:
Presentación al LII Simposio SEL 2025 por Adrián Cabedo Nebot is licensed under CC BY 4.0
1 Introducción
La comunicación humana es un proceso general que abarca el lenguaje verbal, las señales paralingüísticas y los gestos corporales (kinésica). (Poyatos 1993, 1994).
Existe disparidad en la bibliografía sobre la relación de estos valores físicos con características sociales, como se expone en las siguientes citas:
“But contexts are never equivalent, because no two speakers could possibly be linguistically identical. In the inevitable sense that no two people share exactly the same linguistic memories, no two people speak alike: every speaker is idiosyncratic. Class, sex, age, region, the nature of the linguistic task, and the makeup of the audience all have an important bearing on how people sound; but they do not determine how people sound. These social facts, along with other factors such as ethnicity, ideology, and identity, provide (or withhold) resources among which individuals choose as they decide how to be and talk.” (Johnstone and Bean 1997, 236)
Abercrombie (1968: 55) notes: “Paralinguistic phenomena are neither idiosyncratic and personal, on the one hand, nor generally human, on the other. They must, therefore, be culturally determined, and so, as one would expect, they differ from social group to social group.”
Este estudio explora el rango tonal y la velocidad del habla, dos características paralingüísticas, en relación con factores sociolingüísticos como la edad, el sexo y el nivel de instrucción. Utilizando datos del proyecto PRESEEA-Valencia (Molina 2001, 2005, 2007; Cabedo Nebot, n.d.), esta investigación aborda aspectos aún poco estudiados en el análisis sociofonético mediante el uso de herramientas como Oralstats para el procesamiento y la visualización de datos.
Información del proyecto Preseea está disponible en https://preseea.uah.es/
Las preguntas de las entrevistas pueden encontrarse en la guía del proyecto desarrollada por Moreno Fernández (2021):
Un ejemplo sería el siguiente:
Entrevistador: ¿y alguna vez/ ahora rememorando el pasado/ te ha sucedido alguna anécdota especial/ algún premio/ alguna enfermedad?
Entrevistado: la verdad que premio/ espero que me toque algún día porque no me ha tocado/ nunca/ pero yo sigo jugando (RISAS)/ aunque modestamente y poco/ la verdad que no me gasto mucho dinero/ pero sí que me gusta jugar/ sobre todo en Navidad// en Navidad sí que tengo que jugar y todos los que me ofrecen/ yo
Entrevistador:¿así que juegas algunos juegos de azar/ como la lotería?
Entrevistado: no/ no/ la lotería/ sí/ la lotería/ sí// jugamos pues eso a la la lotería// nada más que no hago ni primitiva ni la once ni nada/ yo// compramos décimos casi siempre a medias/ con amigos/ con compañeros// o si me compro un décimo son de estos vamos/ nada/ de de/ que no llegan ni a 20 euros// y espero que algún día me toque porque la verdad que no sé/ no tengo ni idea/ qué sensación es la de cuando te toca tanto dinero/ y no sabes qué hacer con él
Entrevistador: y que te/ bueno/ has dicho que no sabes qué hacer con él/ pero ¿qué te gustaría/ en el caso de que te tocara/ qué te gustaría/ hacer con ese dinero?
Entrevistado: primer que todo/ tapar todos los agujeros/ aunque es un clásico/ pero tapar todos los agujeros que tenemos/ en todas las casas hay/ me imagino// y luego/ pues nada/ poder darle a mis hijos lo que ellos quieran/ y/ y lo que quede/ pues nada/ disfrutar de la vida…
Características sociolingüísticas del entrevistado: mujer, 36 a 55 años y de nivel medio. Entrevista 23. (Cabedo Nebot, n.d.)
2 Consideraciones previas (I)
Paralingüístico | condiciones biológicas y/o fisiológicas | factores sociales |
comunidad de habla | fuerte componente valorativo | |
características y modificaciones de naturaleza fonética | valores de ausencia de voz, comúnmente pausas o silencios (Cestero Mancera 2014) | (Crystal 2004; Poyatos 1993; Docherty 2022; Romaine 2000) |
3 Consideraciones previas (rango tonal)
Permite relativizar | Semitonos | Permite comparar hombres y mujeres |
200-400 Hz voz femenina | 80-200 Hz voz masculina | 12 o 15 semitonos de diferencia (Real Academia de la Lengua Española 2011) | (De Looze, Scherer, Vaughan y Campbell 2014) |
rangos tonales elevados (alegría, miedo o sorpresa) | rangos tonales bajos para la manifestación de la tristeza | (Rodríguez Bravo et al. 1999; Garrido Almiñana 2011) |
4 Consideraciones previas (velocidad de habla)
Velocidad de habla | Español | “in Mediterranean countries, especially in Spain, speech is faster than in other countries” (Rodero 2012: 406). |
diferentes opciones de medida | 210-230 palabras por minuto |
5 Metodología
5.1 Recolección de datos
Corpus:
196 entrevistas provenientes del proyecto PRESEEA-Valencia realizadas entre 2019 y 2023.Enfoque:
Muestreo estratificado de 58 entrevistas, que incluyen un total de 116 hablantes.Herramientas de procesamiento:
- Whisper: Utilizado para la transcripción automática.
- Montreal Forced Alignment: Empleado para la alineación de fonemas con las transcripciones.
- Whisper: Utilizado para la transcripción automática.
5.2 Imagen de PRAAT
5.3 Base de datos
Tabla. Distribución de las entrevistas recogidas en el año 2020
- 4500 grupos entonativos (250 por hablante)
- Año 2020
- Reducción del análisis a 18 hablantes distintos (cada uno representa a una categoría distinta)
- Secuencias comprendidas entre el minuto 15 y 30
- Total de 270 minutos (4 horas y media)
- Compromiso de confidencialidad aceptado y tratamiento anónimo de lo datos
- Variables dependientes: rango tonal (semitonos) y velocidad de habla (palabras por segundo)
5.4 Análisis estadístico
El GLM (Modelo Lineal Generalizado) es una herramienta estadística fundamental porque permite analizar relaciones entre una variable dependiente continua (como el rango tonal o la velocidad de habla) y múltiples variables independientes, tanto continuas como categóricas (como el sexo, la edad o el nivel educativo). A diferencia de los modelos lineales simples, el GLM puede manejar distribuciones no normales de la variable dependiente y modelar interacciones entre las variables, proporcionando una representación más precisa y flexible de los datos. Además, nos permite identificar efectos significativos, calcular predicciones ajustadas y estimar intervalos de confianza, lo que facilita la comprensión de cómo las características sociolingüísticas influyen en los patrones observados en los datos. En este caso, el GLM es esencial para capturar las complejas relaciones entre el sexo, la edad y la educación con las características fonéticas analizadas.
Histogramas, diagramas de caja.
6 Resultados
6.1 Rango tonal
6.1.1 Ejemplos
factor | text | range_st |
---|---|---|
fem hig 18 | años todavía no sabiendo hablar alemán | 5.900 |
fem hig 35 | por sí solas no se autofinancian | 19.500 |
fem hig 55 | ahora ya no vamos | 0.600 |
fem low 18 | aunque no haya | 3.375 |
fem low 35 | ahora ya no es tan delgado | 21.200 |
fem low 55 | si no querías bailar no bailabas | 5.600 |
fem med 18 | verdad es que no éramos muy amigas pero | 15.300 |
fem med 35 | aunque no fuera en | 3.200 |
fem med 55 | que ellos no conocían | 6.700 |
mal hig 18 | bicis no pero estilo | 20.800 |
mal hig 35 | o no eso pues resta | 15.900 |
mal hig 55 | pero no haría reparto | 9.600 |
mal low 18 | aunque no haya | 2.700 |
mal low 35 | ya no solo eso | 9.500 |
mal low 55 | porque si no no vamos a salir del agujero | 6.500 |
mal med 18 | una vecina que yo tenía enfrente que ya no es vecina mía | 29.700 |
mal med 35 | al pasapalabra que antes no lo veía pero me gusta bastante | 8.300 |
mal med 55 | pero no creo que el componente religioso tenga ya mucho | 4.500 |
6.1.2 Rango tonal (histograma)
Table 4. Samples for every factor of the database with range
6.1.3 Diagrama de caja
6.1.4 GLM
term | estimate | std.error | statistic | p.value |
---|---|---|---|---|
(Intercept) | 0.10 | 0.00 | 24.84 | 0.00 |
sexmale | 0.00 | 0.01 | -0.95 | 0.34 |
educationlow | -0.01 | 0.01 | -2.33 | 0.02 |
educationmedium | -0.01 | 0.01 | -1.92 | 0.06 |
age35-55 | -0.01 | 0.01 | -0.95 | 0.34 |
age55- | 0.10 | 0.01 | 11.31 | 0.00 |
sexmale:educationlow | 0.03 | 0.01 | 3.50 | 0.00 |
sexmale:educationmedium | 0.00 | 0.01 | 0.70 | 0.48 |
sexmale:age35-55 | -0.01 | 0.01 | -0.92 | 0.36 |
sexmale:age55- | -0.08 | 0.01 | -7.72 | 0.00 |
educationlow:age35-55 | 0.03 | 0.01 | 4.05 | 0.00 |
educationmedium:age35-55 | 0.04 | 0.01 | 5.25 | 0.00 |
educationlow:age55- | -0.08 | 0.01 | -7.51 | 0.00 |
educationmedium:age55- | -0.10 | 0.01 | -10.38 | 0.00 |
sexmale:educationlow:age35-55 | -0.04 | 0.01 | -3.97 | 0.00 |
sexmale:educationmedium:age35-55 | 0.06 | 0.01 | 4.86 | 0.00 |
sexmale:educationlow:age55- | 0.07 | 0.01 | 4.92 | 0.00 |
sexmale:educationmedium:age55- | 0.27 | 0.02 | 16.38 | 0.00 |
6.2 Velocidad de habla
6.2.1 Ejemplos
factor | text | dur | rate |
---|---|---|---|
fem hig 18 | ahí los que tienen que fumar y cuando acaban siguen su camino y ya está | 2,980 | 5.0300 |
fem hig 55 | ahora ya no vamos | 740 | 5.4100 |
fem low 18 | y ya que estamos hablando del vino | 2,020 | 2.9495 |
fem low 35 | ahora ya no es tan delgado | 1,510 | 3.9700 |
fem low 55 | cuando yo ya vine a vivir aquí | 1,680 | 4.1700 |
fem med 18 | he aprendido a ser una persona paciente ya que antes era muy impaciente | 4,140 | 3.1400 |
fem med 35 | a los abuelitos ya a gandía paqui | 2,550 | 2.7500 |
mal hig 18 | desde hace ya un tiempecillo que no tengo otro | 2,120 | 4.2500 |
mal hig 35 | además ya se está produciendo | 1,100 | 4.5500 |
mal hig 55 | y la quiniela o eso ya no | 1,110 | 6.3100 |
mal low 18 | y ya que estamos hablando del vino | 2,020 | 3.4700 |
mal low 35 | pues entonces mis amigos estos pequeños pues yo ya he dicho antes | 3,560 | 3.3700 |
mal low 55 | y metiéndose ya en las ciudades y en los pueblos | 3,180 | 3.1400 |
mal med 18 | una vecina que yo tenía enfrente que ya no es vecina mía | 2,270 | 5.2900 |
mal med 35 | sobre todo el pasapalabra ya lo tengo más aficionado ahora | 2,540 | 3.9400 |
mal med 55 | pero no creo que el componente religioso tenga ya mucho | 3,160 | 3.1600 |
Table 4. Samples for every factor of the database with rate
6.2.2 Velocidad de habla (histograma)
6.2.3 Diagrama de caja
6.2.4 GLM
term | estimate | std.error | statistic | p.value |
---|---|---|---|---|
(Intercept) | 0.18 | 0.01 | 13.53 | 0.00 |
sexmale | 0.13 | 0.03 | 4.73 | 0.00 |
educationlow | 0.13 | 0.03 | 4.86 | 0.00 |
educationmedium | 0.13 | 0.03 | 4.78 | 0.00 |
age35-55 | 0.11 | 0.03 | 4.19 | 0.00 |
age55- | 0.03 | 0.02 | 1.46 | 0.14 |
sexmale:educationlow | -0.17 | 0.04 | -4.27 | 0.00 |
sexmale:educationmedium | -0.16 | 0.04 | -3.83 | 0.00 |
sexmale:age35-55 | -0.10 | 0.04 | -2.47 | 0.01 |
sexmale:age55- | -0.14 | 0.03 | -4.18 | 0.00 |
educationlow:age35-55 | -0.13 | 0.04 | -3.22 | 0.00 |
educationmedium:age35-55 | -0.18 | 0.04 | -4.76 | 0.00 |
educationlow:age55- | -0.16 | 0.03 | -4.68 | 0.00 |
educationmedium:age55- | -0.06 | 0.04 | -1.57 | 0.12 |
sexmale:educationlow:age35-55 | 0.10 | 0.06 | 1.65 | 0.10 |
sexmale:educationmedium:age35-55 | 0.13 | 0.06 | 2.36 | 0.02 |
sexmale:educationlow:age55- | 0.28 | 0.05 | 5.41 | 0.00 |
sexmale:educationmedium:age55- | 0.17 | 0.05 | 3.08 | 0.00 |
:::
6.3 Recopilación
factor | rango (z-score) | velocidad (z-score) | coincidencia |
---|---|---|---|
fem hig 18 | ↔︎ (0.0842) | 🐇 (0.194) | ☝️ |
fem hig 35 | ↗ (0.168) | ⚖️ (-0.0719) | ☝️ |
fem hig 55 | ↘ (-0.559) | 🐇 (0.187) | 🎉 |
fem low 18 | ↗ (0.368) | 🐢 (-0.151) | 🎉 |
fem low 35 | ↔︎ (-0.0995) | ⚖️ (-0.0945) | 🤷♂️ |
fem low 55 | ↔︎ (0.0536) | 🐇 (0.238) | ☝️ |
fem med 18 | ↗ (0.322) | ⚖️ (-0.0451) | ☝️ |
fem med 35 | ↘ (-0.199) | ⚖️ (0.0515) | ☝️ |
fem med 55 | ↗ (0.582) | ⚖️ (0.0118) | ☝️ |
mal hig 18 | ↗ (0.306) | ⚖️ (-0.116) | ☝️ |
mal hig 35 | ↗ (0.605) | ⚖️ (-0.0494) | ☝️ |
mal hig 55 | ↔︎ (-0.0306) | 🐇 (0.233) | ☝️ |
mal low 18 | ↔︎ (0.0459) | ⚖️ (-0.0515) | 🤷♂️ |
mal low 35 | ↗ (0.337) | ⚖️ (0.0708) | ☝️ |
mal low 55 | ↔︎ (-0.0306) | ⚖️ (-0.0580) | 🤷♂️ |
mal med 18 | ↘ (-0.276) | ⚖️ (-0.0601) | ☝️ |
mal med 35 | ↘ (-0.475) | ⚖️ (0.0129) | ☝️ |
mal med 55 | ↘ (-0.689) | ⚖️ (-0.0215) | ☝️ |
Table 4. Resumen de los valores de rango tonal y velocidad de habla con valores Z
En esta clasificación, se considera “normal” todo valor de z_score comprendido entre -0.15 y 0.15 (es una valoración descriptiva y no inferencial; no hay valores que superen el 1.96).
Se combinan tres posibles niveles de rango tonal (amplio, normal, reducido) y tres de velocidad de habla (rápida, normal, lenta). A continuación se muestra qué categorías se dan en estos datos y con qué frecuencia, así como un breve comentario sobre sexo, edad y nivel:
- Rango amplio y velocidad rápida
- No aparece en la muestra.
- Rango amplio y velocidad lenta
- Solo 1 caso: “fem low 18” (z_range = 0.368; z_rate = -0.151).
- Mujer joven de nivel bajo.
- Solo 1 caso: “fem low 18” (z_range = 0.368; z_rate = -0.151).
- Rango reducido y velocidad rápida
- Solo 1 caso: “fem hig 55” (z_range = -0.559; z_rate = 0.187).
- Mujer mayor de nivel alto .
- Solo 1 caso: “fem hig 55” (z_range = -0.559; z_rate = 0.187).
- Rango reducido y velocidad lenta
- No aparece en la muestra.
- Rango amplio y velocidad normal
- 6 casos (por ejemplo, “fem hig 35”, “fem med 18”, “mal hig 18”, “mal hig 35”, etc.).
- Tanto hombres como mujeres (con ligera mayoría masculina en nivel alto y femenina en varios niveles).
- 6 casos (por ejemplo, “fem hig 35”, “fem med 18”, “mal hig 18”, “mal hig 35”, etc.).
- Rango reducido y velocidad normal
- 4 casos (ej. “fem med 35” o “mal med 18/35/55”).
- Principalmente hombres de nivel medio y distintas edades, más alguna mujer; su pauta es poco cambio tonal y ritmo medio.
- 4 casos (ej. “fem med 35” o “mal med 18/35/55”).
- Rango normal y velocidad rápida
- 3 casos (“fem hig 18”, “fem low 55” y “mal hig 55”).
- Aparecen en sexo tanto femenino como masculino, sin concentración clara de edad o nivel.
- 3 casos (“fem hig 18”, “fem low 55” y “mal hig 55”).
- Rango normal y velocidad lenta
- No aparece en la muestra.
- Rango y velocidad normales
- 3 casos (“fem low 35”, “mal low 18”, “mal low 55”).
- Uno de ellos es una mujer de 35 años (nivel bajo) y los otros dos son hombres (18 y 55 años, nivel bajo).
- 3 casos (“fem low 35”, “mal low 18”, “mal low 55”).
- Aunque se detectan un par de casos “extremos” (rango muy amplio/velocidad muy lenta o viceversa), la mayoría de locutores se ubican en combinaciones de rango amplio/normal y velocidad normal o en rangos normales con velocidad algo acelerada.
- Las mujeres tienden a aparecer más en categorías de rango amplio, a menudo con velocidad normal o incluso rápida, mientras que los hombres se reparten principalmente entre un rango amplio o normal, con preferencia a la velocidad normal. No obstante, existe un caso de mujer mayor con rango muy reducido y velocidad rápida, mostrando que hay excepciones notables.
- Respecto a la edad, se observa que los 18 y los 35 pueden presentar rangos amplios, mientras que a los 55 se dan ejemplos tanto de rango amplio como reducido. Los niveles (hig, low, med) también modulan estos comportamientos, aunque no existe una sola relación lineal: encontramos alta variación tonal tanto en niveles altos como en bajos, si bien los hombres de nivel med se inclinan más al rango reducido.
Resultado final: parece que algunos autores tienen razón al señalar que los grupos sociolingüísticos no tienen que condicionar la libertad del individio en lo fónico (Johnstone and Bean 1997). Al menos, no se observa una relación amplia en cuanto a valores fónicos por cada grupo social.
7 Futuro
- Incluir más participantes y equilibrar sexo, edad, nivel, etc., para obtener resultados más representativos.
- Registrar habla espontánea,interacción en distintos registros (formal, coloquial) y otros géneros discursivos.
- Considerar indicadores adicionales (duración de pausas, patrones fonológicos etc.).
- Combinar datos acústicos con juicios de oyentes sobre dinamismo, expresividad o claridad, para vincular lo medido con la percepción.
- Emplear análisis de clasificación (árboles de decisión, redes neuronales…).