Aproximación al análisis sociolingüístico del rango tonal y la velocidad de habla en el corpus PRESEEA-Valencia

Author

Adrián Cabedo Nebot

Published

January 22, 2025

Proyecto de investigación (PID2023-148371NB-C42). Estudio de los condicionantes sociales del español actual en el centro y norte de España: NUEVAS IDENTIDADES, NUEVOS RETOS, NUEVAS SOLUCIONES (ECOS-C/N)

https://ecoscn.org/

Universitat de València

Email: adrian.cabedo@uv.es

Copyright y derechos:

Presentación al LII Simposio SEL 2025 por Adrián Cabedo Nebot is licensed under CC BY 4.0

1 Introducción

La comunicación humana es un proceso general que abarca el lenguaje verbal, las señales paralingüísticas y los gestos corporales (kinésica). (Poyatos 1993, 1994).

Existe disparidad en la bibliografía sobre la relación de estos valores físicos con características sociales, como se expone en las siguientes citas:

Cita de Johnstone (en contra)

“But contexts are never equivalent, because no two speakers could possibly be linguistically identical. In the inevitable sense that no two people share exactly the same linguistic memories, no two people speak alike: every speaker is idiosyncratic. Class, sex, age, region, the nature of the linguistic task, and the makeup of the audience all have an important bearing on how people sound; but they do not determine how people sound. These social facts, along with other factors such as ethnicity, ideology, and identity, provide (or withhold) resources among which individuals choose as they decide how to be and talk.” (Johnstone and Bean 1997, 236)

Cita de Abercombrie (a favor)

Abercrombie (1968: 55) notes: “Paralinguistic phenomena are neither idiosyncratic and personal, on the one hand, nor generally human, on the other. They must, therefore, be culturally determined, and so, as one would expect, they differ from social group to social group.”

Este estudio explora el rango tonal y la velocidad del habla, dos características paralingüísticas, en relación con factores sociolingüísticos como la edad, el sexo y el nivel de instrucción. Utilizando datos del proyecto PRESEEA-Valencia (Molina 2001, 2005, 2007; Cabedo Nebot, n.d.), esta investigación aborda aspectos aún poco estudiados en el análisis sociofonético mediante el uso de herramientas como Oralstats para el procesamiento y la visualización de datos.

Enlace a la web del proyecto PRESEEA

Información del proyecto Preseea está disponible en https://preseea.uah.es/

Las preguntas de las entrevistas pueden encontrarse en la guía del proyecto desarrollada por Moreno Fernández (2021):

Guía metodológica

Un ejemplo sería el siguiente:

Ejemplo extraído de una entrevista

Entrevistador: ¿y alguna vez/ ahora rememorando el pasado/ te ha sucedido alguna anécdota especial/ algún premio/ alguna enfermedad?

Entrevistado: la verdad que premio/ espero que me toque algún día porque no me ha tocado/ nunca/ pero yo sigo jugando (RISAS)/ aunque modestamente y poco/ la verdad que no me gasto mucho dinero/ pero sí que me gusta jugar/ sobre todo en Navidad// en Navidad sí que tengo que jugar y todos los que me ofrecen/ yo

Entrevistador:¿así que juegas algunos juegos de azar/ como la lotería?

Entrevistado: no/ no/ la lotería/ sí/ la lotería/ sí// jugamos pues eso a la la lotería// nada más que no hago ni primitiva ni la once ni nada/ yo// compramos décimos casi siempre a medias/ con amigos/ con compañeros// o si me compro un décimo son de estos vamos/ nada/ de de/ que no llegan ni a 20 euros// y espero que algún día me toque porque la verdad que no sé/ no tengo ni idea/ qué sensación es la de cuando te toca tanto dinero/ y no sabes qué hacer con él

Entrevistador: y que te/ bueno/ has dicho que no sabes qué hacer con él/ pero ¿qué te gustaría/ en el caso de que te tocara/ qué te gustaría/ hacer con ese dinero?

Entrevistado: primer que todo/ tapar todos los agujeros/ aunque es un clásico/ pero tapar todos los agujeros que tenemos/ en todas las casas hay/ me imagino// y luego/ pues nada/ poder darle a mis hijos lo que ellos quieran/ y/ y lo que quede/ pues nada/ disfrutar de la vida…

Características sociolingüísticas del entrevistado: mujer, 36 a 55 años y de nivel medio. Entrevista 23. (Cabedo Nebot, n.d.)

2 Consideraciones previas (I)

Paralingüístico	condiciones biológicas y/o fisiológicas	factores sociales
	comunidad de habla	fuerte componente valorativo
características y modificaciones de naturaleza fonética	valores de ausencia de voz, comúnmente pausas o silencios (Cestero Mancera 2014)	(Crystal 2004; Poyatos 1993; Docherty 2022; Romaine 2000)

3 Consideraciones previas (rango tonal)

Permite relativizar	Semitonos	Permite comparar hombres y mujeres
200-400 Hz voz femenina \| 80-200 Hz voz masculina	12 o 15 semitonos de diferencia (Real Academia de la Lengua Española 2011)	(De Looze, Scherer, Vaughan y Campbell 2014)
rangos tonales elevados (alegría, miedo o sorpresa)	rangos tonales bajos para la manifestación de la tristeza	(Rodríguez Bravo et al. 1999; Garrido Almiñana 2011)

4 Consideraciones previas (velocidad de habla)

Velocidad de habla	Español	“in Mediterranean countries, especially in Spain, speech is faster than in other countries” (Rodero 2012: 406).
diferentes opciones de medida	210-230 palabras por minuto

5 Metodología

5.1 Recolección de datos

Corpus:
196 entrevistas provenientes del proyecto PRESEEA-Valencia realizadas entre 2019 y 2023.
Enfoque:
Muestreo estratificado de 58 entrevistas, que incluyen un total de 116 hablantes.
Herramientas de procesamiento:
- Whisper: Utilizado para la transcripción automática.
- Montreal Forced Alignment: Empleado para la alineación de fonemas con las transcripciones.

5.2 Imagen de PRAAT

5.3 Base de datos

variable	sex=female & education=high	sex=male & education=high	sex=female & education=low	sex=male & education=low	sex=female & education=medium	sex=male & education=medium	Total
18-35	17	10	1	1	4	1	34
35-55	2	7	1	1	2	1	14
55-	3	1	1	1	3	1	10
Total	22	18	3	3	9	3	58

Tabla. Distribución de las entrevistas recogidas en el año 2020

Características de los datos de la investigación

4500 grupos entonativos (250 por hablante)
Año 2020
Reducción del análisis a 18 hablantes distintos (cada uno representa a una categoría distinta)
Secuencias comprendidas entre el minuto 15 y 30
Total de 270 minutos (4 horas y media)
Compromiso de confidencialidad aceptado y tratamiento anónimo de lo datos
Variables dependientes: rango tonal (semitonos) y velocidad de habla (palabras por segundo)

5.4 Análisis estadístico

El GLM (Modelo Lineal Generalizado) es una herramienta estadística fundamental porque permite analizar relaciones entre una variable dependiente continua (como el rango tonal o la velocidad de habla) y múltiples variables independientes, tanto continuas como categóricas (como el sexo, la edad o el nivel educativo). A diferencia de los modelos lineales simples, el GLM puede manejar distribuciones no normales de la variable dependiente y modelar interacciones entre las variables, proporcionando una representación más precisa y flexible de los datos. Además, nos permite identificar efectos significativos, calcular predicciones ajustadas y estimar intervalos de confianza, lo que facilita la comprensión de cómo las características sociolingüísticas influyen en los patrones observados en los datos. En este caso, el GLM es esencial para capturar las complejas relaciones entre el sexo, la edad y la educación con las características fonéticas analizadas.
Histogramas, diagramas de caja.

6 Resultados

6.1 Rango tonal

6.1.1 Ejemplos

factor	text	range_st
fem hig 18	años todavía no sabiendo hablar alemán	5.900
fem hig 35	por sí solas no se autofinancian	19.500
fem hig 55	ahora ya no vamos	0.600
fem low 18	aunque no haya	3.375
fem low 35	ahora ya no es tan delgado	21.200
fem low 55	si no querías bailar no bailabas	5.600
fem med 18	verdad es que no éramos muy amigas pero	15.300
fem med 35	aunque no fuera en	3.200
fem med 55	que ellos no conocían	6.700
mal hig 18	bicis no pero estilo	20.800
mal hig 35	o no eso pues resta	15.900
mal hig 55	pero no haría reparto	9.600
mal low 18	aunque no haya	2.700
mal low 35	ya no solo eso	9.500
mal low 55	porque si no no vamos a salir del agujero	6.500
mal med 18	una vecina que yo tenía enfrente que ya no es vecina mía	29.700
mal med 35	al pasapalabra que antes no lo veía pero me gusta bastante	8.300
mal med 55	pero no creo que el componente religioso tenga ya mucho	4.500

6.1.2 Rango tonal (histograma)

Table 4. Samples for every factor of the database with range

6.1.3 Diagrama de caja

6.1.4 GLM

term	estimate	std.error	statistic	p.value
(Intercept)	0.10	0.00	24.84	0.00
sexmale	0.00	0.01	-0.95	0.34
educationlow	-0.01	0.01	-2.33	0.02
educationmedium	-0.01	0.01	-1.92	0.06
age35-55	-0.01	0.01	-0.95	0.34
age55-	0.10	0.01	11.31	0.00
sexmale:educationlow	0.03	0.01	3.50	0.00
sexmale:educationmedium	0.00	0.01	0.70	0.48
sexmale:age35-55	-0.01	0.01	-0.92	0.36
sexmale:age55-	-0.08	0.01	-7.72	0.00
educationlow:age35-55	0.03	0.01	4.05	0.00
educationmedium:age35-55	0.04	0.01	5.25	0.00
educationlow:age55-	-0.08	0.01	-7.51	0.00
educationmedium:age55-	-0.10	0.01	-10.38	0.00
sexmale:educationlow:age35-55	-0.04	0.01	-3.97	0.00
sexmale:educationmedium:age35-55	0.06	0.01	4.86	0.00
sexmale:educationlow:age55-	0.07	0.01	4.92	0.00
sexmale:educationmedium:age55-	0.27	0.02	16.38	0.00

6.2 Velocidad de habla

6.2.1 Ejemplos

factor	text	dur	rate
fem hig 18	ahí los que tienen que fumar y cuando acaban siguen su camino y ya está	2,980	5.0300
fem hig 55	ahora ya no vamos	740	5.4100
fem low 18	y ya que estamos hablando del vino	2,020	2.9495
fem low 35	ahora ya no es tan delgado	1,510	3.9700
fem low 55	cuando yo ya vine a vivir aquí	1,680	4.1700
fem med 18	he aprendido a ser una persona paciente ya que antes era muy impaciente	4,140	3.1400
fem med 35	a los abuelitos ya a gandía paqui	2,550	2.7500
mal hig 18	desde hace ya un tiempecillo que no tengo otro	2,120	4.2500
mal hig 35	además ya se está produciendo	1,100	4.5500
mal hig 55	y la quiniela o eso ya no	1,110	6.3100
mal low 18	y ya que estamos hablando del vino	2,020	3.4700
mal low 35	pues entonces mis amigos estos pequeños pues yo ya he dicho antes	3,560	3.3700
mal low 55	y metiéndose ya en las ciudades y en los pueblos	3,180	3.1400
mal med 18	una vecina que yo tenía enfrente que ya no es vecina mía	2,270	5.2900
mal med 35	sobre todo el pasapalabra ya lo tengo más aficionado ahora	2,540	3.9400
mal med 55	pero no creo que el componente religioso tenga ya mucho	3,160	3.1600

Table 4. Samples for every factor of the database with rate

6.2.2 Velocidad de habla (histograma)

6.2.3 Diagrama de caja

6.2.4 GLM

term	estimate	std.error	statistic	p.value
(Intercept)	0.18	0.01	13.53	0.00
sexmale	0.13	0.03	4.73	0.00
educationlow	0.13	0.03	4.86	0.00
educationmedium	0.13	0.03	4.78	0.00
age35-55	0.11	0.03	4.19	0.00
age55-	0.03	0.02	1.46	0.14
sexmale:educationlow	-0.17	0.04	-4.27	0.00
sexmale:educationmedium	-0.16	0.04	-3.83	0.00
sexmale:age35-55	-0.10	0.04	-2.47	0.01
sexmale:age55-	-0.14	0.03	-4.18	0.00
educationlow:age35-55	-0.13	0.04	-3.22	0.00
educationmedium:age35-55	-0.18	0.04	-4.76	0.00
educationlow:age55-	-0.16	0.03	-4.68	0.00
educationmedium:age55-	-0.06	0.04	-1.57	0.12
sexmale:educationlow:age35-55	0.10	0.06	1.65	0.10
sexmale:educationmedium:age35-55	0.13	0.06	2.36	0.02
sexmale:educationlow:age55-	0.28	0.05	5.41	0.00
sexmale:educationmedium:age55-	0.17	0.05	3.08	0.00

:::

6.3 Recopilación

factor	rango (z-score)	velocidad (z-score)	coincidencia
fem hig 18	↔︎ (0.0842)	🐇 (0.194)	☝️
fem hig 35	↗ (0.168)	⚖️ (-0.0719)	☝️
fem hig 55	↘ (-0.559)	🐇 (0.187)	🎉
fem low 18	↗ (0.368)	🐢 (-0.151)	🎉
fem low 35	↔︎ (-0.0995)	⚖️ (-0.0945)	🤷‍♂️
fem low 55	↔︎ (0.0536)	🐇 (0.238)	☝️
fem med 18	↗ (0.322)	⚖️ (-0.0451)	☝️
fem med 35	↘ (-0.199)	⚖️ (0.0515)	☝️
fem med 55	↗ (0.582)	⚖️ (0.0118)	☝️
mal hig 18	↗ (0.306)	⚖️ (-0.116)	☝️
mal hig 35	↗ (0.605)	⚖️ (-0.0494)	☝️
mal hig 55	↔︎ (-0.0306)	🐇 (0.233)	☝️
mal low 18	↔︎ (0.0459)	⚖️ (-0.0515)	🤷‍♂️
mal low 35	↗ (0.337)	⚖️ (0.0708)	☝️
mal low 55	↔︎ (-0.0306)	⚖️ (-0.0580)	🤷‍♂️
mal med 18	↘ (-0.276)	⚖️ (-0.0601)	☝️
mal med 35	↘ (-0.475)	⚖️ (0.0129)	☝️
mal med 55	↘ (-0.689)	⚖️ (-0.0215)	☝️

Table 4. Resumen de los valores de rango tonal y velocidad de habla con valores Z

Resultados por grupo sociolingüístico

En esta clasificación, se considera “normal” todo valor de z_score comprendido entre -0.15 y 0.15 (es una valoración descriptiva y no inferencial; no hay valores que superen el 1.96).

Se combinan tres posibles niveles de rango tonal (amplio, normal, reducido) y tres de velocidad de habla (rápida, normal, lenta). A continuación se muestra qué categorías se dan en estos datos y con qué frecuencia, así como un breve comentario sobre sexo, edad y nivel:

Rango amplio y velocidad rápida
- No aparece en la muestra.
Rango amplio y velocidad lenta
- Solo 1 caso: “fem low 18” (z_range = 0.368; z_rate = -0.151).
- Mujer joven de nivel bajo.
Rango reducido y velocidad rápida
- Solo 1 caso: “fem hig 55” (z_range = -0.559; z_rate = 0.187).
- Mujer mayor de nivel alto .
Rango reducido y velocidad lenta
- No aparece en la muestra.
Rango amplio y velocidad normal
- 6 casos (por ejemplo, “fem hig 35”, “fem med 18”, “mal hig 18”, “mal hig 35”, etc.).
- Tanto hombres como mujeres (con ligera mayoría masculina en nivel alto y femenina en varios niveles).
Rango reducido y velocidad normal
- 4 casos (ej. “fem med 35” o “mal med 18/35/55”).
- Principalmente hombres de nivel medio y distintas edades, más alguna mujer; su pauta es poco cambio tonal y ritmo medio.
Rango normal y velocidad rápida
- 3 casos (“fem hig 18”, “fem low 55” y “mal hig 55”).
- Aparecen en sexo tanto femenino como masculino, sin concentración clara de edad o nivel.
Rango normal y velocidad lenta
- No aparece en la muestra.
Rango y velocidad normales
- 3 casos (“fem low 35”, “mal low 18”, “mal low 55”).
- Uno de ellos es una mujer de 35 años (nivel bajo) y los otros dos son hombres (18 y 55 años, nivel bajo).

Comentario global

Aunque se detectan un par de casos “extremos” (rango muy amplio/velocidad muy lenta o viceversa), la mayoría de locutores se ubican en combinaciones de rango amplio/normal y velocidad normal o en rangos normales con velocidad algo acelerada.
Las mujeres tienden a aparecer más en categorías de rango amplio, a menudo con velocidad normal o incluso rápida, mientras que los hombres se reparten principalmente entre un rango amplio o normal, con preferencia a la velocidad normal. No obstante, existe un caso de mujer mayor con rango muy reducido y velocidad rápida, mostrando que hay excepciones notables.
Respecto a la edad, se observa que los 18 y los 35 pueden presentar rangos amplios, mientras que a los 55 se dan ejemplos tanto de rango amplio como reducido. Los niveles (hig, low, med) también modulan estos comportamientos, aunque no existe una sola relación lineal: encontramos alta variación tonal tanto en niveles altos como en bajos, si bien los hombres de nivel med se inclinan más al rango reducido.

Resultado final: parece que algunos autores tienen razón al señalar que los grupos sociolingüísticos no tienen que condicionar la libertad del individio en lo fónico (Johnstone and Bean 1997). Al menos, no se observa una relación amplia en cuanto a valores fónicos por cada grupo social.

7 Futuro

Incluir más participantes y equilibrar sexo, edad, nivel, etc., para obtener resultados más representativos.
Registrar habla espontánea,interacción en distintos registros (formal, coloquial) y otros géneros discursivos.
Considerar indicadores adicionales (duración de pausas, patrones fonológicos etc.).
Combinar datos acústicos con juicios de oyentes sobre dinamismo, expresividad o claridad, para vincular lo medido con la percepción.
Emplear análisis de clasificación (árboles de decisión, redes neuronales…).

8 Referencias

Abercrombie, D. 1968. “Paralanguage.” British Journal of Disorders of Communication 3: 55–59.

Cabedo Nebot, Adrián. n.d. Corpus PRESEEA 2022. Valencia: Universitat de València.

Johnstone, Barbara, and Judith Mattson Bean. 1997. “Self-Expression and Linguistic Variation.” Language in Society 26 (2): 221–46. https://doi.org/10.1017/S0047404500020911.

Molina, José Ramón Gómez. 2001. El Español Hablado de Valencia, i: Materiales Para Su Estudio. Nivel Sociocultural Alto. Quaderns de Filologia.

———. 2005. El Español Hablado de Valencia. Materiales Para Su Estudio (PRESEEA). II Nivel Sociocultural Medio. Quaderns de Filologia.

———. 2007. El Español Hablado de Valencia. Materiales Para Su Estudio (PRESEEA). III Nivel Sociocultural Bajo. Quaderns de Filologia.

Moreno Fernández, Francisco. 2021. “Metodología Del “Proyecto Para El Estudio Sociolingüístico Del Español de España y de América (PRESEEA).” Documentos PRESEEA de Investigación, Documentos de Trabajo 1. https://doi.org/10.37536/preseea.2021.doc1.

Poyatos, Fernando. 1993. Paralanguage: A Linguistic and Interdisciplinary Approach to Interactive Speech and Sounds. Vol. 92. Current Issues in Linguistic Theory. Amsterdam: John Benjamins Publishing Company. https://doi.org/10.1075/cilt.92.

———. 1994. La Comunicación No Verbal. Istmo. https://dialnet.unirioja.es/servlet/extlib?codigo=22005.