Aproximación al análisis sociolingüístico del rango tonal y la velocidad de habla en el corpus PRESEEA-Valencia

Author

Adrián Cabedo Nebot

Published

January 22, 2025

Proyecto de investigación (PID2023-148371NB-C42). Estudio de los condicionantes sociales del español actual en el centro y norte de España: NUEVAS IDENTIDADES, NUEVOS RETOS, NUEVAS SOLUCIONES (ECOS-C/N)

https://ecoscn.org/

Universitat de València

Email: adrian.cabedo@uv.es

Copyright y derechos:

Presentación al LII Simposio SEL 2025 por Adrián Cabedo Nebot is licensed under CC BY 4.0

1 Introducción

La comunicación humana es un proceso general que abarca el lenguaje verbal, las señales paralingüísticas y los gestos corporales (kinésica). (Poyatos 1993, 1994).

Existe disparidad en la bibliografía sobre la relación de estos valores físicos con características sociales, como se expone en las siguientes citas:

Cita de Johnstone (en contra)

“But contexts are never equivalent, because no two speakers could possibly be linguistically identical. In the inevitable sense that no two people share exactly the same linguistic memories, no two people speak alike: every speaker is idiosyncratic. Class, sex, age, region, the nature of the linguistic task, and the makeup of the audience all have an important bearing on how people sound; but they do not determine how people sound. These social facts, along with other factors such as ethnicity, ideology, and identity, provide (or withhold) resources among which individuals choose as they decide how to be and talk.” (Johnstone and Bean 1997, 236)

Cita de Abercombrie (a favor)

Abercrombie (1968: 55) notes: “Paralinguistic phenomena are neither idiosyncratic and personal, on the one hand, nor generally human, on the other. They must, therefore, be culturally determined, and so, as one would expect, they differ from social group to social group.”

Este estudio explora el rango tonal y la velocidad del habla, dos características paralingüísticas, en relación con factores sociolingüísticos como la edad, el sexo y el nivel de instrucción. Utilizando datos del proyecto PRESEEA-Valencia (Molina 2001, 2005, 2007; Cabedo Nebot, n.d.), esta investigación aborda aspectos aún poco estudiados en el análisis sociofonético mediante el uso de herramientas como Oralstats para el procesamiento y la visualización de datos.

Enlace a la web del proyecto PRESEEA

Información del proyecto Preseea está disponible en https://preseea.uah.es/

Las preguntas de las entrevistas pueden encontrarse en la guía del proyecto desarrollada por Moreno Fernández (2021):

Guía metodológica

Un ejemplo sería el siguiente:

Ejemplo extraído de una entrevista

Entrevistador: ¿y alguna vez/ ahora rememorando el pasado/ te ha sucedido alguna anécdota especial/ algún premio/ alguna enfermedad?

Entrevistado: la verdad que premio/ espero que me toque algún día porque no me ha tocado/ nunca/ pero yo sigo jugando (RISAS)/ aunque modestamente y poco/ la verdad que no me gasto mucho dinero/ pero sí que me gusta jugar/ sobre todo en Navidad// en Navidad sí que tengo que jugar y todos los que me ofrecen/ yo

Entrevistador:¿así que juegas algunos juegos de azar/ como la lotería?

Entrevistado: no/ no/ la lotería/ sí/ la lotería/ sí// jugamos pues eso a la la lotería// nada más que no hago ni primitiva ni la once ni nada/ yo// compramos décimos casi siempre a medias/ con amigos/ con compañeros// o si me compro un décimo son de estos vamos/ nada/ de de/ que no llegan ni a 20 euros// y espero que algún día me toque porque la verdad que no sé/ no tengo ni idea/ qué sensación es la de cuando te toca tanto dinero/ y no sabes qué hacer con él

Entrevistador: y que te/ bueno/ has dicho que no sabes qué hacer con él/ pero ¿qué te gustaría/ en el caso de que te tocara/ qué te gustaría/ hacer con ese dinero?

Entrevistado: primer que todo/ tapar todos los agujeros/ aunque es un clásico/ pero tapar todos los agujeros que tenemos/ en todas las casas hay/ me imagino// y luego/ pues nada/ poder darle a mis hijos lo que ellos quieran/ y/ y lo que quede/ pues nada/ disfrutar de la vida…

Características sociolingüísticas del entrevistado: mujer, 36 a 55 años y de nivel medio. Entrevista 23. (Cabedo Nebot, n.d.)

2 Consideraciones previas (I)

Paralingüístico condiciones biológicas y/o fisiológicas factores sociales
comunidad de habla fuerte componente valorativo
características y modificaciones de naturaleza fonética valores de ausencia de voz, comúnmente pausas o silencios (Cestero Mancera 2014) (Crystal 2004; Poyatos 1993; Docherty 2022; Romaine 2000)

3 Consideraciones previas (rango tonal)

Permite relativizar Semitonos Permite comparar hombres y mujeres
200-400 Hz voz femenina | 80-200 Hz voz masculina 12 o 15 semitonos de diferencia (Real Academia de la Lengua Española 2011) (De Looze, Scherer, Vaughan y Campbell 2014)
rangos tonales elevados (alegría, miedo o sorpresa) rangos tonales bajos para la manifestación de la tristeza (Rodríguez Bravo et al. 1999; Garrido Almiñana 2011)

4 Consideraciones previas (velocidad de habla)

Velocidad de habla Español “in Mediterranean countries, especially in Spain, speech is faster than in other countries” (Rodero 2012: 406).
diferentes opciones de medida 210-230 palabras por minuto

5 Metodología

5.1 Recolección de datos

  • Corpus:
    196 entrevistas provenientes del proyecto PRESEEA-Valencia realizadas entre 2019 y 2023.

  • Enfoque:
    Muestreo estratificado de 58 entrevistas, que incluyen un total de 116 hablantes.

  • Herramientas de procesamiento:

    • Whisper: Utilizado para la transcripción automática.
    • Montreal Forced Alignment: Empleado para la alineación de fonemas con las transcripciones.

5.2 Imagen de PRAAT

5.3 Base de datos

variable

sex=female & education=high

sex=male & education=high

sex=female & education=low

sex=male & education=low

sex=female & education=medium

sex=male & education=medium

Total

18-35

17

10

1

1

4

1

34

35-55

2

7

1

1

2

1

14

55-

3

1

1

1

3

1

10

Total

22

18

3

3

9

3

58

Tabla. Distribución de las entrevistas recogidas en el año 2020

Características de los datos de la investigación
  • 4500 grupos entonativos (250 por hablante)
  • Año 2020
  • Reducción del análisis a 18 hablantes distintos (cada uno representa a una categoría distinta)
  • Secuencias comprendidas entre el minuto 15 y 30
  • Total de 270 minutos (4 horas y media)
  • Compromiso de confidencialidad aceptado y tratamiento anónimo de lo datos
  • Variables dependientes: rango tonal (semitonos) y velocidad de habla (palabras por segundo)

5.4 Análisis estadístico

  • El GLM (Modelo Lineal Generalizado) es una herramienta estadística fundamental porque permite analizar relaciones entre una variable dependiente continua (como el rango tonal o la velocidad de habla) y múltiples variables independientes, tanto continuas como categóricas (como el sexo, la edad o el nivel educativo). A diferencia de los modelos lineales simples, el GLM puede manejar distribuciones no normales de la variable dependiente y modelar interacciones entre las variables, proporcionando una representación más precisa y flexible de los datos. Además, nos permite identificar efectos significativos, calcular predicciones ajustadas y estimar intervalos de confianza, lo que facilita la comprensión de cómo las características sociolingüísticas influyen en los patrones observados en los datos. En este caso, el GLM es esencial para capturar las complejas relaciones entre el sexo, la edad y la educación con las características fonéticas analizadas.

  • Histogramas, diagramas de caja.

6 Resultados

6.1 Rango tonal

6.1.1 Ejemplos

factor

text

range_st

fem hig 18

años todavía no sabiendo hablar alemán

5.900

fem hig 35

por sí solas no se autofinancian

19.500

fem hig 55

ahora ya no vamos

0.600

fem low 18

aunque no haya

3.375

fem low 35

ahora ya no es tan delgado

21.200

fem low 55

si no querías bailar no bailabas

5.600

fem med 18

verdad es que no éramos muy amigas pero

15.300

fem med 35

aunque no fuera en

3.200

fem med 55

que ellos no conocían

6.700

mal hig 18

bicis no pero estilo

20.800

mal hig 35

o no eso pues resta

15.900

mal hig 55

pero no haría reparto

9.600

mal low 18

aunque no haya

2.700

mal low 35

ya no solo eso

9.500

mal low 55

porque si no no vamos a salir del agujero

6.500

mal med 18

una vecina que yo tenía enfrente que ya no es vecina mía

29.700

mal med 35

al pasapalabra que antes no lo veía pero me gusta bastante

8.300

mal med 55

pero no creo que el componente religioso tenga ya mucho

4.500

6.1.2 Rango tonal (histograma)

Table 4. Samples for every factor of the database with range

6.1.3 Diagrama de caja

6.1.4 GLM

term

estimate

std.error

statistic

p.value

(Intercept)

0.10

0.00

24.84

0.00

sexmale

0.00

0.01

-0.95

0.34

educationlow

-0.01

0.01

-2.33

0.02

educationmedium

-0.01

0.01

-1.92

0.06

age35-55

-0.01

0.01

-0.95

0.34

age55-

0.10

0.01

11.31

0.00

sexmale:educationlow

0.03

0.01

3.50

0.00

sexmale:educationmedium

0.00

0.01

0.70

0.48

sexmale:age35-55

-0.01

0.01

-0.92

0.36

sexmale:age55-

-0.08

0.01

-7.72

0.00

educationlow:age35-55

0.03

0.01

4.05

0.00

educationmedium:age35-55

0.04

0.01

5.25

0.00

educationlow:age55-

-0.08

0.01

-7.51

0.00

educationmedium:age55-

-0.10

0.01

-10.38

0.00

sexmale:educationlow:age35-55

-0.04

0.01

-3.97

0.00

sexmale:educationmedium:age35-55

0.06

0.01

4.86

0.00

sexmale:educationlow:age55-

0.07

0.01

4.92

0.00

sexmale:educationmedium:age55-

0.27

0.02

16.38

0.00

6.2 Velocidad de habla

6.2.1 Ejemplos

factor

text

dur

rate

fem hig 18

ahí los que tienen que fumar y cuando acaban siguen su camino y ya está

2,980

5.0300

fem hig 55

ahora ya no vamos

740

5.4100

fem low 18

y ya que estamos hablando del vino

2,020

2.9495

fem low 35

ahora ya no es tan delgado

1,510

3.9700

fem low 55

cuando yo ya vine a vivir aquí

1,680

4.1700

fem med 18

he aprendido a ser una persona paciente ya que antes era muy impaciente

4,140

3.1400

fem med 35

a los abuelitos ya a gandía paqui

2,550

2.7500

mal hig 18

desde hace ya un tiempecillo que no tengo otro

2,120

4.2500

mal hig 35

además ya se está produciendo

1,100

4.5500

mal hig 55

y la quiniela o eso ya no

1,110

6.3100

mal low 18

y ya que estamos hablando del vino

2,020

3.4700

mal low 35

pues entonces mis amigos estos pequeños pues yo ya he dicho antes

3,560

3.3700

mal low 55

y metiéndose ya en las ciudades y en los pueblos

3,180

3.1400

mal med 18

una vecina que yo tenía enfrente que ya no es vecina mía

2,270

5.2900

mal med 35

sobre todo el pasapalabra ya lo tengo más aficionado ahora

2,540

3.9400

mal med 55

pero no creo que el componente religioso tenga ya mucho

3,160

3.1600

Table 4. Samples for every factor of the database with rate

6.2.2 Velocidad de habla (histograma)

6.2.3 Diagrama de caja

6.2.4 GLM

term

estimate

std.error

statistic

p.value

(Intercept)

0.18

0.01

13.53

0.00

sexmale

0.13

0.03

4.73

0.00

educationlow

0.13

0.03

4.86

0.00

educationmedium

0.13

0.03

4.78

0.00

age35-55

0.11

0.03

4.19

0.00

age55-

0.03

0.02

1.46

0.14

sexmale:educationlow

-0.17

0.04

-4.27

0.00

sexmale:educationmedium

-0.16

0.04

-3.83

0.00

sexmale:age35-55

-0.10

0.04

-2.47

0.01

sexmale:age55-

-0.14

0.03

-4.18

0.00

educationlow:age35-55

-0.13

0.04

-3.22

0.00

educationmedium:age35-55

-0.18

0.04

-4.76

0.00

educationlow:age55-

-0.16

0.03

-4.68

0.00

educationmedium:age55-

-0.06

0.04

-1.57

0.12

sexmale:educationlow:age35-55

0.10

0.06

1.65

0.10

sexmale:educationmedium:age35-55

0.13

0.06

2.36

0.02

sexmale:educationlow:age55-

0.28

0.05

5.41

0.00

sexmale:educationmedium:age55-

0.17

0.05

3.08

0.00

:::

6.3 Recopilación

factor rango (z-score) velocidad (z-score) coincidencia
fem hig 18 ↔︎ (0.0842) 🐇 (0.194) ☝️
fem hig 35 ↗ (0.168) ⚖️ (-0.0719) ☝️
fem hig 55 ↘ (-0.559) 🐇 (0.187) 🎉
fem low 18 ↗ (0.368) 🐢 (-0.151) 🎉
fem low 35 ↔︎ (-0.0995) ⚖️ (-0.0945) 🤷‍♂️
fem low 55 ↔︎ (0.0536) 🐇 (0.238) ☝️
fem med 18 ↗ (0.322) ⚖️ (-0.0451) ☝️
fem med 35 ↘ (-0.199) ⚖️ (0.0515) ☝️
fem med 55 ↗ (0.582) ⚖️ (0.0118) ☝️
mal hig 18 ↗ (0.306) ⚖️ (-0.116) ☝️
mal hig 35 ↗ (0.605) ⚖️ (-0.0494) ☝️
mal hig 55 ↔︎ (-0.0306) 🐇 (0.233) ☝️
mal low 18 ↔︎ (0.0459) ⚖️ (-0.0515) 🤷‍♂️
mal low 35 ↗ (0.337) ⚖️ (0.0708) ☝️
mal low 55 ↔︎ (-0.0306) ⚖️ (-0.0580) 🤷‍♂️
mal med 18 ↘ (-0.276) ⚖️ (-0.0601) ☝️
mal med 35 ↘ (-0.475) ⚖️ (0.0129) ☝️
mal med 55 ↘ (-0.689) ⚖️ (-0.0215) ☝️

Table 4. Resumen de los valores de rango tonal y velocidad de habla con valores Z

Resultados por grupo sociolingüístico

En esta clasificación, se considera “normal” todo valor de z_score comprendido entre -0.15 y 0.15 (es una valoración descriptiva y no inferencial; no hay valores que superen el 1.96).

Se combinan tres posibles niveles de rango tonal (amplio, normal, reducido) y tres de velocidad de habla (rápida, normal, lenta). A continuación se muestra qué categorías se dan en estos datos y con qué frecuencia, así como un breve comentario sobre sexo, edad y nivel:

  1. Rango amplio y velocidad rápida
    • No aparece en la muestra.
  2. Rango amplio y velocidad lenta
    • Solo 1 caso: “fem low 18” (z_range = 0.368; z_rate = -0.151).
    • Mujer joven de nivel bajo.
  3. Rango reducido y velocidad rápida
    • Solo 1 caso: “fem hig 55” (z_range = -0.559; z_rate = 0.187).
    • Mujer mayor de nivel alto .
  4. Rango reducido y velocidad lenta
    • No aparece en la muestra.
  5. Rango amplio y velocidad normal
    • 6 casos (por ejemplo, “fem hig 35”, “fem med 18”, “mal hig 18”, “mal hig 35”, etc.).
    • Tanto hombres como mujeres (con ligera mayoría masculina en nivel alto y femenina en varios niveles).
  6. Rango reducido y velocidad normal
    • 4 casos (ej. “fem med 35” o “mal med 18/35/55”).
    • Principalmente hombres de nivel medio y distintas edades, más alguna mujer; su pauta es poco cambio tonal y ritmo medio.
  7. Rango normal y velocidad rápida
    • 3 casos (“fem hig 18”, “fem low 55” y “mal hig 55”).
    • Aparecen en sexo tanto femenino como masculino, sin concentración clara de edad o nivel.
  8. Rango normal y velocidad lenta
    • No aparece en la muestra.
  9. Rango y velocidad normales
    • 3 casos (“fem low 35”, “mal low 18”, “mal low 55”).
    • Uno de ellos es una mujer de 35 años (nivel bajo) y los otros dos son hombres (18 y 55 años, nivel bajo).
Comentario global
  • Aunque se detectan un par de casos “extremos” (rango muy amplio/velocidad muy lenta o viceversa), la mayoría de locutores se ubican en combinaciones de rango amplio/normal y velocidad normal o en rangos normales con velocidad algo acelerada.
  • Las mujeres tienden a aparecer más en categorías de rango amplio, a menudo con velocidad normal o incluso rápida, mientras que los hombres se reparten principalmente entre un rango amplio o normal, con preferencia a la velocidad normal. No obstante, existe un caso de mujer mayor con rango muy reducido y velocidad rápida, mostrando que hay excepciones notables.
  • Respecto a la edad, se observa que los 18 y los 35 pueden presentar rangos amplios, mientras que a los 55 se dan ejemplos tanto de rango amplio como reducido. Los niveles (hig, low, med) también modulan estos comportamientos, aunque no existe una sola relación lineal: encontramos alta variación tonal tanto en niveles altos como en bajos, si bien los hombres de nivel med se inclinan más al rango reducido.

Resultado final: parece que algunos autores tienen razón al señalar que los grupos sociolingüísticos no tienen que condicionar la libertad del individio en lo fónico (Johnstone and Bean 1997). Al menos, no se observa una relación amplia en cuanto a valores fónicos por cada grupo social.

7 Futuro

  1. Incluir más participantes y equilibrar sexo, edad, nivel, etc., para obtener resultados más representativos.
  2. Registrar habla espontánea,interacción en distintos registros (formal, coloquial) y otros géneros discursivos.
  3. Considerar indicadores adicionales (duración de pausas, patrones fonológicos etc.).
  4. Combinar datos acústicos con juicios de oyentes sobre dinamismo, expresividad o claridad, para vincular lo medido con la percepción.
  5. Emplear análisis de clasificación (árboles de decisión, redes neuronales…).

8 Referencias

Abercrombie, D. 1968. “Paralanguage.” British Journal of Disorders of Communication 3: 55–59.
Cabedo Nebot, Adrián. n.d. Corpus PRESEEA 2022. Valencia: Universitat de València.
Johnstone, Barbara, and Judith Mattson Bean. 1997. “Self-Expression and Linguistic Variation.” Language in Society 26 (2): 221–46. https://doi.org/10.1017/S0047404500020911.
Molina, José Ramón Gómez. 2001. El Español Hablado de Valencia, i: Materiales Para Su Estudio. Nivel Sociocultural Alto. Quaderns de Filologia.
———. 2005. El Español Hablado de Valencia. Materiales Para Su Estudio (PRESEEA). II Nivel Sociocultural Medio. Quaderns de Filologia.
———. 2007. El Español Hablado de Valencia. Materiales Para Su Estudio (PRESEEA). III Nivel Sociocultural Bajo. Quaderns de Filologia.
Moreno Fernández, Francisco. 2021. “Metodología Del “Proyecto Para El Estudio Sociolingüístico Del Español de España y de América (PRESEEA).” Documentos PRESEEA de Investigación, Documentos de Trabajo 1. https://doi.org/10.37536/preseea.2021.doc1.
Poyatos, Fernando. 1993. Paralanguage: A Linguistic and Interdisciplinary Approach to Interactive Speech and Sounds. Vol. 92. Current Issues in Linguistic Theory. Amsterdam: John Benjamins Publishing Company. https://doi.org/10.1075/cilt.92.
———. 1994. La Comunicación No Verbal. Istmo. https://dialnet.unirioja.es/servlet/extlib?codigo=22005.