Metodología

El estudio prosódico de Canarias, como todos los proyectos vinculados al proyecto internacional AMPER, implica una metodología común. No obstante, los responsables de cada subproyecto pueden tomar decisiones particulares como las que se refieren al no de puntos de encuesta, no de informantes en cada uno de ellos y otros aspectos que no afecten sustancialmente a la metodología general.

TIPOS DE CORPUS

Se trabaja con cuatro tipos de corpus si bien en la base de datos internacional aparecerá sólo el análisis del que etiquetamos como experimental fijo para facilitar la comparación entre las distintas lenguas románicas y sus variedades . Son los siguientes:

Corpus 1. Experimental fijo o corpus ad hoc: Se trata de un corpus formal, cercano al habla de laboratorio y obtenido mediante elicitación textual.

a. Tipo de palabras: agudas, llanas y esdrújulas
b. Modalidades: declarativa e interrogativa absoluta
c. Número de oraciones por cada modalidad: 63
d. Recogida del corpus: Se graba en el punto de encuesta. El corpus se presenta a cada informante de manera aleatoria y, a pesar de ser experimental, se debe garantizar la mayor naturalidad posible en cada emisión
e. Número de emisiones que se analiza de cada frase: 3
f. Tipo de frases:
S + V + O
S + Expansión + V + O
S + V + O + Expansión
g. Etiquetaje del corpus: las oraciones grabadas en ficheros wave  se  etiquetan con 9 dígitos +extensión:
Digito 1: W (dominio lingüístico español) 
Digito 2: C (variedad español de Canarias) 
Digito 3: Número o letra (código de la isla) 
Digito 4: Número impar (mujer) - Número par(hombre) 
Digitos 5, 6, 7: letras (identificación de la oración)
Digito 8: a (declarativa), i (interrogativa) 
Digito 9: Número de repetición de la frase
 

Corpus 2. Inducido

Está constituido por frases que se obtienen mediante el planteamiento al informante de cuestiones de uso muy cotidiano. Por ejemplo: ¿cómo pregunta por la hora habitualmente?, ¿cómo saluda a un vecino?

Corpus 3. Map task

Mediante este sistema de recogida de datos se obtiene un corpus más espontáneo puesto que se plantea a partir de mapas: el informante y el entrevistador o bien dos informantes deben salir de un punto geográfico y llegar a un destino determinado. Los dos mapas son diferentes en algunos puntos o información lo que motiva una serie de preguntas y respuestas por parte de ambos intervinientes.

Corpus 4. Conversación espontánea

En este caso, se trata de obtener un corpus de habla espontáneo sin restricciones. En AMPER-Can hemos propiciado un conocimiento previo del entrevistado para que de esta manera los temas de conversación sean de mucho interés para el informante y, por tanto, su conversación sea lo más espontánea posible.

PUNTOS DE ENCUESTA

AMPER es un Atlas de gran dominio que pretende analizar puntos de habla representativos de cada una de las variedades de cada dominio lingüístico. Con este criterio, en AMPER-Can hemos seleccionado zonas urbanas, esto es, las capitales de las siete islas (con la excepción de Tenerife en donde se ha elegido San Cristóbal de La Laguna) y zonas rurales. De este modo están representadas las siete Islas Canarias. Son los siguientes:

ISLA ZONAS URBANAS ZONAS RURALES
Tenerife
San Cristóbal de La Laguna
Icod el Alto
La Palma
Santa Cruz de la Palma
Barlovento y Los Llanos
La Gomera
San Sebastián
Valle Gran Rey (Guadá)
El Hierro
Valverde
El Pinar
Gran Canaria
Las Palmas de Gran Canaria
Arucas
Lanzarote
Arrecife
Haría
Fuerteventura
Puerto del Rosario
Antigua

 

INFORMANTES

Las edades de los informantes oscilan entre 25 y 55 años. En cada punto de encuesta urbano se ha elegido cuatro informantes: hombre y mujer sin estudios superiores y hombre y mujer con estudios superiores. En las zonas rurales, en cambio, se eligió hombre y mujer con estudios básicos. En Canarias, pues, hemos analizado 42 informantes.

La Base de Datos que puede consultarse en esta web muestra los resultados del corpus ad hoc de los 42 informantes: 28 hombres y mujeres sin estudios superiores, 14 de las zonas urbanas y 14 de las zonas rurales y 14 informantes más (mujeres y hombres) con estudios superiores de las zonas urbanas. Sus códigos de identificación son los siguientes:

PUNTOS DE ENCUESTA MUJER HOMBRE
San Cristóbal de La Laguna WC91 y WC95 WC92 y WC96
Icod el Alto WC93 WC94
Santa Cruz de la Palma WCm1 y WCm5 WCm2 y WCm6
Barlovento   WCm4
Los Llanos WCm3  
San Sebastián WCo1 y WC05 WCo2 y WC06
Valle Gran Rey WCo3 WCo4
Valverde WCq1 y WCq5 WCq2 y WCq6
El Pinar WCq3 WCq4
Las Palmas de Gran Canaria WCk1 y WCk5 WCk2 y WCk6
Arucas WCk3 WCk4
Arrecife WCp1 y WCp5 WCp2 y WCp6
Haría WCp3 WCp4
Puerto del Rosario WCn1 y WCn5 WCn2 y WCn6
Antigua WCn3 WCn4

 

GRABACIONES Y ANÁLISIS

Todas las grabaciones se realizaron in situ en un lugar familiar y cómodo para los entrevistados en intervalos temporales para no cansar al informante. Cada archivo wave se analizó en entorno Matlab (en una primera etapa trabajamos con las subrutinas creadas por Antonio Romano, 1995; en una etapa posterior utilizamos las desarrolladas a partir de estas por el grupo de AMPER-Astur: Brezmes Alonso, 2007) para obtener una serie de archivos con diferente extensión (.txt, .ton, etc). Los más importantes para el proyecto son los .txt puesto que muestran todos los datos de F0, duración e intensidad de las vocales de cada frase y los .ton puesto que nos permiten conocer la prosodia de cada oración desprovista de otro tipo de información gramatical, semántica, etc. Además, obtenemos gráficos de cada uno de los tres parámetros, bien de manera individual o de las medias de las tres repeticiones de cada frase.