Metodología

El estudio prosódico de Canarias, como todos los proyectos vinculados al proyecto internacional AMPER, implica una metodología común. No obstante, los responsables de cada subproyecto pueden tomar decisiones particulares como las que se refieren al n^o de puntos de encuesta, n^o de informantes en cada uno de ellos y otros aspectos que no afecten sustancialmente a la metodología general.

TIPOS DE CORPUS

Se trabaja con cuatro tipos de corpus si bien en la base de datos internacional aparecerá sólo el análisis del que etiquetamos como experimental fijo para facilitar la comparación entre las distintas lenguas románicas y sus variedades . Son los siguientes:

Corpus 1. Experimental fijo o corpus ad hoc: Se trata de un corpus formal, cercano al habla de laboratorio y obtenido mediante elicitación textual.

a. Tipo de palabras: agudas, llanas y esdrújulas

b. Modalidades: declarativa e interrogativa absoluta

c. Número de oraciones por cada modalidad: 63

d. Recogida del corpus: Se graba en el punto de encuesta. El corpus se presenta a cada informante de manera aleatoria y, a pesar de ser experimental, se debe garantizar la mayor naturalidad posible en cada emisión

e. Número de emisiones que se analiza de cada frase: 3

f. Tipo de frases:

S + V + O

S + Expansión + V + O

S + V + O + Expansión

g. Etiquetaje del corpus: las oraciones grabadas en ficheros wave se etiquetan con 9 dígitos +extensión:

Digito 1: W (dominio lingüístico español)

Digito 2: C (variedad español de Canarias)

Digito 3: Número o letra (código de la isla)

Digito 4: Número impar (mujer) - Número par(hombre)

Digitos 5, 6, 7: letras (identificación de la oración)

Digito 8: a (declarativa), i (interrogativa)

Digito 9: Número de repetición de la frase

Corpus 2. Inducido

Está constituido por frases que se obtienen mediante el planteamiento al informante de cuestiones de uso muy cotidiano. Por ejemplo: ¿cómo pregunta por la hora habitualmente?, ¿cómo saluda a un vecino?

Corpus 3. Map task

Mediante este sistema de recogida de datos se obtiene un corpus más espontáneo puesto que se plantea a partir de mapas: el informante y el entrevistador o bien dos informantes deben salir de un punto geográfico y llegar a un destino determinado. Los dos mapas son diferentes en algunos puntos o información lo que motiva una serie de preguntas y respuestas por parte de ambos intervinientes.

Corpus 4. Conversación espontánea

En este caso, se trata de obtener un corpus de habla espontáneo sin restricciones. En AMPER-Can hemos propiciado un conocimiento previo del entrevistado para que de esta manera los temas de conversación sean de mucho interés para el informante y, por tanto, su conversación sea lo más espontánea posible.

PUNTOS DE ENCUESTA

AMPER es un Atlas de gran dominio que pretende analizar puntos de habla representativos de cada una de las variedades de cada dominio lingüístico. Con este criterio, en AMPER-Can hemos seleccionado zonas urbanas, esto es, las capitales de las siete islas (con la excepción de Tenerife en donde se ha elegido San Cristóbal de La Laguna) y zonas rurales. De este modo están representadas las siete Islas Canarias. Son los siguientes:

ISLA	ZONAS URBANAS	ZONAS RURALES
Tenerife	San Cristóbal de La Laguna	Icod el Alto
La Palma	Santa Cruz de la Palma	Barlovento y Los Llanos
La Gomera	San Sebastián	Valle Gran Rey (Guadá)
El Hierro	Valverde	El Pinar
Gran Canaria	Las Palmas de Gran Canaria	Arucas
Lanzarote	Arrecife	Haría
Fuerteventura	Puerto del Rosario	Antigua

INFORMANTES

Las edades de los informantes oscilan entre 25 y 55 años. En cada punto de encuesta urbano se ha elegido cuatro informantes: hombre y mujer sin estudios superiores y hombre y mujer con estudios superiores. En las zonas rurales, en cambio, se eligió hombre y mujer con estudios básicos. En Canarias, pues, hemos analizado 42 informantes.

La Base de Datos que puede consultarse en esta web muestra los resultados del corpus ad hoc de los 42 informantes: 28 hombres y mujeres sin estudios superiores, 14 de las zonas urbanas y 14 de las zonas rurales y 14 informantes más (mujeres y hombres) con estudios superiores de las zonas urbanas. Sus códigos de identificación son los siguientes:

PUNTOS DE ENCUESTA	MUJER	HOMBRE
San Cristóbal de La Laguna	WC91 y WC95	WC92 y WC96
Icod el Alto	WC93	WC94
Santa Cruz de la Palma	WCm1 y WCm5	WCm2 y WCm6
Barlovento		WCm4
Los Llanos	WCm3
San Sebastián	WCo1 y WC05	WCo2 y WC06
Valle Gran Rey	WCo3	WCo4
Valverde	WCq1 y WCq5	WCq2 y WCq6
El Pinar	WCq3	WCq4
Las Palmas de Gran Canaria	WCk1 y WCk5	WCk2 y WCk6
Arucas	WCk3	WCk4
Arrecife	WCp1 y WCp5	WCp2 y WCp6
Haría	WCp3	WCp4
Puerto del Rosario	WCn1 y WCn5	WCn2 y WCn6
Antigua	WCn3	WCn4

GRABACIONES Y ANÁLISIS

Todas las grabaciones se realizaron in situ en un lugar familiar y cómodo para los entrevistados en intervalos temporales para no cansar al informante. Cada archivo wave se analizó en entorno Matlab (en una primera etapa trabajamos con las subrutinas creadas por Antonio Romano, 1995; en una etapa posterior utilizamos las desarrolladas a partir de estas por el grupo de AMPER-Astur: Brezmes Alonso, 2007) para obtener una serie de archivos con diferente extensión (.txt, .ton, etc). Los más importantes para el proyecto son los .txt puesto que muestran todos los datos de F0, duración e intensidad de las vocales de cada frase y los .ton puesto que nos permiten conocer la prosodia de cada oración desprovista de otro tipo de información gramatical, semántica, etc. Además, obtenemos gráficos de cada uno de los tres parámetros, bien de manera individual o de las medias de las tres repeticiones de cada frase.

Formulario de búsqueda

Metodología