
El corpus está constituido hasta el momento por 143 informantes de distintos Estados de la República Mexicana. En su mayoría (80%) son informantes originarios de la Ciudad de México. El objetivo del CLOE México es que esté en constante crecimiento por lo que el número de informantes de otros Estados irá en aumento. Para identificar el Estado de la República del que es originario el informante se ha utilizado el Catálogo Único de Claves de Áreas Geoestadísticas Estatales, Municipales y Localidades del INEGI y se ha adaptado para tener una clave de tres letras.
Cada uno de los informantes está agrupado según su nivel de estudios, edad y género. La clave de cada grupo corresponde a la siguiente:
N1: Ningún estudio hasta primaria
N2: Estudios de secundaria o bachillerato
N3: Estudios de Licenciatura o más
E1: De 20 a 34 años
E2: De 35 a 54 años
E3: De 55 años o más
F: Femenino
M: Masculino
Cada grabación de cada informante está constituida por 5 secciones:

FON: La lectura de las cinco vocales del español de manera sostenida.
LEC: La lectura de un texto de 193 palabras que está fonéticamente balanceado.

HESP: Una entrevista en habla semiespontánea que tiene una duración de entre 15 y 20 minutos.
ENT: Una encuesta de situaciones basada en el material del Atlas interactivo de la entonación del español que tiene como objetivo que el informante genere diferentes contornos entonavitos.

MAP TASK: Un diálogo vía telefónica de tipo map task en el que el informante guía al entrevistador para llegar de un sitio a otro.
Con la información antes descrita se construyó la clave de identificación de cada informante en el siguiente orden:
_ _ _: Ciudad del que es originario
N_: Nivel de estudios
E_: Edad
S_: Sexo
_ _ _: Número de informante
_ _ _ _: Tipo de grabación
Así, por ejemplo, el código de una grabación de habla semi-espontánea de un informante originario de la Ciudad de México con un nivel de estudios de secundaria a bachillerato, una edad entre 35 y 54 años y de sexo femenino es: CDMN2E2SF001_HESP