There are familiar terms such as ''contour'' and ''trajectory'' to refer to a vowel formant frequency as a function defined on the time axis, but there is no readily understood term for the analogous idea of how a formant behaves on the ''vowel axis''. For this we introduce the concept of a vowel-formant ensemble (VFE) as the set of values realized for a given formant (e.g., F 2 ) in going from vowel to vowel among a speaker's vowel phonemes for a fixed time frame in a fixed CVC context. The VFE affords a simple description of our development: we observe that D.J. Broad and F. Clermont's [J. Acoust. Soc. Am. 81 (1987) 155] formant-contour model is a linear function of its vowel target and that as a consequence all its VFEs for a given speaker and formant number are linearly scaled copies of one another. Are VFEs in actual speech also linearly scaled? To show how this question can be addressed, we use F 1 and F 2 data on one male speaker's productions of 7 Australian English vowels in 7 CVd contexts, with each CVd repeated 5 times. Our hypothesized scaling relation gives a remarkably good fit to these data, with a residual rms error of only about 14 Hz for either formant after discounting random variations among repetitions. The linear scaling implies a type of normalization for context which shrinks the intra-vowel scatter in the F 1 F 2 plane. VFE scaling is also a new tool which should be useful for showing how contextual effects vary over the duration of the syllable's vocalic nucleus.
''Contour'' et ''trajectoire'' sont devenus des termes familiers qui, pour toute voyelle, servent a decrire, sur l'axe des temps, l'evolution des frequences propres a chacun des formants. Par contre, il y aurait lieu d'etablir des vocables analogues permettant de preciser le profil de ces frequences sur ''l'axe des voyelles''. On introduit, donc, le concept de vowel-formant ensemble (et l'acronyme VFE qui en decoule) afin de pouvoir regrouper, de voyelle a voyelle, les frequences d'un formant (e.g., F 2 ) qui sont obtenues, a un instant fixe de l'axe des temps, pour le meme locuteur et dans le meme contexte syllabique CVC. Notons que le concept de VFE contient a lui seul toute la demarche adoptee ici, a savoir que notre modelisation precedente des trajectoires des formants (Broad et Clermont, J. Acoust. Soc. Am. 81, 1987, 155-165) repose sur une fonction lineaire de la cible des voyelles et, de ce fait, suggere l'hypothese que des relations lineaires devraient aussi servir a caracteriser les VFEs propres a un locuteur et chacun des formants a la fois. De telles relations sont-elles verifiables sur des echantillons reels de parole? On aborde cette question pour les frequences des formants F 1 et F 2 de 7 voyelles de l'anglais australien qui ont ete prononcees par un locuteur masculin, 5 fois de suite, dans 7 contextes syllabiques du type CVd. Nonobstant les variations aleatoires inherentes aux 5 repetitions, l'application de notre hypothese aux voyelles en question engendre un ecart quadratique moyen qui ne depasse pas la valeur, remarquablement faible, de 14 Hz pour F 1 et F 2 . Les relations lineaires ainsi obtenues se pretent a une normalisation par rapport au facteur contexte, que l'on demontre par une reduction de la dispersion intra-voyelle dans l'espace planaire F 1 F 2 . Les relations derivees du concept de VFE constituent egalement un nouvel outil devant permettre la mise en evidence des effets de differents contextes au travers des noyaux vocaliques de syllabes.