M. Castellengo and N. Henrich Bernardoniba: Interplay between harmonics and formants in singing : when vowels become music

Interplay between harmonics and formants in singing : when vowelsbecome music

M. Castellengo and N. Henrich Bernardoniba
LAM/d’Alembert, 11 rue de Lourmel, 75015 Paris, FrancebGIPSA-lab, 11 rue des Math ́ematiques, 38402 Grenoble, France

Nathalie Henrich-Bernardoni

In human speech, the production of vowels consists in strengthening some specific areas of the harmonic spectrum, known as formants, by adjusting vocal-tract acoustical resonances with articulators such as tongue, lips, velum, jaw, and larynx. In singing, a compromise is often sought between the frequency of harmonics and resonance frequencies, sometimes at the expense of vowel perception. In some vocal cultures, this link between harmonic frequency and resonance frequency is skilfully adjusted. A melody is generated independently of the tonal melody related to vocal-fold vibrations.
This is the case of harmonic singing, overtone singing or Xhoomij, practiced in Central Asia, but also of singing by Xhosa women in South Africa. In this paper, the adjustmentsbetween harmonics and formants are explored on a wide range of commercial singing recordings and experimental recordings in laboratory. Three main strategies are described from both acoustical and musical point of view. In a first case, the spectral melody is produced by a play on the first formant (F1). The first harmonic frequency is often kept constant and at low values due to period doubling induced by a ventricular vibration. In a second case, the spectral melody is produced by a play on the second formant (F2), with a higher frequency of the first harmonic. Complex spectral melody can also be developed by a vocal game on the first two formants. In particular, we will illustrate and discuss the cases where the two first formants evolve while remaining in an octave ratio (F2 = 2F1).1Introduction When producing vowels in speech and singing, the fluid-structure interaction between air expelled from the lungs and moving walls induces vocal-folds vibration. This vibration generates a harmonic acoustic source, which propagates through the vocal tract (laryngeal and pharyngeal cavities, mouth and nasal cavities). The vocal-tract area function from glottis to lips is controlled by the speech articulators (tongue, lips, jaw, velum, larynx), which contributes to the adjustment of vocal-tract resonances (Ri). The resonances shape the harmonic voiced sound spectrum, in boosting acoustical energy in frequency bands designated in acoustics by the term formants (Fi). The frequency ratio between the first two formants F1 and F2 is perceptually coded into vowels.C7C6C5C4C3Hz10020030040050080010002000150025003000ii200 HzF2()56789101265 Hz567891012F1Figure 1: Mean values of formant frequencies F1 (blue) andF2 (red) on a musical scale. On left panel, the vowels have been grouped for which the two formants vary conjointly.Several singing techniques illustrate harmonic-resonance adjustments. Possible interactions depending on sung pitch are shown in Figure 1, which presents the mean values of the two first formant frequencies for a male speaking voice. The vowel location on the diagram is only indicative. It depends on individual peculiarities and the chosen language. Besides, values are given for male speech, as the songs studied here are mainly produced by male singers. The first formant F1 ranges from 300 Hz (/i/) to 800 Hz (/a/), which corresponds on a musical scale to E4-G5. It covers the high range in male voices, the medium and high range in female voices. In western classical singing, a tuning between the vocal-folds vibratory frequency (f0 = H1) and vocal-tract first-resonance frequency (R1) is sometimes mandatory to allow a loud and comfortable voice production, such as in the case of soprano high range [1, 2, 3] or, more generally when the sung pitch gets close to R1 [3]. To find a good balance between resonance adjustments and clarity of vowels constitutes a great part of the classical singer’s training. Such singers have to be able to sing a text on a wide range of pitches. In traditional Croatian folk singing [4], in Bulgarian women’s singing [5] or in Broadway Musicals [6], a systematic tuning is observed between the second harmonic (H2=2f0) and R1 for those vowels which do not have a too low first-resonance frequency. This practice gives power and clarity to the voice. It is produced by means of vowels /o/ /ɔ/ /ɛ/ /a/ in a limited pitch range: 220 to 320 Hz for male singers, 350-500 Hz for female singers (see Figure 2).Figure 2: Illustration on a musical scale of vowels and pitches for which a tuning R1:2f0 is possible. The blue notes present the musical pitches.The second formant F2 ranges from 600 Hz for vowel /u/ to 2400 Hz for vowel /i/ within the musical range E5-E7 ( seeFigure 1). Glottal fundamental frequency may come close to resonance frequency only for low-F2 vowels such as /u/ and /o/. In most cases, F2 lies well above f0, and it globally contributes to the voice quality. F2:f0 tunings have been observed in the soprano high range [2]. But most F2:Hi (i>1) tunings observed in the literature are reported for techniques of harmonic singing, which we shall now address. The literature will first be briefly reviewed. The tuning strategies will then be discussed on the basis of a wide range of commercial recordings. These observations will be supplemented by a case study of a Mongolian singer by means of simultaneous acoustical recordings and ultrasound observations of tongue motion. 2Harmonic singing : the state of the art A spectral melody and low-pitch tone – In the singing techniques mentioned above, a melody is produced by varying the vocal-folds vibratory frequency and the resonances are tuned depending on vowel and sound quality. Roles are reversed in harmonic singing.


DiscographyCD “Inédit Mongolie” – Auvidis, W 260009 (1989), tracks: 4 (X1); 5 (X2; X7);

6 (X3).CD “Voices from the center of Asia” – Smithsonian Folkways, SF 400017 (1990), tracks: 1 (K5);

4 (X5); 9 (K11); 14 (K10; X6);

18 (K4). CD “Les voix du monde”, CNRS-Harmonia mundi, CMX 374 1010.12 (1996),

CD-II-37 (K3). CD “The Heart of Dharma”, Ellipsis Arts (1996), track 2 (K3).

Dave Dargie demonstration tape, track A-1 (F).

Alash Ensemble – Singers : Bady Dorzhu-Ondar (K6; K7; K8);

Kongar-ool Ondar (X4).

Bayarbaatar Davaasuren, (2013), Gipsa-Lab (K9).

Data from H. Smith (1967), lama from the Gyutu Monastery near Dalhousie, recorded in 1964 (K2).

BIBLIOGRAPHY References[1]E. Joliveau, J. Smith and J. Wolfe, “Vocal tract resonances in singing: The soprano voice”, J. Acoust. Soc. Am. 116 (4), 2434-2439 (2004)[2]M. Garnier, N. Henrich, J. Smith, J. Wolfe, « Vocal tract adjustments in the high soprano range, J. Acoust. Soc. Am. 127 (6), 3771-3780 (2010)[3]N. Henrich, J. Smith, and J. Wolfe, “Vocal tract resonances in singing: Strategies used by sopranos, altos, tenors, and baritones”, J. Acoust. Soc. Am. 129 (2), 1024-1035 (2011)[4]P. Boersma and G. Kovavic, “ Spectral characteristics of three syles of Croatian folk singing”, J. Acoust. Soc. Am. 119 (3), 1805-1816 (2006)[5]N. Henrich, M. Kiek, J. Smith, and J. Wolfe, “Resonance strategies in Bulgarian women’s singing”, Logopedics Phoniatrics Vocology 32, 171-177 (2007)[6]T. Bourne, M. Garnier, “Physiological and acoustic characteristics of the female music theater voice”, J. Acoust. Soc. Am.131 (2), 1586-1594 (2012)[7]M. Garcia jr, “Mémoire sur la voix humaine; réimpression augmentée de quelques observations nouvelles sur les sons simultanés”, p.24, Paris: Duverger (1840)[8]H. Smith, K.N. Stevens and R.S. Tomlinson, “On an unusual mode of chanting by certain Tibetan lamas”, J. Acoust. Soc. Am.41 (5), 1262-1264 (1967) [9]G. Bloothooft, E. Bringmann, M. Van Cappellen, J.B. Van Luippen, et al. “Acoustics and perception of overtone singing” J. Acoust. Soc. Am.92 (4), 1827-1836 (1992)[10]F. Klingholz, “Overtone singing: productive mechanisms and acoustic data”, J. of Voice 7 (2), 118-122 (1993)[11]H. K. Schutte, D.G. Miller and J.G. Sveč, “Measurement of formant frequencies and bandwith in singing”, J. of Voice 9 (3), 290-296 (1995)[12]L. Dmitriev, B. Chernov and V. Maslow, “Functioning of the Voice Mechanism in Double Voice Touvinian Singing”, Folia Phoniatrica 36, 193-197 (1983)[13]L. Fuks, B. Hammmarberg and J. Sundberg, “A self-sustained vocal-ventricular phonation mode: acoustical, aerodynamic and glottographic evidences”, TMH-QPSR3, 49-59 (1998) [14]J. G. Sveč, H. K. Schutte and D. G. Miller, “A subharmonic vibratory pattern in normal vocal folds”, J. of Speech and Hearing Research39, 135-143 (1996)[15]L. Bailly, N. Henrich and X. Perlorson, “Vocal fold and ventricular vocal fold vibration in period-doubling phonation: physiological description and aerodynamic modeling”, J. Acoust. Soc. Am. 127 (5), 3212-3222 (2010)[16]A.N. Askenov, “Tuvin folk music”, Asian Music4 (2), 7- 18 (1973)[17]D. Dargie, “Xhosa music: its techniques and instruments, with a collection of songs”, Cape Town: David Philip[18]H. Zemp and T. Q. Hai, “Recherches expérimentales sur le chant diphonique”, Cahiers d’ethnomusicologie4, 27-68 (1991)[19]T. C. Levin and M. E. Edgerton, “The Throat Singers of Tuva”, Scientific American 218 (3), 70-77(1999) and related video files (X-rays) [20]J. Curtet, “La transmission du höömij, un art du timbre vocal : ethnomusicology et histoire du chant diphonique mongol”, Thèse de doctorat, Université de Rennes 2. [21]M. Kob, “Analysis and modeling of overtone singing in the sygyt style”, Applied acoustics65 (12), 1249-1259 (2004)[22]C. Tsai, Y. Shau and T. Hsiao, “False vocal fold surface waves during Sygyt singing: A hypothesis”, Proc. ICVBP, (2004)[23]S. Adachi and M. Yamada, “An acoustical study of sound production in biphonic singing, Xöömij”, J. Acoust. Soc. Am. 105 (5), 2920-2932 (1999)[24]K.-I. Sakakibara, H. Imagawa, T. Konishi, K. Kondo et al, “Vocal fold and false vocal fold vibrations in throat singing and synthesis of Khöömei”, Proc. ICMC,(2001)[25]P. Lindestad, M. Södersten, B. Merker and S. Granqvist, “Voice source characteristcs in Mongolian “throat singing” studied with high-speed imaging technique, acoustic spectra, and inverse filtering”, J. of voice15 (1), 78-85 (2001)[26]P. Cosi and G. Tisato, “On the magic of overtone singing”,Voce, Parlato. Studi in onore di Franco Ferrero, 83-100 (2003)[27]T. Hueber, G. Chollet, B. Denby, M. Stone, “Acquisition of ultrasound, video and acoustic speech data for a silent-speech interface application”, Proc. of ISSP, 365-369 (2008)[28]H. Zemp and T.Q. Hai, “Le chant des harmoniques”, film 16 mm, Paris: Musée de l’Homme and CNRS-AV http://videotheque.cnrs.fr/doc=606


The full article can be read  by clicking the link below



Ecole d’été Sciences et voix chantée – Giens, 2009
– Michèle Castellengo
L’exposé est articulé selon trois parties. Dans la
première nous rappelons les particularités
anatomiques et neuro-physiologique du système audit
if humain qui conditionnent la perception
auditive. Dans la deuxième partie nous exposons les
bases d’une approche cognitive «écologique»
d’auditeurs communiquant au sein d’une société cult
urelle donnée. A la lumière de ces résultats et
tout en nous fondant sur l’analyse acoustique, nous
proposons des éléments d’interprétation de la
diversité des écoutes de la voix humaine et de cert
aines techniques vocales

Michèle CASTELLENGO : bio et recherche en acoustique au LAM

Michèle Castellengo

Directrice de recherche émérite CNRS

 Coordonnées :

Institut Jean le Rond d’Alembert
Equipe LAM

Boîte courrier 162
4 Place Jussieu, 75005-Paris


avec Charles BESNAINOU et Robert EXPERT


Pour lire et écouter des extraits du livre

Téléchargement “Libre”
à l’onglet COMPLEMENTS

Susanne FURNISS : compte rendu de l’ouvrage “Michèle CASTELLENGO : Ecoute musicale et acoustique”

Michèle CASTELLENGO : Ecoute musicale et acoustique


Paris : Eyrolles, 2015
Susanne Fürniss
p. 223-226
Référence(s) :

Michèle CASTELLENGO : Ecoute musicale et acoustique, Paris : Eyrolles, 2015, 541 p., photos, schémas, bibliographie, 1 DVD-Rom.

Notes de la rédaction

Extraits téléchargeables sur http://www.editions-eyrolles.com/Livre/9782212138726/ecoute-musicale-et-acoustique

Texte intégral

1Nous sommes des générations d’ethnomusicologues à avoir appris l’acoustique musicale à travers Musique et acoustique d’Emile Leipp (1971) ; mais le véritable enseignement est passé par les nombreuses discussions avec Michèle Castellengo, qui fut pendant des décennies directrice du Laboratoire d’Acoustique Musicale de l’Université Paris 6 (UPMC). Nous sommes nombreux à avoir sollicité son conseil, organisé des rencontres scientifiques ou mis en place des projets avec elle. Plusieurs d’entre nous ont eu l’honneur de la compter parmi les membres de leur jury de thèse, d’autres ont eu la chance de suivre ses enseignements au CNSM de Paris ou ailleurs. Grâce à son enthousiasme passionné et sa curiosité scientifique qui embrasse la grande variété des musiques existant dans le monde, le dialogue entre acoustique et ethnomusicologie a fécondé mutuellement nos disciplines. Musicienne d’abord, physicienne ensuite, M. Castellengo aborde l’acoustique du point de vue de la pratique musicale, convaincue que les sons – bien qu’étant des objets immatériels – sont indissociables d’une esthétique et d’une signification culturelle spécifiques.

2C’est dire que les grandes qualités scientifiques et pédagogiques de l’auteure sont le meilleur gage de la qualité de l’ouvrage présenté ici. Après une cinquantaine d’années de recherche, Michèle Castellengo a enfin décidé de délaisser la transmission orale pour formaliser son érudition dans un ouvrage de synthèse qui met en œuvre son approche si particulière consistant à aborder l’acoustique à partir de l’écoute. L’ouvrage est construit autour de 420 sons que l’on trouve dans le DVD-Rom annexé, grâce aux liens hypertextes à l’endroit même où le lecteur en a besoin. Michèle en tant que personne y est également présente : on reconnaît sa voix dans de nombreux exemples sonores.

3Le livre est structuré en neuf chapitres qui présentent les notions élémentaires de l’acoustique et de la représentation du son, le système auditif et la perception, les principales qualités sonores (intensité, hauteur et timbre), pour aborder enfin les systèmes d’intervalles et les spécificités de la voix humaine.

4Le premier chapitre, « Des vibrations aux sons de la musique », est une introduction à l’aspect mécanique de l’acoustique. On y apprend tout ce qu’il faut savoir sur les sons impulsionnels ou entretenus (p. ex. la différence entre corde frappée et corde frottée), les différents modes vibratoires et la série des harmoniques. Un chapitre très utile définit le vocabulaire et fait le lien entre les acceptions parfois divergentes d’une discipline à l’autre. La fin de cette section met à l’honneur les musiques traditionnelles à travers leurs multiples utilisations de la série des harmoniques : chant diphonique, guimbarde, arc musical, d’une part, cor des Alpes et flûte roumaine tilinca, de l’autre, ou encore monocorde vietnamien.

5Le chapitre 2, « La représentation des sons », explique en détail les manières de visualiser le son, ainsi que leurs avantages et inconvénients en fonction de l’usage que l’on souhaite en faire. L’auteure introduit de manière approfondie les paramètres du signal sonore : fréquence fondamentale, aspects temporels, amplitude et spectre. Ici, un gong birman se mêle aux instruments à vent de l’orchestre occidental, à l’orgue et au steel-drum. Le chapitre se termine sur de nombreux exemples d’analyses illustrant la différence entre parole et chant ou entre l’image sonore d’un orchestre et celle des sons de la nature nocturne en Vendée. À l’issue de ce chapitre, on aura appris correctement à lire un sonagramme, visualisation « particulièrement pertinente perceptivement ».

6Un détour est ensuite fait par « Le système auditif humain » pour évaluer les sons que nous percevons par notre nature biologique, avant même de leur attribuer un sens. Ce chapitre aborde notamment les notions de sensation d’intensité et de hauteur des sons, indispensables pour comprendre les phénomènes de perception des systèmes d’intervalles traités plus loin.

7Le chapitre le plus stimulant est certainement le quatrième, « Une approche de la perception sonore : formes et catégorisation ». Michèle Castellengo y aborde l’écoute, c’est-à-dire comment nous attribuons du sens à ce que nous entendons. En passant par la phénoménologie, l’auteure pose la distinction fondamentale entre identification et qualification des sons ; elle rappelle l’importance du vécu et de la mémoire dans la reconnaissance des formes pour finalement proposer une « typologie acoustique des formes sonores » (p. 157). Elle propose une hiérarchisation entre formes du premier niveau qui renvoient à la source sonore (p. ex. la voix humaine) et celles du second niveau qui visent les modes d’utilisation ou les transformations que l’on y aurait apportées (p. ex. le chuchotement, le parlé…). Dans le domaine musical, il s’agit ici de reconnaissance des instruments, de formes polyphoniques, mais aussi d’interprétation d’illusions sonores. C’est tout naturellement que ce chapitre se termine sur la question de la catégorisation perceptive et les différences de la posture d’écoute en fonction de la perspective dans laquelle un auditeur écoute une musique.

8Ces quatre premiers chapitres constituent les bases pour la compréhension de la suite, qui en approfondit les différents aspects et traite les paramètres du son en détail. La question de savoir comment se faire entendre au sein d’autres sources sonores – dans l’orchestre, en plein air ou dans le métro – est traitée dans le chapitre dédié à l’intensité et au contraste des formes. Le chapitre relatif à la hauteur des sons isolés nous éclaire sur l’interdépendance entre fréquence fondamentale et composition spectrale dans la perception des hauteurs. Les musiques jouant sur les harmoniques sont traitées en détail avec d’autres exemples abondamment commentés. On trouve aussi la problématique de la perception des hauteurs des xylophones, qui a fait couler beaucoup d’encre en ethnomusicologie. En introduisant « La question du timbre » avec le shakuhachi, le pakhavaj et la musique électro-acoustique, le chapitre suivant traite des questions des timbres instrumentaux, essentiellement occidentaux.

9Puis on arrive aux systèmes musicaux à travers l’enchaînement de hauteurs isolées. Le chapitre « Systèmes d’intervalles et accordage » mobilise l’ensemble des notions développées précédemment. Ne citons que la perception catégorielle et la tolérance perceptive en fonction des catégories en vigueur dans la culture dont est issue une musique donnée ou le problème de l’accordage des instruments à sons instables. Dans ce chapitre, on parle théorie musicale et particulièrement intervalles et théories de leur formation. L’auteure présente les différences entre conception théorique et réalisation, ainsi que les multiples débats sur tel ou tel tempérament. Elle passe ainsi en revue des siècles de théorie occidentale et l’émergence de l’outillage conceptuel par rapport auquel tout ethnomusicologue doit se situer encore aujourd’hui. C’est des intervalles qu’elle part et non pas des degrés de l’échelle. Son approche de musicienne apparaît là de façon lumineuse : la réflexion ne naît pas d’une théorie, mais de la pratique qui met en relation des sons de hauteurs différentes. En toute conséquence, les rapports arithmétiques entre deux sons lui paraissent plus pertinents pour exprimer des grandeurs d’intervalles que le système de cents fondé sur une division arbitraire de l’octave en 1200 cents. Les nombreux exemples sonores sont un guide remarquable pour se représenter, par l’écoute, les incidences des débats théoriques. Ce chapitre nous donne beaucoup à réfléchir sur les automatismes à l’œuvre dans notre discipline. Il invite à changer de perspective et à concevoir la théorie musicale plutôt du point de vue du musicien, tout en restant dans un ancrage scientifique rigoureux.

10Le dernier chapitre, « Voix et perception », synthétise les nombreuses contributions de Michèle Castellengo dans ce domaine, notamment la caractérisation des mécanismes vibratoires laryngés. Les matériaux ethnomusicologiques sont à nouveau en première ligne, allant du chant diphonique mongol à la quintina sarde, en passant par le pasi but but bunun de Taïwan.

11Inutile d’ajouter que l’ouvrage contient une bibliographie très conséquente et un glossaire particulièrement précieux, accessible au commun des mortels. À ceux qui se poseraient encore la question de savoir en quoi cet ouvrage pourrait être utile à un ethnomusicologue, je dirais que, curieusement, le détour par l’objectivation de la science acoustique est dans bien des cas un garde-fou contre un ethnocentrisme rôdant en musicologie et qu’il fournit de nombreux outils analytiques à l’ethnomusicologie. À l’inverse, il prévient aussi de certaines explications quelque peu mystifiantes de phénomènes musicaux inhabituels en fournissant de solides connaissances du fonctionnement du monde sonore. Au fond, Michèle Castellengo nous rappelle un fondement de l’approche ethnologique : rien ne va de soi.

12Ce qui est particulièrement remarquable et qui rend jouissive la lecture de cet ouvrage somme toute assez ardu, c’est le soin apporté à la langue, l’extrême précision de l’expression qui mène à un style limpide où chaque mot est à sa place. C’est le signe de l’artiste dont le résultat émerveille le lecteur sans que celui-ci sache combien d’années de travail et d’efforts se cachent derrière la légèreté de la performance. À propos de légèreté : l’ouvrage a un défaut majeur : il pèse un âne mort…

Haut de page


LEIPP Emile, 1971, Musique et acoustique. Paris : Masson.

Haut de page

Pour citer cet article

Référence papier

Susanne Fürniss, « Michèle CASTELLENGO : Ecoute musicale et acoustique », Cahiers d’ethnomusicologie, 29 | 2016, 223-226.

Référence électronique

Susanne Fürniss, « Michèle CASTELLENGO : Ecoute musicale et acoustique », Cahiers d’ethnomusicologie [En ligne], 29 | 2016, mis en ligne le 20 mai 2017, consulté le 24 décembre 2018. URL : http://journals.openedition.org/ethnomusicologie/2604

Haut de page


Susanne Fürniss

Articles du même auteur

Haut de page

Droits d’auteur

Tous droits réservés