TRAN QUANG HAI : About the terminology used in overtone/undertone for the throat singing /overtone singing


Tran Quang Hai (UMR 8574, National Center for Scientific Research, France)


“KHOOMEI” or “THROAT SINGING is the name used in Tuva and Mongolia to describe a large family of singing styles and techniques in which a single vocalist  simultaneously produces two (or more) distinct tones . The lower one is the usual fundamental tone of the voice and sounds as a sustained drone or a Scottish bagpipe sound . The second corresponds to one of the harmonic partials and is like a resonating whistle in a high, or very high register . We transcribe in the simplest way the Tuvan term, for the lack of agreement between the different authors :









Throat Singing has almost entirely been an unknown form of art until rumours about Tuva and the peculiar Tuvan musical culture spread in the West, especially in North America, thanks to Richard Feynman, a distinguished American physicist, who was an ardent devotee of Tuvan matters  (today, partly because of Feynman’s influence, there exists a society called „Friends of Tuva“ in California, which circulates news about Tuva in the West.


This singing tradition is mostly practised in the Central Asia regions including Bashkortostan or Bashkiria (near Ural mountains), Altai and Tuva (two autonomous republics of the Russian Federation), Khakassia and Mongolia . But we can find examples worldwide in South Africa between Xhosa women, in the Tibetan Buddhist chanting, in Rajasthan, and also among the Dani tribes in Papu Guinea


The Tuvan people developed numerous different styles . The 5 different techniques are :

Sygyt (like a whistle with a weak fundamental)

Khoomei ( general term for throat singing and a particular style)

Borbangnadyr (similar to Kargyraa with higher fundamental)

Ezengileer ( rercognizable by the quick rhythmical shifts between diphonic harmonics)

Kargyraa (with very low fundamentals obtained by undertones)


In Mongolia, most throat singing styles take the name from the part of the body where they suppose to feel the vibratory resonance





XARKIRAA XÖÖMI (similar to Tuvan Kargyraa)

ISGEREX (rarely used style it sounds like a flute)


The Khakash people practise three types of Throat singing

KARGIRAR                                 like KARGYRAA (Tuva)

KUVEDER or KILENGE            like EZENGILEER (Tuva)

SIGIRTIP                                     like SYGYT (Tuva)


The peoples of the Altai Mountains use three terms

KARKIRAA                                like KARGYRAA (Tuva)

KIOMIOI                                    like KHOOMEI (Tuva)

SIBISKI                                      like SYGYT (Tuva)


The Bashkiria musical tradition uses the throat singing  UZLAU similar to Tuvan EZENGILEER) to accompany epic song


The Tibetan GYUTO monks have also a tradition of diphonic chant, related to the religious beliefs of the vibratory reality of the universe . They sing in a very low register in a way that resembles the Tuvan KARGYRAA method . The aim of  this tradition is mystical and consists in isolating the 10th harmonic partial of the vocal sound.




There are in the literature many terms to indicate the presence of different perceptible sounds in a single voice. If you have a look at the motor of reaearch ( ) , you will be astonished by the number of websites linked to throat singing KHOOMEI . I am going to establish a listing of unmbers of sites linked to each term according to GOOGLE motor research (28 December 2003 , date of consultation of GOOGLE)


KHOOMEI                                   1,710 sites

KARGYRAA                                883 sites

SYGYT                                         673 sites

EZENGILEER                            141 sites

BORBANGNADYR                     129 sites

THROAT SINGING                    8,980 sites

OVERTONE SINGING               2,500 sites

DIPHONIC SINGING                     65 sites

BIPHONIC SINGING                   121 sites

OVERTONING                            615 sites

HARMONIC SINGING               901 sites



MULTIPHONIC SINGING         158 sites


DIPLOPHONIA                          190 sites



CANTO DIPLOFONICO             27 sites

CANTO DIFONICO                     138 sites


OBERTONSEGANG                    256 sites


According to the pioneer work in the domain of the vocal sounds made by the Extended Vocal Techniques Ensemble (EVTE) of San Diego University and bearing in mind that there is little agreement regarding classifications, the best distinctive criterion for the diphonia seems to be the characterization of the sound sources that produce the perception of the diphonic or multiphonic sound


Following that principle, we can distinguish between BITONALITY and DIPHONIA


BITONALITY : in this case, there are two distinct sound sources that produce two sounds. The pitches of the two sounds could be or not  in harmonic relationship. This category includes DIPLOPHONIA, BITONALITY , and VOCAL FRY


DIPHONIA : the reinforcement of one (or more) harmonic partials produces the splitting of the voice in two (or more) sounds. This category includes KHOMEI, THROAT SINGING, OVERTONE SINGING, DIPHONIC SINGING, BIPHONIC SINGING, OVERTONING, HARMONIIC SINGING, HARMONIC CHANT




Diplophonia :

The vibration of the vocal folds is asymmetrical. It happens that after a normal oscillatory period, the vibration amplitude that follows is reduced. There is not the splitting of the voice in two sounds, but the pitch goes down one octave lower and the timbre assumes a typical roughness. For example, assuming as fundamental pitch a C3 130.8 Hz, the resulting pitch will be C2 65.4 Hz . If the amplitude reduction happens after two regular vibrations, the actual periodicity triplicates and  then the pitch lowers one octave and a 5th. The diplophonic voice is a frequent pathology of the larynx (as in unilateral vocal cord paralysis), but can be also obtained willingly for artistic effects (Demetrio Stratos was an expert of this technique)



The two sound sources are due to the vibration of two different parts of the glottis cleft . This technique requires a strong laryngeal tension . In this case , there is not necessarily a harmonic relationship between the fundamentals of the two sounds. In the Tuvan KARGYRAA style, the second sound is due to the vibration of the supraglottal structures (false folds, aryepiglottic folds that connects the arytenoids and the epiglottis, and the epiglottis root). In this case generally (but not always) there is a 2:1 frequency ratio between the supraglottal closure and vocal folds closure. As in the case of  Diplophonia, the pitch goes down on octave lower (or more)


Vocal fry

The second sound is due in this case to the periodic repetition of a glottal pulsation of different frequency . It sounds like the opening of a creaky door (another common designation is “creaky voice”) . The pulse rate of vocal fry can be controlled to produce a range from very slow single clicks to a stream of clicks so rapid to be perceived as a discrete pitch . Therefore vocal fry is a special case of bitonality : the perception of a second sound depends on a pulses train rate and not on the spectral composition of a single sound .




Diphonic and Biphonic  refer to any singing that sounds like two (or more) simultaneous pitches, regarless of technique. Use of these terms is largely limited to academic sources . In the scientific literature the preferred term to indicated Throat Singing is Diphonic Singing .


Multiphonic Singing indicates a complex cluster  of non-harmonically related pitches that sounds like the vocal fry or the creaky voice. The cluster may be produced expiring as normal, or also inhaling the airflow .


Throat Singing  is any technique that includes the manipulation of the throat to produce a melody with the harmonics. Generally, this involves applying tension to the region surrounding the vocal folds and the manipulation of the various cavities of the throat, including the ventricular bands, the arytenoids, and the pharynx .


Chant generally refers to religious singing in different traditions (Gregorian, Buddhist, Hindu chant , etc…). As regards the diphonia, it is noteworthy to mention the low singing practised by Tibetan Buddhist monks of the Gyutö sect . As explained before , they reinforce the 10th harmonic partial of the vocal sound for mystical and symbolic purposes . This kind of real diphonia must be distinguished from resonantial effects (enhancement of some uncontrolled overtones) that we can hear in Japanese Shomyo Chant  and also in Gregorian Chant .


Harmonic Singing is the term introduced by David Hykes to refer to any technique that reinforces a single harmonic or harmonic cluster. The sound may or may not split into two or mor notes. It is used as a synonym of Overtone Singing, Overtoning, Harmonic Chant and also Throat Singing .


Overtone Singing can be considered to be harmonic singing with an intentional emphasis on the harmonic melody of overtones . This is the name used by Western artists that utilizes vowels, mouth shaping and upper throat  manipulations to produce melodies and textures. It is used as a synonym of Harmonic Singing, Overtoning, Harmonic Chant and also Throat Singing .




In the West , the Overtone Singing technique has unexpectedly become very popular, starting into musical contests and turning very soon to mystical, spiritual and also therapeutic applications . The first to make use of a diphonic vocal technique in music was Karlheinz Stockhausen in STIMMUNG . He was followed by numerous artists and amongst them : the EVTE (Extended Vocal Techniques Ensemble) group at the San Diego University in 1972, Laneri and his Prima Materia group in 1973, Tran Quang Hai in 1975, Demetrio Stratos in 1977, Meredith Monk in 1980, David Hykes and his Harmonic Choir in 1983 , Joan La Barbara in 1985, Michael Vetter in 1985, Christian Bollmann in 1985, Noah Pikes in 1985, Michael Reimann in 1986, Tamia in 1987, Bodjo Pinek in 1987, Josephine Truman in 1987, Quatuor Nomad in 1989, Iegor Reznikoff in 1989, Valentin Clastrier  in 1990, Rollin Rachele in 1990, Thomas Clements in 1990, Sarah Hopkins in 1990, Les Voix Diphoniques in 1997, Mark Van Tongeren in 2000, etc… The most famous proponent of this type of singing is David Hykes . Hykes experimented with numerous innovations including  changing the fundamental (moveable drone) and keeping fixed the diphonic formant , introducing text, glissando effects , etc… in numerous works produced with the Harmonic Choir of New York .




All these sounds contain overtones or tones that resonate in fixed relationships above a fundamental frequency. These overtones create tone color, and help us to differentiate the sounds of different music instruments or one voice and another

Different cultures have unique manifestations of musical traditions , but, what it is quite interesting, is that some of them share at least one aspect in common: the production of overtones in their  respective vocal music styles .

The diversity of terminology designating this vocal phenomenon shows us the interest of people in discovering overtones /undertones .The most used term is THROAT SINGING  (8980 websites linked according to GOOGLE motor of research) more than OVERTONE SINGING (2500 linked websites). This attitude is understandable because the term “Throat Singing” is the correct translation of the Tuvan and Mongolian terms KHOOMEI which means “pharynx”, or “throat”.

TRAN QUANG HAI : Recherches introspectives et expérimentales sur le chant diphonique

Recherches introspectives et expérimentales sur le chant diphonique

trân quang hai

La présence d’harmoniques et de leurs effets dans les prières lamaïques tibétaines est connue depuis une quarantaine d’années. L’existence du chant diphonique chez les Bachkirs et les Mongols a été signalée dix ans plus tard. Vers le début des années 1980, fut « découverte » la richesse du chant de gorge des Touvins. Le développement des effets harmoniques dans la musique méditative en Europe depuis les dix dernières années a poussé la recherche vocale dans le domaine de la résonance harmonique, notamment en Europe et en Amérique. Des travaux de recherches sur la quintina (la cinquième voix virtuelle obtenue par la fusion de quatre voix dans le chant polyphonique sarde) ont été menés par Bernard Lortat-Jacob.

Avant d’entrer dans les détails de ce sujet, il me semble nécessaire d’avoir un aperçu sur le phénomène du chant diphonique.

Description du chant diphonique

Le chant diphonique est un style vocal « découvert », pour ma part, en 1969 grâce à un document sonore rapporté de Mongolie par Roberte Hamayon, lors du dépôt de ses bandes magnétiques au département d’ethnomusicologie du Musée de l’Homme. Il repose sur une voix nommée « guimbarde », qui se caractérise par l’émission conjointe de deux sons, l’un dit « son fondamental » ou « bourdon », tenu à la même hauteur tout le temps d’une expiration, pendant que l’autre, dit « son harmonique » (qui est l’un des harmoniques naturels du son fondamental), varie au gré du chanteur. Ainsi, une personne parvient à chanter à deux voix simultanément. Ce son harmonique a un timbre proche de celui de la flûte (voix flûtée) ou de celui de la guimbarde (voix guimbarde).

Historique du phénomène vocal

Par le passé, le chant diphonique a été mentionné à plusieurs reprises. M. Rollin, professeur au Conservatoire de Paris, au xixe siècle, affirme qu’à la cour de Charles le Téméraire, un baladin chantait à deux voix simultanées, la deuxième étant à la quinte de la première. Manuel Garcia, dans son Mémoire sur la voix humaine présenté à l’Académie des sciences, à Paris, le 16 novembre 1840, a signalé le phénomène de double voix chez les paysans russes. Plusieurs voyageurs ont mentionné dans le récit de leurs pérégrinations qu’au Tibet se pratiquait le dédoublement de la voix pendant certaines récitations de mantras. Mais cette déclaration ne fut pas prise au sérieux. En 1934, des chercheurs russes enregistrèrent des disques 78 tours de chant diphonique chez les Touvins, lesquels disques ont été étudiés par Aksenov. Ce dernier, par la suite, a publié en 1964 en URSS, un article – traduit en allemand en 1967 et en anglais en 1973 –, considéré comme le premier de valeur scientifique sur le chant diphonique.

Depuis les quarante dernières années, de nombreux chercheurs, acousticiens, ethnomusicologues ont essayé d’élucider à leur tour les mystères du chant diphonique1. Des appellations diverses furent proposées par des chercheurs français au cours des trente dernières années : « chant diphonique » (Émile Leipp, 1 971 ; Gilles Léothaud, 1 971 ; Trân Quang Hai, 1974), « voix guimbarde » (Roberte Hamayon et Mireille Helffer, 1973), « chant diphonique solo » (Claudie Marcel-Dubois, 1978), « chant diplophonique » (Trân Quang Hai, 1993), « chant biformantique » (Trân Quang Hai, 1994). Plutôt que parler de « chant diplophonique » (« diplo », « deux » en grec2), ou de « chant biformantique » (chant à deux formants), j’utiliserai dans cet article, pour ne pas créer de confusion, l’expression « chant diphonique ». Certains chanteurs adoptent le terme de « chant harmonique » qui me semble impropre, car tout chant, quel que soit le type de voix, est produit par une série d’harmoniques. Ces harmoniques sont

  1. On peut citer parmi eux : Lajos Vargyas (Hongrie, 1967), Émile Leipp (France, 1 971), Gilles Léothaud (France, 171), Roberte Hamayon et Mireille Helffer (France, 1973), Suzanne Borel-Maisonny (France, 1974), Trân Quang Hai (France, 1974), Richard Walcott (États-Unis, 1974), Sumi Gunji (Japon, 1980), Roberto Laneri (1983), Lauri Harvilahti (Finlande, 1983), Alain Desjacques (France, 1984), Ted Levin (États-Unis, 1988), Carole Pegg (Royaume Uni, 1988), Graziano Tisato (Italie, 1988), Hugo Zemp (France, 1989), Mark Van Tongeren (Pays-Bas, 1993), Johanni Curtis (2006).
  2. Le terme « diplophonie », emprunté à la terminologie médicale, désigne l’existence simultanée de deux sons de hauteur différente dans le larynx.

renforcés différemment et sont sélectionnés suivant la volonté du chanteur pour créer une mélodie harmonique ou plus exactement « formantique ».

Des chanteurs ou compositeurs3 ont introduit l’effet du chant diphonique dans la musique contemporaine (« musique du monde » ou « world music », « musique nouvelle » « new music »), que ce soit en musique électro-acoustique, en musique improvisée, en musique d’inspiration byzantine, grégorienne, en musique méditative, en musique new age, en jazz, en rap…

Des musicothérapeutes, tels Jill Purce (Angleterre) ou Dominique Bertrand (France), ont utilisé la technique du chant diphonique comme moyen thérapeutique. J’ai personnellement, depuis 1998, combiné le chant diphonique avec la gymnastique holistique en utilisant vibrations harmoniques et mouvements corporels : pratique favorisant la concentration.

Divers styles de chant diphonique

La technique du chant diphonique a été rencontrée autour du mont Altaï, en Haute-Asie, chez les Mongols, Touvins, Khakash, Bachkirs, Altaïens, mais aussi de façon inégale, parmi les Rajasthanais de l’Inde, les Xhosas d’Afrique du Sud, les moines tibétains des monastères Gyütö et Gyüme, et depuis peu chez les Dani en Irian Jaya (partie indonésienne de la NouvelleGuinée).

Chez les Touvins, il existe cinq techniques principales avec bourdon, du plus grave au plus aigu, selon les styles kargyraa, borbannadyr, ezengileer, sygyt et khoomei. En ce qui concerne le style kargyraa, le fondamental a un timbre spécial (cor de chasse) avec une fréquence variant entre 55 Hz (la 0) et 65 Hz (do 1). Les harmoniques se dispersent entre H6, H7, H8, H9, H10 et H12. Chaque harmonique correspond à une voyelle déterminée. Le fondamental dans le style borbannadyr (autour de 110 Hz) reste fixe, et a

  1. Comme Trân Quang Hai (France, 1975), Dimitri Stratos (Grèce, 1977), Roberto Laneri (Italie, 1978), David Hykes et son Harmonic Choir (États-Unis, 1983), Joan La Barbara (États-Unis, 1985), Meredith Monk (États-Unis, 1980), Michael Vetter (Allemagne, 1985), Christian Bollmann (Allemagne, 1985), Michael Reimann (Allemagne, 1986), Noah Pikes (Angleterre, 1985), Tamia (France, 1987), Quatuor Nomad (France, 1989), Valentin Clastrier (France, 1990), Bodjo Pinek (Yougoslavie, 1987), Josephine Truman (Australie, 1987), Iegor Reznikoff (France, 1989), Rollin Rachelle (Pays-Bas, 1990), Thomas Clements (France, 1990), Sarah Hopkins (Australie, 1990), Mauro Bagella (Italie, 1995), Lê Tuân Hùng (Australie, 1996).

un timbre plus doux que celui du kargyraa. Le chanteur peut produire deux formants harmoniques au-dessus du fondamental. La parenté technique entre kargyraa et borbannadyr permet au chanteur d’alterner les deux styles dans la même pièce musicale. Le style sygyt possède un fondamental plus aigu (entre 165 Hz [mi 2] et 220 Hz [la 2]) qui varie avec les chanteurs. La mélodie harmonique utilise les harmoniques H9, H10 et H12 (maximum jusqu’à 2640 Hz). Le style ezengileer est une variante de sygyt, caractérisé par un rythme dynamique particulier, provenant de l’appui périodique des pieds du cavalier sur les étriers. Le style khoomei est la base du chant diphonique touvin.

Les types de chant diphonique touvins sont fondés sur les mêmes principes d’émission sonore que ceux de la guimbarde. La mélodie est créée par les harmoniques d’un fondamental, engendrés par le résonateur d’Helmholtz que constitue la cavité buccale dont on modifie les dimensions. Pour la guimbarde, c’est la lame vibrante qui attaque le résonateur. Pour le chant diphonique, ce sont les cordes vocales qui seront ajustées sur des hauteurs différentes, ce qui crée plusieurs fondamentaux, donc plusieurs séries d’harmoniques. Depuis 1985, le chant diphonique touvin a trouvé son second souffle grâce aux intérêts des chercheurs chanteurs occidentaux. D’autres techniques secondaires ou moins connues ont été « retrouvées », à savoir sigit moyen, kargiraa de steppe ou kargyraa de montagne, stil oidupa (ce style inspiré du style kargyraa, et appelé d’après le nom du créateur, est considéré comme le premier style urbain).

Chez les Mongols, il existe six techniques différentes de chant diphonique : xamryn xöömi (xöömi nasal), bagalzuuryn xöömi (xöömi pharyngé), tseedznii xöömi (xöömi thoracique), kevliin xöömi (xöömi abdominal), xarkiraa xöömi (xöömi narratif avec un fondamental très grave) et isgerex (voix de flûte dentale, d’usage rare). D. Sundui, le meilleur chanteur diphonique mongol, possède une technique de vibrato et une puissance harmonique exceptionnelle.

Les Khakash utilisent le style xaj et les Gorno-Altaïens possèdent un style kaj semblable pour accompagner les chants épiques. Avant la domination soviétique, les Khakash possédaient des styles de chant diphonique très proches de ceux pratiqués par les Touvins, à savoir sygyrtyp (comme sygyt touvin), kuveder ou kylenge (comme ezengileer touvin), et kargirar (comme kargyraa touvin). Chez les Gorno-Altaïens, on découvre les styles kiomioi, karkira et sibiski (correspondant respectivement à l’ezengileer, au kargyraa et au sygyt touvin). Les Bachkirs possèdent le style uzlau, proche du style ezengileer touvin.

Chez les moines tibétains des monastères Gyütö et Gyüme, le chant des tantras (écritures bouddhiques) et des mantras (formules sacrées), les mudras (gestes des mains), et des techniques permettant de se représenter mentalement des divinités ou des symboles se pratiquent régulièrement. Leur tradition remonte à un groupe de maîtres indiens – le plus connu étant le yogin Padmasambhava – qui visitèrent le Tibet au viiie siècle et, plus récemment, au fondateur de l’un des quatre courants du bouddhisme tibétain, Tzong Khapa. C’est Tzong Khapa (1357-1419) qui aurait introduit le chant diphonique et le style de méditation pratiqués dans les monastères Gyüto. Il tenait ce type de chant, dit-on, de sa divinité protectrice, Maha Bhairava qui, bien qu’étant une incarnation du Seigneur de la compassion (Avalokiteshvara) possédait un esprit terrifiant. Le visage central de Maha Bhairava est celui d’un buffle en colère. Ses trentequatre bras portent les trente-quatre symboles des qualités nécessaires à la libération. Aujourd’hui encore, les maîtres de cette école aiment comparer leur chant au beuglement d’un taureau.

Il existe plusieurs manières de réciter les prières : la récitation dans un registre grave avec vitesse modérée ou rapide sur des textes sacrés, les chants avec trois styles (Ta chanté avec des mots clairement prononcés sur une échelle pentatonique ; Gur avec un tempo lent utilisé dans les cérémonies principales et au cours des processions ; Yang avec une voix extrêmement grave sur des voyelles produisant l’effet harmonique pour communiquer avec les dieux). Les moines tibétains du monastère Gyüto produisent un bourdon extrêmement grave et un harmonique H10 correspondant à la tierce majeure au dessus de la troisième octave du bourdon, tandis que les moines du monastère Gyüme génèrent un bourdon grave et un harmonique 12 équivalant la quinte au-dessus de la troisième octave du bourdon. On dit que le chant des moines Gyutö correspond à l’élément « feu » et que celui des moines Gyüme exprime l’élément « eau ». Ces moines obtiennent cet effet harmonique en chantant la voyelle « O » avec la bouche allongée et les lèvres arrondies.

Au Rajasthan, en Inde, un chanteur enregistré en 1967 par le regretté John Levy, est arrivé à utiliser la technique du chant diphonique proche du style sygyt touvin pour imiter la guimbarde et la flûte double satara. Cet enregistrement unique représente la seule trace qui nous soit connue de l’existence du phénomène du chant diphonique en ce pays.

En Afrique du Sud, les Xhosa, plus particulièrement les femmes, pratiquent le chant diphonique. Cette technique, umngqokolo ngomqangi, est une imitation de l’arc musical umrhube. Ngomqangi désigne le coléoptère. La chanteuse explique que cette technique à double voix simultanée est inspirée du bruit du coléoptère placé devant la bouche utilisé comme bourdon : la cavité buccale module sur ce modèle les harmoniques produits. Dave Dargie a découvert ce chant diphonique chez les Xhosa en 1983.

À Formose (Taiwan), les Bunun, une des minorités ethniques taïwanaises, chantent les voyelles avec une voix très tendue et font sortir quelques harmoniques dans un chant à l’occasion de la récolte du millet (Pasi but but). Est-ce bien un style de chant diphonique semblable à celui pratiqué par les Mongols et les Touvins ? Faute de documents sonores et écrits, nous ne pouvons poursuivre nos recherches.

En 2002, j’ai « découvert » l’existence d’un type de chant diphonique chez les Dani, en Irian Jaya. Dans certains types de chants où l’émission des voyelles est très résonantielle, cela permet aux chanteurs de créer un deuxième formant non intentionnel (chant bouddhique japonais shômyô, certains chants bulgares, chants polyphoniques d’Europe de l’Est), ou intentionnel (phénomène quintina des chants sacrés sardes, étudié par Bernard Lortat-Jacob).

Il faut donc faire la distinction entre chant diphonique (créant une mélodie d’harmoniques) et chant à résonance harmonique (accompagné ponctuellement par des effets harmoniques).

Aspect acoustique et spectral

Perception de la hauteur des sons

J’essaierai, dans un premier temps, de décrire la notion de perception de hauteur à la lumière de l’acoustique et de la psycho-acoustique. Dans un second temps, je présenterai l’espace de liberté du chant diphonique. Enfin, il serait profitable de formuler quelques hypothèses sur les mécanismes de formation de ce chant, sur la réalisation du chant diphonique (diplophonique, biformantique…).

Préalablement, il est nécessaire de comprendre le sens de la terminologie spécifique appliqué au chant diphonique, et qui utilise des termes tels que « hauteurs des sons » ou « tonalité ». Cette notion présente beaucoup d’ambigüités, et ne répond pas au principe simple de la mesure des fréquences émises. La hauteur des sons tient plus de la psycho-acoustique que de la physique. Mes propos s’appuient d’une part sur les découvertes récentes de certains chercheurs, d’autre part sur mes propres observations et expérimentations effectuées à partir du sonagraphe. Le sonagraphe permet en effet d’obtenir l’image du son à étudier. Sur un seul papier, figure en abscisse l’information « temps », en ordonnée l’information « fréquence », et au moyen de l’épaisseur du trait tracé, l’information « intensité ». Les manuels d’acoustique classiques enseignent que la hauteur des sons harmoniques, donc les sons comportant un fondamental de fréquence F et une suite d’harmoniques (F1, F2, F3… multiples de F) est donnée par la fréquence du premier son fondamental. Ceci n’est pas tout à fait exact, car il est possible de supprimer électroniquement ce fondamental sans pour cela changer la hauteur subjective du son perçu. Si cette théorie était exacte, une chaîne électro-acoustique ne reproduisant pas l’extrême grave changerait la hauteur des sons. Il n’en est rien car le timbre change mais pas la hauteur. Certains chercheurs proposent une autre théorie plus cohérente : la hauteur des sons est donnée par l’écartement des raies harmoniques ou la différence de fréquence entre deux raies harmoniques. Que devient la hauteur des sons dans ce cas pour les spectres sonores dit « à partiels » (les partiels sont les harmoniques qui ne sont pas des multiples entiers du fondamental) ? Dans ce cas, l’individu perçoit une moyenne de l’écartement des raies dans la zone qui l’intéresse. Ceci, en effet, concorde avec les différences de perception avérées d’un individu à l’autre.

On désigne par l’expression « spectre à formant » le renforcement en intensité d’un groupe d’harmoniques constituant un formant, c’est à dire une zone de fréquences où l’énergie est grande. En rapport avec l’existence de ce formant, une deuxième notion de la perception de hauteur se fait jour. On s’est en effet aperçu que la position du formant dans le spectre sonore donnait la perception d’une nouvelle hauteur. Dans ce cas, il ne s’agit plus de l’écartement des raies harmoniques dans la zone formantique mais de la position du formant dans le spectre. Cette théorie doit être nuancée, car elle est soumise à conditions.

À titre d’expérience, si l’on chante trois do (do 1, do 2, do 3) à une octave d’intervalle entre deux do en projetant la voix comme en direction d’un grand auditoire. On constate à la lecture du sonagramme que le maximum d’énergie se trouvait dans la zone sensible de l’oreille humaine (2 à 3 KHz). Il s’agit bien d’un formant situé entre 2 et 4 KHz. Si on enregistre trois do dans la même tonalité, mais cette fois en posant la voix vers un auditoire restreint, et on observe la disparition de ce formant.

Dans ce cas, la disparition du formant ne change pas la hauteur des sons. La perception de la hauteur par la position du formant n’est possible que si celui-ci est très aigu, à savoir que l’énergie du formant n’est répartie que sur deux ou trois harmoniques. Donc, si la densité d’énergie du formant est grande, et que le formant est étroit, celui-ci donnera une information de hauteur en plus de la tonalité globale du morceau chanté. Par ce biais, on parvient à la technique du chant diphonique. Cette notion de formant prenant le pas sur les raies harmoniques fut par la suite confirmée grâce aux recherches expérimentales sur la formation du chant diphonique.

Comparaison entre technique vocale diphonique et technique vocale classique

Dans le chant diphonique, le formant (son aigu) se déplaçant dans le spectre pour donner une certaine mélodie, la hauteur donnée par cette seconde voix génère parfois une certaine ambigüité. Une accoutumance, ou une éducation, est souhaitable pour l’oreille occidentale. Par contre, la mise en évidence du bourdon, son grave et consistant, est relativement facile grâce aux sonagrammes. Il se voit très nettement. Auditivement, il est très net. Après la mise en évidence du son fondamental, la comparaison des deux spectres est la suivante : l’un d’un chant diphonique, l’autre d’un chant dit « classique », les deux étant produits par le même chanteur. Le chant classique se caractérise par un doublement de l’écartement des raies harmoniques lorsque le chant passe à l’octave. Le chant diphonique présente un écartement égal des raies (ceci est prévisible puisque le bourdon demeure constant) pendant le passage d’une octave où l’on voit le déplacement du formant. En effet, on peut mesurer avec facilité la distance entre les raies pour chaque son émis : dans ce cas, la perception de la mélodie du chant diphonique se fait par le biais du déplacement du formant dans le spectre sonore.

Il convient d’insister sur le fait que ceci n’est vraiment possible que si le formant se concentre dans l’aigu, et c’est précisément le cas du chant diphonique. L’énergie sonore est principalement divisée entre le bourdon et la deuxième voix constituée de deux harmoniques – trois tout au plus. Il a parfois été dit qu’une troisième voix pouvait être produite. J’ai effectivement constaté, grâce aux sonagramme (sur les techniques touvines) que ceci existait, mais il m’est impossible d’affirmer que cette troisième voix est contrôlée. À mon avis, cette voix supplémentaire résulte plus de la personnalité de l’exécutant que d’une technique particulière. À cette occasion, on peut déjà établir un parallèle entre chant diphonique et guimbarde. La guimbarde produit, comme le chant diphonique, plusieurs « voix » différentes : le bourdon, le chant et le contrechant. On pourrait considérer cette troisième voix comme un contrechant : celui-ci peut être produit délibérément, mais sans doute pas contrôlé.

Espace de liberté du chant diphonique

Du point de vue de l’espace de liberté, le chant diphonique équivaut au chant normal sauf pour ce qui concerne l’ambitus. Le temps d’exécution dépend évidemment de la cage thoracique du chanteur, donc de la respiration, mais également de l’intensité sonore, car l’intensité est en rapport avec le débit d’air. Le champ de liberté concernant l’intensité est par contre relativement restreint et le niveau des harmoniques est lié au niveau du bourdon. Le chanteur a intérêt à garder un bourdon d’intensité suffisante afin de faire émerger un maximum d’harmoniques. J’ai constaté précédemment que les harmoniques étaient d’autant plus claires que le formant était étroit et intense. On peut donc en déduire des liens entre les phénomènes d’intensité, de temps et de clarté. Le champ de liberté concernant le timbre se passe de commentaire, le son résultant étant dans la majorité des cas formé d’un bourdon et d’un ou deux harmoniques.

La question la plus intéressante concerne l’ambitus. Il est généralement admis que pour une tonalité judicieuse (en fonction de l’exécutant et de la pièce musicale à interpréter), un chanteur peut moduler ou choisir entre les harmoniques 3 et 13. Ceci est vrai mais mérite quelque précision. L’ambitus est fonction de la tonalité. Si la tonalité est en do 2, la réalisation se fait sur quatorze harmoniques du sixième au vingtième, ce qui représente une octave et une sixte. Si la tonalité est élevée, par exemple do 3, le choix se fait entre les harmoniques 3 et 10 soit huit harmoniques, représentant également une octave et une sixte. Les remarques suivantes s’imposent. D’une part, l’ambitus du chant diphonique est plus restreint que celui du chant normal. D’autre part, en théorie, le chanteur choisit la tonalité qu’il souhaite entre do 2 et do 3. En pratique, il réalise instinctivement un compromis entre la clarté de la deuxième voix et l’ambitus de son chant – le choix de la tonalité étant également fonction de la pièce musicale à exécuter. En effet, si la tonalité est élevée, par exemple do 3, le choix des harmoniques se trouve restreint, mais la deuxième voix est alors très claire. Dans le cas d’une tonalité en do 2, la deuxième voix est plus confuse, alors que l’ambitus atteint son maximum. La clarté des sons peut s’expliquer par le fait que dans le premier cas le chanteur ne peut sélectionner qu’un harmonique, alors que dans le deuxième il peut en sélectionner presque deux. Pour la question de l’ambitus, je sais que la mise en action des résonateurs buccaux est indépendante de la tonalité des sons émis par les cordes vocales. Autrement dit, le chanteur sélectionne toujours les harmoniques dans la même zone du spectre, que ceux-ci soient écartés ou resserrés.

De tout ceci, il résulte que le chanteur choisit la tonalité instinctivement pour déployer à la fois l’ambitus maximum et le maximum de clarté. Dans mon cas personnel, le meilleur compromis se trouve entre do 2 et la 2. Je peux ainsi produire avec les harmoniques à partir d’un son fondamental entre do 2 et la 2, une mélodie couvrant jusqu’à deux octaves.

Mécanismes de production du chant


Il est toujours très difficile de connaître de l’extérieur ce qui se passe à l’intérieur d’une machine. Tel est le cas de l’appareil phonatoire. Ce qui va en être dit ici est donc grossier et schématique, et ne doit pas être pris à la lettre. En traitant le système phonatoire par analogie, on peut se faire une idée des mécanismes, mais sûrement pas en fournir une explication complète. Un résonateur est une cavité munie d’un col pouvant vibrer dans un certain registre de fréquences. Le système excitateur – le pharynx et les cordes vocales, en l’occurrence – émet un spectre harmonique, à savoir les fréquences F1, F1, F3, F4… de résonateurs qui choisissent certaines fréquences et amplifient celles-ci. Le choix de ces fréquences dépend évidemment de l’habileté du chanteur. Il en va ainsi lorsqu’un chanteur porte la voix pour une grande salle. Instinctivement, il adopte ses résonateurs pour émettre le maximum d’énergie dans la zone sensible de l’oreille. Il est à noter que les fréquences amplifiées sont fonction du volume de la cavité, de la section de l’ouverture et de la longueur du col constituant l’ouverture.

Grâce à ce principe, je perçois déjà l’influence de la grandeur de la cavité buccale, de l’ouverture de la bouche, de la position des lèvres sur le chant. Mais ceci ne me donne pas un chant diphonique. En effet, il me faut deux voix. La première provient simplement du fait que celui-ci est intense à l’émission et que, de toute manière, il ne subit pas le filtrage des résonateurs. Son intensité, supérieure à celle des harmoniques, lui permet de maintenir grâce à un rayonnement buccal et nasal. J’ai constaté qu’en fermant la cavité nasale, le bourdon diminuait en intensité. Ceci s’explique de deux manières : d’une part une source de rayonnement est bouchée (il s’agit du nez), et d’autre part le débit d’air se trouve réduit, et avec lui l’intensité sonore des cordes vocales.

L’intérêt d’avoir plusieurs cavités est primordial. J’ai pu mettre en évidence que seul le couplage de plusieurs cavités permet d’obtenir le formant aigu indispensable au chant diphonique. Pour cette étude, j’ai en premier lieu procédé aux vérifications du principe des résonateurs, à savoir l’influence des paramètres fondamentaux. J’ai ainsi constaté que la tonalité du son monte en ouvrant plus grand la bouche. Pour mettre en évidence la formation d’un formant aigu, j’ai tenté de produire deux sortes de chants diphoniques : l’un avec la langue au repos, c’est à dire la bouche devenant une grande et unique cavité, et l’autre avec la pointe de la langue remontant et touchant la voûte palatine, divisant ainsi la bouche en deux cavités. La constatation faite grâce à la théorie des résonateurs couplés est la suivante : dans le premier cas, les sons ne sont pas clairs. Certes, on entend très bien le bourdon mais la deuxième voix est difficile à entendre. Il n’y a pas une différenciation distincte entre les deux voix. De plus, la mélodie s’impose difficilement à l’écoute. Selon les sonagrammes analysés, avec une cavité buccale unique l’énergie du formant se disperse sur trois ou quatre harmoniques, et donc la sensation de la deuxième voix devient beaucoup plus faible. Par contre, quand la langue divise la bouche en deux cavités, le formant aigu et intense réapparaît. Autrement dit, les sons harmoniques émis par les cordes vocales subissent, avec une seule cavité, une amplification et un filtrage grossiers, ce qui a pour conséquence de faire disparaître l’effet diphonique. Le chant diphonique nécessite donc un réseau de résonateurs très sélectifs filtrant uniquement les harmoniques désirés par le chanteur. Dans le cas d’un couplage serré entre les deux cavités, celles-ci donnent une résonance unique très aiguë. Lorsque le couplage devient lâche, le formant a une intensité moins grande, et l’énergie sonore est étalée dans le spectre. Lorsque ces cavités se réduisent à une seule, la courbe pointue devient encore plus ronde et on aboutit au premier exemple évoqué, consistant en un chant diphonique très flou (langue en position de « repos »).

On peut donc en conclure que la bouche avec la position de la langue joue un rôle prépondérant. On peut grossièrement l’assimiler à un filtre pointu qui se déplacerait dans le spectre uniquement pour choisir les harmoniques intéressants.

Réalisation du chant diphonique

Après la découverte de cette technique, et après quelques années de tâtonnement, je suis parvenu à maîtriser la pratique, et ai constaté qu’on peut produire les deux sons simultanés grâce à trois méthodes distinctes.

Première méthode avec une cavité buccale

La langue peut être à plat, en position de « repos », ou bien la base de la langue être légèrement remontée sans jamais toucher la partie molle du palais. Seules la bouche et les lèvres bougent. Par cette variation de la cavité buccale en prononçant les deux voyelles « ü » et « i » liées sans interruption (comme si l’on disait « oui » en français), on perçoit une faible mélodie des harmoniques qui ne dépasse guère l’harmonique 8.

Deuxième méthode avec deux cavités buccales

  1. Chanter avec la voix de gorge ;
  2. prononcer la lettre « l ». Dès que la pointe de la langue touche le centre de la voûte palatine, maintenir cette position ;
  3. prononcer ensuite la voyelle « ü », toujours la pointe de la langue collée fermement contre le point de fixation entre le palais dur et le palais mou ; 4. contracter les muscles du cou et ceux de l’abdomen pendant le chant comme pour soulever un objet très lourd ;
  4. donner un timbre très nasalisé en l’amplifiant à travers les fosses nasales ;
  5. prononcer ensuite les deux voyelles « i » et « ü » (ou bien « o » et « a ») liées mais alternées, plusieurs fois de suite ;
  6. ainsi sont obtenus le bourdon et les harmoniques, en pente ascendante comme en pente descendante, selon le désir du chanteur.

Pour moduler la mélodie des harmoniques, il est possible de varier la position des lèvres ou celle de la langue. La forte concentration musculaire augmente la clarté harmonique.

Troisième méthode

Celle-ci consiste à utiliser la base de la langue remontée et mordue par les molaires supérieures pendant que le son de gorge est produit sur les deux voyelles « i » et « ü » liées et répétées plusieurs fois pour créer une série d’harmoniques descendants et ascendants. Cette série d’harmoniques se trouve dans la zone entre 2 KHz et 3,5 KHz. Cette troisième méthode ne permet pas le contrôle de la mélodie formantique, mais il ne s’agit ici que d’une démonstration expérimentale sur les possibilités de timbre harmonique.

Le chant diphonique : nouvelle thérapeutique

Le chant diphonique, en dehors de son expression traditionnelle (en Mongolie, au pays Touva, au Tibet), et de l’usage expérimental qu’en ont fait de nombreux chanteurs contemporains, tant en Europe qu’en Amérique, représente également un nouvel outil pour des applications thérapeutiques (Trân Quang Hai4, Jill Purce, Dominique Bertrand, Bernard Dubreuil).

Jill Purce (Royaume Uni) propose un travail fondé sur la respiration et le chant diphonique auprès des personnes qui bégaient, ou éprouvent des sensations de blocage dans la gorge, ou sont effrayées par leur propre voix, ou encore souffrent d’inhibition, de troubles respiratoires, d’anxiété, de fatigue. Les principaux effets du chant diphonique concernent avant tout la concentration et l’équilibre psychologique. Pour des raisons techniques, le chant réclame de la part du patient une grande attention.

Le chanteur talentueux peut coordonner la structure musicale avec les forces énergétiques, la puissance vibratoire de l’œuvre. Quand l’harmonie émerge puis s’épanouit, le nettoyage de l’inconscient peut commencer. Pour les uns, le chant diphonique « vous envoie au septième ciel ». Pour les autres, il vous plonge au cœur du mystère musical, où les ondes sonores pénètrent le secret de la naissance de l’univers. Les chamans du Tibet, de Sibérie et d’Amérique du Nord font résonner les harmoniques de la zone frontale, ce qui leur permet de soigner avec la voix. C’est un chant magique, un secret des anciens chamans mongols, un yoga sonore pratiqué par des moines tibétains pour atteindre l’illumination, un chant à pouvoirs, une vibration qui pénètre jusqu’aux cellules de l’organisme. C’est le fameux « chant qui guérit ».

Une démarche originale et féconde

Après plus de trois ans d’expériences personnelles en tant que chanteur, j’ai pu parvenir à la réalisation de cette technique vocale singulière, diffusée depuis 1972 dans le grand public. Dans les années 1980, et afin d’explorer les procédés physiologiques du chant diphonique, je me suis efforcé d’obtenir sur le sonagraphe des tracés de spectres semblables à ceux de chanteurs originaires de Mongolie, de Sibérie, du Rajasthan et d’Afrique du Sud. L’analyse comparée des spectogrammes, à la lumière de ces expériences, a permis de classer pour la première fois les différents styles de chant diphonique d’Asie et d’Afrique du Sud en fonction des résonateurs, des contractions musculaires et des ornementations. Les recherches expérimentales ont en outre conduit :

  1. à mettre en évidence le bourdon harmonique et la mélodie fondamentale,
  2. L’article « Recherches expérimentales sur le chant diphonique » (Zemp & Trân Quang 1991) retrace toutes les étapes de cette recherche expérimentale.

ce qui va à l’encontre du principe initial du chant diphonique traditionnel ; 2. à croiser les deux mélodies (fondamentale et harmoniques) et à explorer le chant triphonique ;

  1. à mettre en évidence les trois zones harmoniques sur la base d’un même son fondamental ;
  2. à mettre au jour la possibilité de créer des sons fondamentaux (une octave au-dessous du son fondamental, voire une octave et une quinte, et deux octaves au-dessous du son fondamental) ;
  3. à montrer en images les sept chakras du yoga par la présence des harmoniques selon les voyelles sélectionnées pour faire une pyramide de chakras.

J’ai parallèlement utilisé des moyens fibroscopiques, stroboscopiques et laryngoscopiques complétés par des analyses spectrales sur le sonagraphe, mené des études comparatives et pragmatiques de divers styles de chant diphonique chez différentes populations (Mongols, Touvins, Xhosas, Rajasthanais, Tibétains), et ai débuté quelques explorations harmoniques préliminaires à travers le chant du millet Pasi but but des Bunun (Formose), des récitations bouddhiques shômyô (Japon), et des chants de gorge des Dani en Irian Jaya. Enfin j’ai utilisé la technique du chant diphonique dans diverses compositions musicales électro-acoustiques et avant-gardistes.

Pour conclure, mentionnons que ces recherches sont restituées par le film de Hugo Zemp (2005), Le Chant des harmoniques. Ce film montre la technique du chant diphonique du point de vue articulatoire et spectral. Le cinéma-radiologie, avec le traitement informatique de l’image en temps réel et son synchrone, permet de montrer les modifications de la cavité buccale grâce aux spectres sonores analysés par le sonagraphe de différentes techniques du chant diphonique, par des chanteurs de Mongolie, du Rajasthan, d’Afrique du Sud, du Tibet, de la République de Touva, et par moi-même.


Bibliographique indicative

Abitol, Jean, 2004. L’Odyssée de la voix, Paris, Robert Laffont.

Adachi, Seiji ; Yamada, Masashi, 1999. « An acoustical study of sound production in biphonic singing, xöömij », Journal of the Acoustical Society of America, vol. 105, n° 5, pp. 2920-2932.

Aksenov, Aleksej Nikolaevich, 1973. « Tuvin folk music », Journal of the Society for Asian Music, vol. 4, n° 2, pp. 7-18. — 1964. Tuvinskaja narodnaja muzyka, Moscou.

— 1967. « Die Stile der Tuvinischen zweistimmigen Sologesanges », in Erich Stockmann (dir.), Sowjetische Volkslied- und Volksmusikforschung, Berlin, Akademie Verlag, pp. 293-308.

Badraa, Z., 1986. « L’art Xöömij », Les Nouvelles de Mongolie, n° 9, pp. 18-19.

— 1981. « “Xöömij” i “urtyn duu”, specificeskie Javienija Mongol’skoj tradicionnoj klassiceskoj muzyki », Professional’naja muzyka ustoj tradicij narodov bliznevo vostoka i sovremennost, Tachkent, pp. 116-119.

Batzengel, 1978. « Urtyn duu, xöömii and morin xuur », Yuki Minegishi & Richard Emmert (dir.), Muscial Voices of Asia, actes du colloque « Asian traditional performing arts (ATPA) », Tokyo, Heibonsha Ltd Publishers, pp. 52-53.

Belfer, Richard, 1986. « Chant harmonique : découvrez votre deuxième voix », Médecines douces, n° 77, pp. 50-53.

Bloothooft, Gerrit ; Bringmann, Eldrid ; Capellen, Marieke (van) ; Luipen, Jolanda B. (van) ; Thomassen, Koen P. , 1992. « Acoustic and Perception of Overtone Singing », Journal of the Acoustical Society of America (JASA), vol. 92, n° 4, pp. 1827-1836.

Borel-Maisonny, Suzanne ; Castellengo, Michèle, 1976. « Étude radiographique des mouvements oro-pharyngée pendant la parole et le jeu instrumental », Bulletin du Groupe d’acoustique musicale (GAM), n° 86.

Desjacques, Alain, 1993. « Chapitre 1. Le xöömij », in « Chants de l’Altaï Mongol », thèse de doctorat nouveau régime dirigée par les professeurs Manfred Kelkel et Jacques Legrand à l’université Paris-IV Sorbonne, pp. 7-108.

Dargie, Dave, 1988. Xhosa Music. Its Techniques and Instruments, with a Collection of Songs, Cape Town, David Philip.

— 1985. « Some recent discoveries and recordings in Xhosa music », in Collectif, Symposium 5, conférence donnée au cours du 5e « Ethnomusicology Symposia » (University of Cape Town, 1984), Grahamtown, International Library of African Music, pp. 29-35.

Dmitriev, L. ; Chernov, B. ; Maslow, V., 1983. « Functioning of the voice mechanism in double-voice Touvinian singing », Folia Phoniatrica, vol. 35, n° 5, pp. 193-197.

Fuks, Leonardo ; Hammarberg, Britta ; Sundberg, Johan, 1998. « A selfsustained vocal-ventricular phonation mode : acoustical, aerodynamic and glottographic evidences », TMH-QPSR, n° 3, pp. 49-59.

Gunji, Sumi, 1980. « An Acoustical Consideration of Xöömij », in The Japan Foundation (dir.), Musical Voices of Asia, Tokyo, Heibonsha Publishers, pp. 135-141.

Hamayon, Roberte, 1980. « Mongol Music », in Stanley Sadie (dir.), New Grove’s Dictionary of Music and Musicians, vol. 12, Londres, MacMillan Publishers, pp. 482-485.

Harvilahti, Lauri, 1983. « A two voiced song with no word », SuomalaisUgrilaisen Seuran Aikakauskirja [Journal de la Société finno-ougrienne], vol. 78, pp. 43-56.

Harvilahti, Lauri ; Kaskinen, Hannu, 1983. « On the application possibilities of overtone singing », Suomen Antropologi, vol. 4, pp. 249-255.

Laneri, Roberto, 1983. « Vocal techniques of overtone production », NPCA Quarterly Journal, vol. 12, nos 2-3, pp. 26-30.

Leipp, Émile, 1971. « Considération acoustique sur le chant diphonique », Bulletin du Groupe d’acoustique musicale (GAM), n° 58, pp. 1-10.

Lentin, Jean-Pierre, 1986. « Je fais chanter tout mon corps », Actuel, nos 81-82, pp. 142- 145.

Léothaud, Gilles, 1989. « Considérations acoustiques et musicales sur le chant diphonique », in Collectif, Le Chant diphonique, Limoges, Institut de la voix, coll. « Dossiers », pp. 17-43.

Neuschaefer-Rube, Christiane ; Saus, Wolfgang ; Matern, Gabriele ; Kob, Malte ; Klajman, Stanislaw, 2002. « Sonographische und endoskopische Untersuchungen beim Obertonsingen », in Hellmut K. Geissner (dir.), Stimmkulturen, vol. 3, Stuttgarter Stimmtage 2000, St. Ingbert (Allemagne), Röhrig Universitätsverlag, pp. 219-222.

Pailler, J.-P., 1989. « Examen vidéo du larynx et de la cavité buccale de Monsieur Trân Quang Hai », in Collectif, Le Chant diphonique, Limoges, Institut de la voix, coll. « Dossiers », pp. 11-13.

Pegg, Carole, 1992. « Mongolian conceptualizations of overtonesinging (xöömii) », The British Journal of Ethnomusicology, vol. 1, pp. 31-53.

Rachelle, Rollin, 1996. Overtone Singing Study Guide, Amsterdam, Cryptic Voices Productions.

Sauvage, J.-P., 1989. « Observation clinique de Monsieur Trân Quang Hai », in Collectif, Le Chant diphonique, Limoges, Institut de la voix, coll. « Dossiers », pp. 3-10.

Smith, Huston ; Stevens, Kenneth N. ; Tomlinson, Raymond S. , 1967. « On an unusual mode of chanting of certain Tibetan lamas », Journal of the Acoustical Society of America, vol. 41, n° 5, pp. 1262-1264.

Tisato, Graziano ; Rici Maccarini, Andrea, 1991. « Analysis and synthesis of diphonic singing », Bulletin d’audiophonologie, vol. 7, nos 5-6, « Nouvelles voies de la voix », pp. 619-648.

Tisato, Graziano ; Rici Maccarini, Andrea ; Trân quang, Hai, 2002. « Caratteristiche fisiologiche e acustiche del Canto Difonico », contribution au 2e « Convegno internazionale di foniatria e logopedia » (Ravenne, 2002). Disponible en ligne, pdf/canto_difonico.pdf [consulté en juin 2010].

Tisato, Graziano ; Cosi, Piero, 2003. « On the magic of overtone singing », in Piero Cosi, Emanuela Magno Caldognetto & Alberto Zamboni (dir.), Voce, Canto, Parlato. Studi in onore di Franco Ferrero, Padoue/Rome, Unipress/Istituto di scienze e tecnologie della cognizione (Sezione di fonetica e dialettologia), pp. 83-100. Disponible en ligne, http://www2.pd.istc. [consulté en juin 2010].

Tisato Graziano, 1989. « Il canto degli armonici », Culture musicali. Quaderni di etnomusicologia, vol. 15-16, « Nuove tecnologie et documentazione etnomusicologica », pp. 44-68.

— 1979. « Analisi digitale dei suoni multifonici », in Giovanni De Poli (dir.), Atti del terzo colloquio di informatica musicale, Padoue, Universita di Padova, pp. 107-128.

Trân quang, Hai ; Guillou, Denis, 1980. « Original research and acoustical analysis in connection with the xöömij style of biphonic singing », in Yuki Minegishi & Richard Emmert (dir.), Muscial Voices of Asia, actes du colloque « Asian traditional performing arts (ATPA) », Tokyo, Heibonsha Ltd Publishers, pp. 162-173.

Trân quang, Hai, 2002. « À la découverte du chant diphonique », in Guy Cornut (dir.), Moyens d’investigation et pédagogie de la voix chantée, actes du colloque organisé au Conservatoire national de région de Lyon dans le cadre des Rencontres vocales en région Rhône-Alpes (8-10 février 2001), Lyon, Symétrie, pp. 117-132.

— 2002. « New experiments on overtone singing », in Hellmut K. Geissner (dir.), Stimmkulturen, vol. 3, Stuttgarter Stimmtage 2000, St. Ingbert (Allemagne), Röhrig Universitätsverlag, pp. 65-70.

— 1997. « Recherches introspectives sur le chant diphonique et leurs applications », La Licorne, n° 41, « Penser la Voix », pp. 95-210.

— 1995. « Survey of overtone singing style », Dokumentation 1994, actes du congrès de l’European Voice Teachers Association (Detmold, 1994), Detmold, EVTA, pp. 49-62.

— 1995. « Le chant diphonique : description, historique, styles, aspect acoustique et spectral », EM. Annuario degli archivi di etnomusicologia dell’Accademia nazionale di Santa Cecilia, n° 2, pp. 123-150.

— 1991. « New experimental about the overtone singing style », Bulletin d’audiophonologie, vol. 7, nos 5-6, « Nouvelles voies de la voix », pp. 607-618.

— 1990. « Les musiques vocales », in Jean-Marc Alby, Catherine Alès & Patrick Sansoy (dir.), L’Esprit des voix. Études sur la fonction vocale, Grenoble, La Pensée sauvage, coll. « Corps et psychisme », pp. 43-52.

— 1975. « Technique de la voix chantée mongole : xöömij », Bulletin du CEMO, nos 14-15, pp. 32-36.

Van Tongeren, Mark, 2002. Overtone Singing. Physics and Metaphysics of Harmonics in East and West, Amsterdam, Fusica, coll. « The Harmonic Series ».

— 1995. « A Tuvan perspective on throat singing », in Wim Van Zanten and Marjolijn Van Roon (dir.), Oideion, vol. 2, The Performing Arts World-Wide, Leyde, Leiden University, coll. « CNWS Publications », pp. 293-312.

— 1994. « Xöömij in Tuva : new developments, new dimensions », mémoire de maîtrise sous la direction de Ernst Heins soutenue à l’Ethnomusicologisch Centrum « Jaap Kunst » de l’Université d’Amsterdam.

Vargyas, Lajos, 1968. « Performing styles in Mongolian chant », Journal of the International Folk Music Council, vol. 20, pp. 70-72.

Vlachou, Evangelia, 1985. « Recherches vocales contemporaines : chant diphonique », mémoire de maîtrise soutenue à l’université Paris-VIII

Saint Denis.

Walcott, Ronald, 1974. « The chöömij of Mongolia. A spectral analysis of overtone singing », Selected Reports in Ethnomusicology, vol. 2, n° 1, pp. 55-59.

Zarlino, Gioseffo, 1558. Le Istitutioni harmoniche di M. Gioseffo Zarlino da Chiogga, nelle quali oltra le materie appartenti alla musica, si trovano dichiarati molti luoghi vedere, Venise.

Zemp, Hugo ; Trân quang, Hai , 1991. « Recherches expérimentales sur le chant diphonique », Cahiers de musiques traditionnelles, vol. 4, « Voix », pp. 27-68.

Discographie indicative


Bois, Pierre (prod.), 1996. Chants épiques et diphoniques. Touva, Tadjikistan, Kalmoukie, Chor (Asie centrale et Sibérie), Paris, INÉDIT/Maison des cultures du monde, n° W 260 067.

Shu-de, 1994. Voices from the Distant Steppe, Londres, Realworld, n° CDRW 41.

Tumat, Gennadi ; Kuular, German ; Kuular Oleg et al., 1993. C’’oomej : ThroatSinging from the Center of Asia, Frankfort, World Network, n° 55.838.

Huun-Huur-Tu, 1993. Sixty Horses In My Herd. Old Songs and Tunes of Tuva, New Jersey, Shanachie Records, n° 64050.

Tuva Ensemble, 1992. Echoes from the Spirit World, Leyde, Pan Records, n° PAN 2013 CD.

Ondar, Kongar-ool ; Khovalig, Kaigal-ool ; Tumat, Gennadi, 1991. Tuva. Voices from the Land of Eagles, Leyde, Pan Records, n° PAN 2005 CD.

Ozum, [Sprouts], 1991. Young Voices of Ancient Tuva, Amsterdam, Window to Europe, n° SUM 90 008.

Levin, Ted ; Alexeev, Eduard ; Kirgiz, Zoya (prod.), 1990. Tuva. Voices from the Center of Asia, Washington DC/Cambridge (USA), Smithsonian Folkways/ Rounder Records, n° CD SF 40017.


Melodies of the Steppes, 1992. White Moon (Tsagaan Sar). Traditional and Popular Music from Mongolia, Leyde, Pan Records, coll. « Ethnic Series », n° PAN 2010 CD.

Bois, Pierre (prod.), 1989. Mongolie. Musique vocale et instrumentale, Paris, INÉDIT/Maison des cultures du monde, n° W 260 009.

Collectif, 1986. Mongolie. Musique et chants de tradition populaire, Paris, Groupe de recherches et d’études des musiques (GREM), n° G 7511.

Bashkirie, Altaï, Tuval

Mongush, Boris ; Kuular, Sergei ; Khunashtaar-ool, Oorzhak et al., 1993. Uzlyau. Gutteral Singing from the Sayan, Altai And Ural Mountains, Leyde, Pan Records, n° PAN 2019 CD.

Afrique du Sud

The Ngqoko Women’s Ensemble, 1996. Le Chant des femmes Xhosa (Afrique du Sud), Genève, VDE-Gallo Records, n° VDE 879.

Collectif, 1996. Les Voix du monde. Une anthologie des expressions vocales, Paris, CNRS/Musée de l’Homme, coll. « Le chant du monde », n° CMX 374 1010.12.

Filmographie indicative

Béguinet, Christian, 2004. Le Chant diphonique, écrit par Trân Quang Hai & Luc Souvet, Saint-Denis de la Réunion, CRDP de la Réunion, DVD, vidéo, 27 min.

Zemp, Hugo, 2005 [1989]. Le Chant des Harmoniques, écrit par Trân Quang Hai & Hugo Zemp, Paris, CNRS Audiovisuel/Société française d’ethnomusicologie, DVD, 16 mm, 38 min.

Kersalé, Patrick, 2006. La Voix, Lyon, Éditions musicales Lugdivine, coll.

« Thèm’Axe », DVD, vidéo, 100 min.

Tran Quang Hai et le sonagraph , 2000

extrait du film le chant des harmoniques

Extraits d’images du film Le Chant des Harmoniques avec Tran Quang Hai , 1998

image spectrale

Analyse spectrale de la voix diphonique de Tran Quang Hai ,2002

tran quang hai overtone singing spectogram 1998

Voix spectrale du chant diphonique de Tran Quang Hai, 1998

Video Le Chant des Harmoniques avec TRAN QUANG HAI , CNRS

Vidéothèque du CNRS

Accueil > Fiche détaillée


Chant des harmoniques (Le)

  • Description
  • Storyboard
  00:38:00  1989  SD 4/3  Couleur  Sonore

Dans la technique vocale du chant diphonique connu surtout en Asie centrale, une seule personne chante à deux voix : un bourdon (une note grave) constitué par le son fondamental, et une mélodie superposée formée par des harmoniques sélectionnées dans la cavité buccale.
Tran Quang Hai, ethnomusicologue et musicien, enseigne cette technique dans un atelier d’initiation. Des images radiologiques et spectrales, en temps réel et son synchrone, permettent de visualiser les procédés vocaux du point de vue physiologique puis acoustique.
Deux artistes mongols sont interviewés et filmés lors d’un concert à Paris.

Producteur : CNRS AVCNRS et Musée de l’Homme-Etudes ethnomusicologieSFE
Participation : Min. Culture et Communication – Dir. Musique et DanseCNC
Auteur : ZEMP Hugo (Etudes ethnomusicologie, UMR CNRS, Paris) TRAN Quang Hai (Etudes ethnomusicologie, UMR CNRS, Paris)
Réalisateur : ZEMP Hugo
Procédé audiovisuelPrises de vues réelles. Utilisation d’images d’écrans d’ordinateurs et d’images radiologiques.
Interviews en son direct (mongol sous-titré et français) et commentaire voix off. Musique et chants mongols.
Date de diffusion TV04/1995 (Planète)

Tarif HT Usage
Privé Institutionnel
DVD  16.66  37.50
Hors frais d’expedition


Musique et danse


France ; Asie

Fiche Technique
N° notice 606
Public Grand public ; Public spécialisé
Support original Film 16 mm
Version Français ; Anglais
Distribution Vente (usage privé), Vente (usage institutionnel)
Support de diffusion Film 16 mm ; DVD ; Beta SP

Mystères des voix du monde (VF)

Mystères des voix du monde (VF)

Published on Dec 21, 2016

Le célèbre ethnomusicologue Trân Quang Hai nous invite avec humour à un extraordinaire tour du monde des timbres de voix. Un voyage initiatique en quelque sorte ! Il lève le voile sur les techniques de travestissement vocal des sorciers africains, sur le chant diphonique mongol ou encore sur la voix extrêmement grave des moines bouddhistes tibétains. © Patrick Kersalé 2012 website: blog:…

Training to have a long breath ( 1 minute non stop) to sing overtones

Training to have a long breath ( 1 minute non stop) to sing overtones

Published on Feb 22, 2009

Trân Quang Hai showed his method and gave an example with a long breath of 1 minute without stopping with a melody with overtones Filmed in Limeil Brevannes, France, Sunday 22 February 2009

Tran Quang Hai sings the 7 CHAKRAS with overtones

Tran Quang Hai sings the 7 CHAKRAS with overtones

Published on Nov 18, 2007

How can we recognize the Chakras on the screen and at the same time hear the pitch of the Chakras . The answer is on this video performed by Tran Quang Hai. This is his experimental research