EVAN MILTON : Ngoko Ensemble: The dying art of Xhosa overtone singing

Ngoko Ensemble: The dying art of Xhosa overtone singing

‘Emerging Modernities’ sees the Ngqoko Women’s Ensemble return to Cape Town for an evening of Xhosa overtone singing – as well as modern compositions based on this unique and threatened musical form.

Ngoko Ensemble: The dying art of Xhosa overtone singing

(This column originally appeared in the Cape Argus ‘Tonight; section on 19 – 20 February 2011).

“First you fly to East London, and then get transport to Queenstown, and then to Lady Frere. From there, you go through the mountains, and the roads get harder and harder as you get closer to deeply rural Transkei. Then only can you reach the village,” say Professor Jeanne Zaidel-Rudolph, co-leader of a research team with a three year grant from the National Research Foundation to record, document, preserve and work with the women of the Eastern Cape’s Ngqoko Women and their unique form of overtone singing, also called throat-singing or “singing in harmonics”. The women create a low, resonant buzzing sound deep in their throats and then sing above that – with each artists harmonising with her own voice, as well as the rest of the group.

“It’s called umngqokolo singing and was only discovered in 1980 when the missionary and musicologist came across the women,” explains Zaidel-Rudolph. “It’s like the droning of a beetle and no-one knew that there was traditional Xhosa overtone singing in South Africa until that point – it’s not like Mongolian or Tibetan overtone singing at all.”

The 12 members of the Ngqoko Ensemble, will perform a set of traditional songs using umngqokolo, as well as instruments like the umrhubhe (mouth bow), uhadi (gourd bow), and usidiphu (friction drum). Readers interested in traditional African music may recall the ensemble performing at MIAGI in 2007, a series that also featured performances by Madosini, who is dubbed “The Queen of Xhosa Music”. “Madosini shares an inheritance and a tradition with the Ngqoko women,” explains Zaidel-Rudolph, “She’s a soloist, though – a beautiful bow-player, but more of an iconic character with an individual story to tell. The Ngqoko Women are more of a cultural group; they perform  together, telling shared stories.”

The Ngqoko Women sing a style or method of overtone singing that is truly unique. So much so that Zaidel-Rudolph’s co-leader on the research project, Anri Herbst, from the UCT College of Music, has been conducting spectrographic studies in an attempt to understand the wave-forms of sound that the women produce with their throats and mouths.

“We’re in the final phase of the project now, after the recording and transcribing, the writing up of data and the composing,” says Zaidel-Rudolph. “Mainly, this is about them performing their music, and the performance of the new compositions, but we are also all meeting at Groote Schuur, at the ear, nose and throat department where the women have agreed to allow research with stroboscopes to try and understand what they do with their vocal chords to make these sounds.”

The Gordon Institute of Performing and Creative Arts “Emerging Modernities” programme presents the Ngqoko Ensemble on Saturday 19 February at the Hiddingh Hall Campus with an evening of traditional umngqokolo overtone songs, as well as compositions by Jeanne Zaidel-Rudolph, Christo Jankowitz and Kerryn Tracey, with Alexander Fokkens as conductor. Details on  021-4807156; full “Emerging Modernities” programme at GIPCA.UCT.ac.za. Also see Overtone.cc.

This column originally appeared in the Cape Argus ‘Tonight; section on 19 – 20 February 2011. Find out more on Tonight.co.za.


DAVE DARGIE : Umngqokolo: Xhosa overtone singing and the song nondel’ekhaya

African Music; Ethnomusicology

  1. Home /
  2. Archives /
  3. Vol 7 No 1 (1991): African Music: Journal of the International Library of African Music /
  4. Articles

Umngqokolo: Xhosa overtone singing and the song nondel’ekhaya

  • David Dargie University of Fort Hare, Alice


This type of gruff singing ‘vocal percussion’ is also used by young men in the Lumko district, but there is another kind of umngqokolo — that used by women and girls — which is a form of overtone singing. At the time of writing (1985), Lumko Missiological Institute was situated at Lumko Mission, 12 kilometres south of Lady Frere, which is a small town some 48 kilometres east of the Cape Province town of Queensland. The name “Lumko”, which means ‘wisdom’, is in fact the name of the family which once owned Lumko as part of their farm.

How to Cite
Dargie, D. “Umngqokolo: Xhosa Overtone Singing and the Song Nondel’ekhaya”. African Music: Journal of the International Library of African Music, Vol. 7, no. 1, July 2017, pp. 33-47, doi:https://doi.org/10.21504/amj.v7i1.1928.



DAVE DARGIE : Umngqokolo: Xhosa Overtone Singing and the Song Nondel’ekhaya

This site uses cookies to provide you with a better experience. For information on our cookie policy, please visit this page. By continuing to use the site or closing this banner, you are agreeing to our terms of use.
Have library access? Login Through Your Library

If You Use a Screen Reader

This content is available through Read Online (Free) program, which relies on page scans. Since scans are not currently available to screen readers, please contact JSTOR User Support for access. We’ll provide a PDF copy for your screen reader.

Journal Article

Umngqokolo: Xhosa Overtone Singing and the Song Nondel’ekhaya

David Dargie
African Music
Vol. 7, No. 1 (1991), pp. 33-47
Page Count: 15
Since scans are not currently available to screen readers, please contact JSTOR User Support for access. We’ll provide a PDF copy for your screen reader.

Viewing page 33 of pages 33-47

Throat singing in South Africa july 2013

Throat singing in South Africa july 2013

Ajoutée le 2 juil. 2014

Throat singing in South Africa july 2013 in the Univercity at Fort Hare Jackie Janssens alias Jackie J Jassnes from Belgium teaching the locals. Throatsinging in South Africa is done by women. This is unique in the world. They use polyritmes. This is the only existing group (known) of women who still do “Umnokolo”. Umnokolo means rough sound, and is the style in wich they are singing. Proffessor Dargie made interesting resaerch. This litle film was made in the University Fort Hare in South Afrika at the symposium in july 2013. The teacher Jackie Janssens from Belgium More Info: Info@arttout.be

Le quattro voci del canto a tenore [Enciclopedia del canto a tenore]

Le quattro voci del canto a tenore [Enciclopedia del canto a tenore]

Published on Oct 16, 2012

8:47 Preteddu Nanu Poesie Sarde Archivio: http://www.luigiladu.it/poesias/elenc…

Le Canto a tenore, chant pastoral sarde

Le Canto a tenore, chant pastoral sarde

Published on Sep 29, 2009

UNESCO: Liste représentative du patrimoine culturel immatériel de l’humanité – 2008 URL: http://www.unesco.org/culture/ich/RL/… Description: Le Canto a tenore est issu de la culture pastorale de Sardaigne. Il sagit dune forme de chant polyphonique à plusieurs voix – bassu, contra, boche et mesu boche – exécuté par un groupe de quatre hommes. Lune de ses particularités est le timbre grave et guttural des voix de bassu et de contra. Les chanteurs forment un cercle et le soliste entonne la mélodie, prose ou poème, tandis que les autres voix laccompagnent en chœur. La plupart des praticiens vivent dans les régions de Barbagia et du centre de lîle. Cet art vocal fait partie intégrante de la vie quotidienne des populations locales. Il est souvent pratiqué de façon spontanée dans les bars locaux, les su zilleri, mais aussi lors de certaines occasions plus officielles comme les mariages, la tonte des moutons, les fêtes religieuses ou le carnaval de Barbaricino. Le Canto a tenore embrasse un vaste répertoire qui varie dune région à lautre. Les mélodies les plus courantes sont la sérénade boche e notte (« la voix de la nuit ») et des chants de danse comme les mutos, gosos et ballos. Les textes sont des poèmes anciens ou de la poésie contemporaine sur des questions dactualité comme lémigration, le chômage ou la politique. En ce sens, ces chants peuvent être considérés comme des expressions culturelles à la fois traditionnelles et contemporaines. Le Canto a tenore est particulièrement vulnérable aux bouleversements socio-économiques tels que le déclin de la culture pastorale et le développement du tourisme en Sardaigne. Il est de plus en plus interprété sur scène pour un public de touristes, ce qui tend à réduire la diversité du répertoire et à altérer le caractère intime de cette musique. Pays: Italie

Giuliano d’Angiolini: La quintina en une voix seule. Dissection d’une illusion acoustique.

La quintina en une voix seule.
Dissection d’une illusion acoustique.

Giuliano d’Angiolini

Explications théoriques

Vérifications expérimentales

Détails de l’articulation

Y’a-t-il d’autres “quintine” ?



[télécharger l’article au format PDF]

La quintina en une voix seule.
Dissection d’une illusion acoustique.

Giuliano d’Angiolini

Explications théoriques.

En 2009 j’ai publié un essai qui analysait un chant paraliturgique de tradition orale : le Jesu de Castelsardo, en Sardaigne[1]. Cette publication proposait une nouvelle approche théorique d’un phénomène acoustique très singulier propre aussi bien à ce chant, qu’à d’autres polyphonies de cette région de l’île : celui de la quintina. La musique de ce genre d’ensemble vocal – nommé cuncordu – se caractérise par l’enchaînement de blocs d’accords réalisés par quatre voix, appelées (du grave vers l’aigu) : bassu, contra, bogifalzittu.

La quintina consiste en l’apparition, au sein du chœur, d’une cinquième voix aiguë qui se situe à l’octave supérieure de la voix principale, celle à laquelle est confié le « cantus firmus ».

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 1. La quintina au sein de l’ensemble vocal [2].

Cette « cinquième voix » peut être qualifiée de « virtuelle » : aucun interprète ne la chante directement et pourtant elle se présente distinctement à l’oreille, comme étant la résultante d’un phénomène complexe à la fois acoustique et psychoacoustique. Dans mon écrit, j’indiquais trois conditions essentielles à sa production. Je les résume ici, par ordre d’importance :

  1. La quintina est engendrée principalement par un seul chanteur, celui de la partie principale (la bogi) et sonne constamment à l’octave de la note chantée par lui. Ce dernier doit pouvoir renforcer certains formants de son spectre de manière à simuler une voix aiguë. L’analyse a montré qu’il s’agit du renforcement notable de deux formants qui font ressortir les harmoniques 4 et 6, soit les harmoniques 2 et 3 de la voix virtuelle, à l’octave[3].
  2. L’harmonique 4 du contra doit pouvoir masquer, autant que possible, l’harmonique 3 de la bogi. Cette action de masquage est importante : elle permet la séparation auditive de deux spectres, le réel et le virtuel. Si l’harmonique 3 de la bogi était davantage audible, il pourrait déranger la perception de la quintina en servant de trait d’union entre son spectre et celui de la bogi elle-même ; l’oreille pouvant alors l’assimiler à ce dernier auquel physiquement il appartient[4].
  3. Les autres membres du quatuor doivent occuper avec discrétion la bande de fréquences qui est essentielle à la perception de la quintina, en y développant une zone d’anti-résonance. La basse doit chanter avec un timbre moins prononcé et une dynamique faible : étant donné sa position dans le registre, si elle venait à adopter un placement de la voix similaire à celui des autres chanteurs, elle couvrirait la région que ces derniers laissent à la prédominance des formants de la quintina.
  4. Il faut ajouter à tout cela, qu’un effet de masquage, entendu au sens large, et utile à la dissociation du spectre de la quintina de celui de la bogi, provient, tout simplement, de la haute densité sonore de ce genre d’ensemble choral. De même que la partie cognitive de la vision est fortement orientée à reconnaître, dès que possible, tout ce qui ressemble à une paire d’yeux ou à la forme d’un visage, de même pourrait-on avancer l’hypothèse selon laquelle l’audition est particulièrement prédisposée à l’identification du timbre de la voix humaine. La quintina se découpe sur un environnement sonore très riche et composite, comme le ferait une voix au milieu de la foule. En cette dernière circonstance, son spectre est voilé par d’autres entités sonores, par le bruit, et est gravement corrompu. Et pourtant nous arrivons à le distinguer du reste, en nous satisfaisant de quelques traits essentiels. Cette capacité cognitive peut favoriser l’émergence du phénomène que nous étudions : la perception « imagine » l’intégralité non audible d’un spectre limité en fréquence, « en sachant » qu’il est dans une condition de grande densité des événements, dans une situation d’encombrement, « d’affluence ». L’impact dynamique de nombreux partiels aigus du contra et du falzittu reproduit ce genre d’environnement sonore.

Pour une exposition détaillée de la problématique, de l’analyse et de l’argumentation sur ce sujet, je renvoie le lecteur à mon livre. Il me faut toutefois souligner que la « cinquième voix » apparaît et se détache avec clarté, seulement lorsque se rencontrent les circonstances énoncées plus haut. Ce que j’avance ici peut être vérifié à l’analyse du sonogramme de l’enregistrement qui nous a servi de référence[5]. Dans d’autres exécutions du Jesu, ces conditions ne sont pas réunies : aucune quintina ne sortira alors[6].

Page suivante


[1] Giuliano d’Angiolini, Jesu, un chant de confrérie en Sardaigne, Éditions Delatour France, Sampzon, 2009.

[2] Il s’agit d’un extrait du Jesu chanté à Castelsardo. Ce passage est tiré du CD réalisé par Bernard Lortat-Jacob : Sardaigne. Polyphonies de la Semaine Sainte, Collection du Centre National de la Recherche Scientifique et du Musée de l’Homme, Le Chant du Monde, LDX 274 936.

[3] Pour plus de simplicité dans le calcul, on considère la fondamentale comme « harmonique 1 » et on appelle le premier harmonique, proprement dit, « harmonique 2 », etc. Ainsi, les relations entre les numéros d’ordre des harmoniques correspondent aux rapports mathématiques entre leurs fréquences.

[4] L’harmonie, dans cette musique, est constituée par une succession d’accords majeurs qui sont, le plus souvent, en position fondamentale (par ex. : la1 / mi2 / la2 / do#3). Le contra et la bogi sont en rapport de quarte juste, l’harmonique 4 de l’un et l’harmonique 3 de l’autre coïncident. L’accord peut se présenter, dans une moindre mesure, au retournement de quarte et sixte ; le  contra et la bogi sont alors en rapport de tierce majeure : dans ce cas, un écart de demi-ton sépare l’harmonique 3 de la bogi de l’harmonique 4 du contra. Cependant celui-ci s’impose par sa forte dynamique et par un vibrato très ample (un demi-ton) en recouvrant partiellement celui de la bogi. De plus, dans cette disposition de l’accord, l’harmonique 3 de la bogi coïncide également avec l’harmonique 5 du bassu, qui peut contribuer à estomper sa présence. Il faut toutefois que l’harmonique 3 de la bogi soit, au départ, de moindre intensité.

[5] Cf. G. d’Angiolini, op. cit., pag. 65 – 71.

[6] Voir, par exemple, la version du Jesu enregistré par Renato Morelli et Pietro Sassu en 1985, faisant partie du coffret : Canti liturgici di tradizione orale, 4 disques vinyle, P. Arcangeli, R. Leydi, R. Morelli, P. Sassu, Albatros, Alb 21, 1987 (disque 3, plage 4).

Page suivante

Vérifications expérimentales.

D’un point de vue physique, il n’y a aucune « fusion » entre les voix ; en ce qui concerne les rapports entre la voix principale et les autres membres du chœur, on pourrait parler, au contraire, de processus « soustractifs ». Il nous faut  cependant préciser l’affirmation énoncée au point 1 : bien que ce soit la voix principale qui « génère » la quintina, en renforçant certains de ces formants, elle a besoin du concours des autres qui, par une action de masquage sur son spectre à elle (point 2) et par le filtrage d’une aire de leur propre spectre (point 3), permettent au phénomène de se manifester. Si la bogi chante seule on n’entend pas de quintina.
Après avoir réalisé l’étude sur le Jesu de Castelsardo, je me suis dit que, si – comme je l’affirme – la typologie spectrale de la bogi appartient à un style vocal qui est diffus en Sardaigne, on devrait pourtant pouvoir repérer à l’oreille une ébauche de quintina même dans un chant soliste.

Quelque temps après, par pur hasard, j’en ai fait l’expérience. En écoutant un enregistrement de canto a chitarra (un genre de chant monodique accompagné par la guitare) mon oreille – qui, il est vrai, est devenue très sensible en la matière – a reconnu, à certains endroits, le simulacre de la quintina. J’en donne ici en exemple un court échantillon[7]. Le sonogramme montre un rehaussement considérable des harmoniques 4 et 6, confirmant l’impression auditive.

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 2. Chant soliste accompagné par la guitare.

Figure 1. Sonogramme de l’exemple 2. [agrandir]

Les chiffres à côté des tracés indiquent les numéros d’ordre des harmoniques de la voix. Les tracés apparaissant par petits traits et qui ne sont pas soumises au vibrato (par exemple celle qui se situe entre les harmoniques 2 et 3 de la voix) appartiennent au son de la guitare.

J’ai alors eu l’idée de réaliser artificiellement la condition décrite au point 2 – soit l’action de masquage effectué par le contra – par l’effacement de l’harmonique 3. Bien qu’il s’agisse ici de la voix d’un chanteur soliste, une « quintina » apparaît alors nettement  :

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 3. La quintina dans une seule voix, après effacement de l’harmonique 3.

En examinant le sonogramme, nous pouvons constater que si les harmoniques 4 et 6 sont puissamment renforcés, alors que les 5 et le 7 ont une dynamique bien plus faible[8], deux autres composantes se détachent par leur énergie : ce sont les harmoniques 2 et 3. En éliminant l’harmonique 3 (et en sachant que l’harmonique 5 est de moindre intensité) nous retrouvons un spectre à part entière qui se détache par rapport au spectre principal dans lequel il est inscrit. Son évidence pour la perception ne connaît plus d’obstacle. Ce spectre comporte deux formants qui coïncident avec les deuxième et troisième harmoniques d’une voix à l’octave aiguë de la hauteur réellement chantée[9].

L’éclatante saillie de ces partiels – une fois retiré l’harmonique 3 – est trompeuse pour la perception. Cette dernière, ne pouvant plus les intégrer vraiment aux autres partiels de la voix réelle et les rattacher à son corps sonore, est portée à les considérer comme ceux d’une voix séparée.

Pour une meilleure compréhension de ce que je viens d’énoncer, je propose une autre expérience : j’ai retiré ici – en plus de l’harmonique 3 – la fondamentale de la voix physique originaire, aussi bien qu’une bonne partie du son de la guitare. Il ne reste plus qu’une voix aiguë.

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 4. La quintina seule.

Cette situation est exceptionnelle : dans un spectre harmonique, en ligne générale, la suppression d’un seul partiel (ici le troisième) modifie peu la couleur du timbre. Quant à la fondamentale d’un son harmonique « ordinaire », sa suppression n’est tout simplement pas perceptible : le système auditif reconstruit la fondamentale sur la base des différences de fréquence entre les composantes de Fourier (phénomène du « son résiduel »)[10]. Si ici ces modifications conduisent, au contraire, à un changement radical de la physionomie du son, au point de faire apparaître une voix nouvelle, c’est parce qu’au départ le spectre est fortement déséquilibré dans la distribution de l’énergie : les éléments qui se trouvent rehaussés forment un tout indépendant orienté de manière à esquisser les traits d’une entité sonore autonome[11].

Voici une illusion perceptive, dans le domaine de la vision, illustrant bien la nature de l’image auditive de la quintina : celle-ci (identifiée par l’oreille en tant que source sonore indépendante) est inscrite à l’intérieur d’une autre image qui est celle produite par le spectre de la bogi.

Figure 2. Une vision de la quintina.[agrandir]

On comprend mieux maintenant l’importance de l’action de masquage de l’harmonique 3 de la bogi de la part de l’harmonique 4 du contra. Dans le contexte polyphonique, ce partiel n’est pas totalement effacé, comme nous venons de le faire artificiellement. Cela pourrait constituer la cause principale d’une certaine permanence – parfois très ténue – de la voix réelle de la bogi pour l’ouïe (sa seule fondamentale et ses partiels d’ordre supérieur ne suffiraient pas).

Si les deux formants de la quintina, correspondant à ses harmoniques 2 et 3, sont essentiels à sa perception et coïncident bel et bien avec ceux d’une voix masculine chantant une voyelle ouverte à cette hauteur, la présence de sa fondamentale (harmonique 2 de la bogi) peut contribuer – au moins dans un cas analogue à celui de cette voix soliste – à la définition de son spectre.

On pourrait supposer que  certains harmoniques supérieurs – communs à la voix réelle aussi bien qu’à la voix virtuelle – peuvent le compléter partiellement, puisque, en se situant en rapport d’octave avec la voix réelle, la quintina partage avec cette dernière un maximum de composants communs. Mais la quintina apparaît comme une voix asexuée, à la nature « angélique » ; son timbre, contrairement à celui de l’ensemble choral, est singulièrement limpide. Sa pureté dérive justement de sa limitation dans l’ambitus fréquentiel et également de la position basse de ses formants.

Aussi bien ici que dans le cuncordu, le vibrato en fréquence joue un rôle important dans la création de l’illusion acoustique. Plus le vibrato est marqué et différencié, plus facilement l’oreille assimilera les composantes qu’il module en fréquence à la source sonore à laquelle ils appartiennent. Par son action de balayage en un mouvement uniforme, le vibrato dessine avec davantage de précision l’enveloppe spectrale et ce faisant clarifie pour la perception acoustique la structure de résonance de la source en nous aidant à la séparer du milieu sonore où elle se trouve[12]. De ce fait, l’harmonique 4 du contra – modulé par un vibrato spécifique et fortement accentué – ne pourra en aucun cas être assimilé par l’oreille au spectre de la bogi. Pour les mêmes raisons, le vibrato (de la bogi cette fois-ci) a une fonction importante dans la définition de la quintina : il accroît l’impression qu’elle est une voix véritable.

Dans la version du Jesu qui a été le point de départ de notre précédente publication (voir note 2), le contra emploie un vibrato très ample : sa voix peut couvrir l’harmonique 3 de la bogi d’autant plus efficacement qu’il s’impose non seulement en dynamique, mais également en occupant un plus grand espace fréquentiel.

Il est à remarquer qu’un timbre vocal identique à celui que nous étudions à présent et dans lequel on peut apercevoir – là aussi – un simulacre de quintina, se manifeste dans certains passages du soliste lors du Miserere quaresimale enregistré par B. Lortat-Jacob (cf. CD cité à la note 16, plage 4, par exemple entre 5’19 et 5’27”).


Page précédentePage suivante


[7] Il s’agit d’une compétition de chant enregistrée (en plein air) en 1963. Ce document est tiré d’un CD annexe au livre : Paolo Angeli, Canto in Re, Isre Archivio Mario Cervo, Nuoro 2005, plage 9.

[8] Ca. – 10 db par rapport à l’harmonique 6, ca. – 15db par rapport à l’harmonique 4.

[9] On s’accorde à estimer que, pour la reconnaissance du timbre vocal, les premiers deux ou trois formants suffisent et globalement la voix n’en compte pas plus de cinq (d’amplitude et de largeur de bande spécifiques).

[10] C’est grâce à ce comportement du système auditif que la bande passante audio d’une communication téléphonique peut être réduite dans les fréquences graves sans que soient annulées – pour l’ouïe – les fondamentales de la voix.

[11] Voir le sonogramme de l’ex. 6 pour le cas inverse : celui d’un son harmonique où la répartition de l’énergie le long de l’axe fréquentiel est bien plus homogène.

[12] Cf. Xavier Rodet, Yves Potard, Jean-Baptiste Barrière CHANT – de la synthèse de la voix chantée à la synthèse en général Rapport Ircam N° 35, 1985 et Stephen McAdams, L’image auditive, une métaphore pour la recherche musicale psychologique sur l’organisation auditive, Rapport Ircam n.° 37, 1985. Dans ce dernier écrit, on peut lire : « Lorsque les fréquences modulent, leurs amplitudes changent de telle manière que chaque partiel trace une petite portion de l’enveloppe spectrale, c’est-à-dire de la courbe fréquence-amplitude décrivant la forme spectrale globale. […] Une fonction importante de la modulation de fréquence est donc de réduire l’ambiguïté de la nature de la structure de résonance, définissant la source ».

Page précédentePage suivante

Détails de l’articulation.

1. Écarts vocaliques.

Je propose maintenant un autre extrait de notre document phonographique, pour voir ce qui se passe lors de l’émission des différentes voyelles. Examinons, par exemple, le passage qui va du début de l’échantillon à 6,5″: bien que la note chantée soit constamment la même (un la à 220 Hz), les formants de la quintina – absents au début – sont renforcés seulement par la suite (à partir de 3,5″) en correspondance avec la voyelle [a] et l’effet se produit uniquement à partir de ce moment[13].

Votre navigateur ne supporte pas ce format de vidéo.
Clip vidéo 1 / Exemple sonore 5. Écarts vocaliques.

Figure 3. Sonogramme de l’exemple 5. [agrandir]

Les chiffres désignent les numéros d’ordre des harmoniques qui prédominent. Le plus souvent, on voit ressortir le couple d’harmoniques 4 et 6, ceux de la quintina. Ce sonogramme illustre le contenu spectral de la séquence avant l’élimination de l’harmonique 3 effectuée par nous. N.b. : dans tous les sonogrammes présentés ici, l’échelle disposée sur l’axe des abscisses indique le temps mesuré en secondes, l’échelle sur l’axe des ordonnées indique les fréquences mesurées en Hz.

Le long de toute cette séquence, la présence ou l’absence de la quintina sont déterminées par le changement de voyelle (comme on le sait, à chaque voyelle correspond une configuration distincte de l’enveloppe spectrale). Elle affleure à partir de différentes hauteurs du son (voir infra) mais toujours en concomitance avec la voyelle [a]. Il est à remarquer, cependant, que pendant un  court instant, au tout début (entre 0,5″ et 1″), le chanteur attaque bel et bien la hauteur et la voyelle qui partout ailleurs favorisent son déploiement. Mais ici la pose de la voix choisie par lui est un peu différente ; l’harmonique 7 est accentué aux dépens de l’harmonique 6 et l’effet ne se produit pas.

Par ailleurs, ces observations nous conduisent à exclure l’hypothèse que certaines résonances soient amplifiées par l’environnement où a eu lieu l’enregistrement, ou par des microphones impliquant une réponse particulière  en fréquence. Si c’était le cas, de telles résonances apparaîtraient partout et non pas seulement quand le chanteur adopte une posture vocale spécifique.

Une quintina réussira surtout en coïncidence avec une voyelle ouverte. Pour revenir au contexte du chœur – et plus précisément à celui de l’enregistrement du Jesu cité à la note 2 – on remarquera que s’il est vrai que la quintina peut surgir en correspondance avec d’autres voyelles, la bogi, pour mieux réussir l’effet, chante un [a] au moment même où le texte prévoit un [e], prononcé d’ailleurs par les autres interprètes[14]. À Castelsardo, le chanteur du cuncordu – à la différence de notre soliste – cherche intentionnellement à faire ressortir une quintina dès que possible : pour ce faire, il adoptera une série d’ajustements de l’émission pour adapter la position des formants qui l’engendrent et il aura tendance à ouvrir les voyelles.

2. Écarts fréquentiels.

La quintina se manifeste seulement sur un nombre restreint de hauteurs. Quand la fondamentale s’éloigne trop de la zone propice à son apparition les harmoniques 2 et 3 de la quintina (4 et 6 de la bogi) tombent en dehors des formants ; de ce fait, ces derniers ne coïncident plus avec les éléments essentiels d’un spectre cohérent perçu en tant que source indépendante, c’est-à-dire avec l’image auditive d’une voix aiguë. Dans tout type de vocalité le chanteur a la possibilité de reproduire un résultat acoustique qui se développe sur certaines fréquences à d’autres fréquences voisines. Auprès des chanteurs d’opéra, cela se fait avant tout avec un ajustement de la voyelle. Ces techniques, toutefois, ont des possibilités limitées : au-delà d’un certain écart de fréquence, l’enveloppe spectrale mettra en relief d’autres groupes de partiels.

Dans l’extrait et le sonogramme qui suivent on peut voir comment, avec un changement de hauteur, les formants viennent à renforcer d’autres partiels. À partir de 19″ à peu près, la mélodie monte d’une quinte, alors que le chanteur maintient plus ou moins la même conduite vocale. Les formants qui, juste avant, accentuaient les harmoniques 4, 6 et 7 (entre 15,5″ et 19″) viennent par la suite à renforcer les harmoniques 3, 4 et 5 (entre 19″ et 21″) : le poids respectif des composants du spectre mue, son contenu change et avec lui, le timbre.

Au cours de cet extrait, la mélodie s’éloigne du groupe de hauteurs qui favorisent la formation de notre illusion acoustique. Pour faciliter son éventuelle saillie à l’écoute, j’ai procédé, dans cet exemple également, à la suppression de l’harmonique 3. Mais on n’assistera à aucun effet de scission de la voix ici : on n’entend qu’une voix « ordinaire ».

Votre navigateur ne supporte pas ce format de vidéo.
Clip vidéo 2 / Exemple sonore 6. Absence de quintina.

Figure 4. Sonogramme de l’exemple 6. [agrandir]

Les harmoniques plus saillants sont indiqués par leurs numéros d’ordre.
Ce sonogramme illustre le contenu spectral de la séquence avant l’élimination de l’harmonique 3 effectuée par nous.

Entre 14″ et 19″, la mélodie revient à la hauteur qui à d’autres moments (cf. exemple 3) crée la sensation de la quintina. Mais, à cet endroit, la posture vocale diffère de celle qui est nécessaire pour la générer. Les harmoniques 4 et 6 sont assez présents, mais on assiste à une accentuation de l’harmonique 5, lorsque la voyelle [o] est chantée, alors qu’en correspondance de la voyelle [e] il y a une forte saillie de l’harmonique 7. Ces partiels concomitants rééquilibrent la structure interne du spectre : l’oreille n’entendra qu’un seul objet sonore dont la hauteur tonale est celle de la fondamentale réellement chantée.
Si on fait abstraction d’une autre circonstance (entre 26″ et 28″) – où, cependant, la dynamique de l’harmonique 5 est aussi très prononcée – partout ailleurs, on n’assiste jamais au renforcement simultané des harmoniques 4 et 6, ce qui explique l’absence de quintina.

L’ambitus fréquentiel utile à l’apparition de la quintina doit être approximativement semblable pour chaque chanteur dans la mesure où la longueur du conduit vocal et la morphologie de l’appareil phonatoire sont similaires (bien que non identiques) d’un homme à l’autre. Dans le cas de notre chant soliste, le centre de cet ambitus restreint implique, en tant que fondamentale, un la autour de 220 Hz ; il inclut également le si un ton au-dessus, aussi bien que le sol un ton au-dessous. Dans le Jesu de Castelsardo[15],  il est à peine plus étendu : un ton et demi au-dessus et au-dessous d’une fréquence centrale qui est la même (un la à peu près). Dans une autre version du Jesu – réalisée par d’autres interprètes – la quintina est présente dans le même ambitus et surtout entre le la et le si naturel de la mélodie principale chantée par la bogi[16]. Elle est absente quand, au début, les chanteurs attaquent trop haut et la mélodie monte alors vers le do et le aigus[17].

Un ambitus presque identique se retrouve, toujours à Castelsardo, dans le Miserere quaresimale (dietro l’altare), dont voici un extrait[18] dans lequel les hauteurs fondamentales de la bogi correspondent au la 220 Hz et au sol, un ton au-dessous :

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 7. La quintina dans le Miserere quaresimale.

À plusieurs endroits de cet enregistrement, la quintina affleure lorsque la bogi entonne des notes allant du fa# grave au sib aigu[19}. Elle disparaît quand la mélodie monte vers le do aigu[20] :

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 8. Pas de quintina quand la bogi monte vers le do aigu.

On l’entend aussi dans Li tre Re (qui est chanté par un nombre important d’interprètes) toujours à l’intérieur du même groupe de hauteurs[21]. Il n’y a pas de quintina dans le Miserere du Lunissanti : le falzittu (la voix la plus aiguë) adopte un comportement différent, il prédomine sur l’ensemble et finit par rompre l’équilibre spectral[22].

Dans les chants de tradition orale, on ne fait pas usage du diapason pour établir la tonalité d’exécution. Une mémoire aussi bien collective qu’individuelle (non seulement de type musical mais aussi proprioceptif, liée au ressenti de la tension musculaire des organes de phonation) garantit une remarquable constance du diapason. Mais des écarts par rapport à une tonalité idéale peuvent se produire : il suffit d’un état de fatigue pour que la tonalité soit un peu plus basse, ou d’une certaine euphorie pour qu’elle soit – au contraire – plus haute. Une des raisons pouvant expliquer la moindre réussite d’une quintina, lors d’une performance donnée, est le choix du diapason de la part des interprètes (voir le cas cité plus haut et la note 17).


Page précédentePage suivante


[13] J’ai procédé, ici aussi, à l’effacement systématique de l’harmonique 3, de manière à pouvoir rendre plus évident, à l’écoute, l’émergence du phénomène.

[14] Voir, entre autres, dans cet enregistrement du Jesu (cf. note 2), les segments entre 2’30” et 2’57” ou entre 3’14” et 3’22”. Les voyelles reportées sont indicatives. J’ai renoncé à employer l’alphabet phonétique, puisque, lors du chant, elles ne coïncident pas forcément à celles de la langue parlée.

[15] Cf. l’enregistrement cité à la note 2, voir aussi l’exemple 1.

[16] Il est tiré du CD du livre de Bernard Lortat-Jacob, Chants de Passion – Au cœur d’une confrérie de Sardaigne, Les éditions du Cerf, Paris, 1998. Plage 6. Enregistrement effectué par G. Brozzu. Voir, par exemple, entre 0’57” et 1’08”.

[17] CD cité à la note 16, plage 6, entre 1’14” et 1’17”.

[18] CD cité à la note 16. Plage 4, voir, entre 1’16” et 1’26”. Enregistrement effectué par G. Brozzu.

[19] Même enregistrement qu’à la note 18, voir, par exemple, entre 2’11” et 2’25” et entre 3’09” et 3’13”.

[20] Même enregistrement qu’à la note 18,  entre 3’14” et 3’18”.

[21] Cf. CD cité à la note 16, plage 10. Enregistrement effectué par G. Brozzu.

[22] Cf. CD cité à la note 16, plage 1.

Page précédentePage suivante

Y’a-t-il d’autres “quintine” ?

Les fortes résonances mises en jeu par la posture vocale qui est celle du chant sarde peuvent rehausser d’autres harmoniques ; soit – en ce qui concerne la voix principale (bogi) – à partir de fondamentales situées en d’autres régions fréquentielles, soit auprès des autres chanteurs. Il peut s’agir d’harmoniques isolés[23], ou bien d’ensembles d’harmoniques appartenant à des couches plus aiguës, qui n’arrivent pas à définir les traits d’un spectre à part entière.

Cependant un effet qui se rapproche de la quintina peut survenir dans d’autres circonstances. Dans l’extrait qui suit, tiré d’un Miserere du village de Orosei, les quatre interprètes exécutent un accord majeur en position fondamentale (cf. note 4). À certains moments on a l’impression que la quinte de l’accord est comme doublée à l’octave (avec la voyelle [a] de magnam, à partir de 2″)[24] :

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 9. Redoublement à l’octave de la voix du contra.

C’est au contra qu’est confiée la quinte de l’accord ; mais c’est pourtant la bogi qui cause son « redoublement »  : elle renforce ses harmoniques 3 et 6, qui sont à l’octave de la note chantée par le contra. Ces deux harmoniques sont tous les deux essentiels à la survenue de l’effet : l’élimination de l’un ou de l’autre le fait disparaître. Ce phénomène n’a pas la clarté et l’impact d’une quintina, puisque son contenu spectral est moins caractérisé, mais il s’y apparente.

Des éléments de la morphologie spectrale qui dans d’autres conditions seraient perçus en tant que simple couleur sonore ont tendance, dans un chœur sarde, à la scission (voir point 4) ; la perception sera davantage portée à le considérer en tant qu’identités indépendantes. En écoutant un concordu, on a ponctuellement le sentiment que les chanteurs sont plus de quatre.

Figure 5. Sonogramme de l’exemple 9. [agrandir]

Le tracé correspondant à l’harmonique 6 de la bogi (qui coïncide avec l’harmonique 8 du contra) a le même contour que son harmonique 5, ce qui montre qu’il appartient bel et bien à cette voix. L’harmonique 4 du contra coïncide avec l’harmonique 3 de la bogi, mais c’est ce dernier qui prévaut. Cela est confirmé par l’analyse du mode d’émission de la bogi lorsqu’elle chante seule (voir sonogramme suivant).

Dans le sonogramme qui suit, on peut voir cette disposition du spectre de la bogi lorsqu’elle entonne, seule – en introduisant les autres voix – un  gosos qui donne, dans le moment polyphonique, la sensation du « redoublement » de la quinte que nous venons de décrire[25] :

Figure 6. La bogi seule ; renfort des harmoniques 3 et 6. [agrandir]

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 10. Extrait correspondant au sonogramme précédent. À suivre un passage polyphonique du  même chant.

Bien qu’épisodiques, ces événements sont plus fréquents qu’on ne pourrait le penser : on rencontre une situation analogue – là aussi lors d’un accord majeur en position fondamentale – dans le Kyrie de Castelsardo (à partir de 2″)[26].

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 11. Redoublement à l’octave de la voix du contra.

Si la production de la quintina proprement dite fait l’objet, à Castelsardo, d’une recherche volontaire et systématique, elle peut cependant pointer ici et là dans d’autres chants similaires de la Sardaigne. Dans la mesure où les timbres vocaux sont semblables en d’autres villages et où l’harmonie y suit les mêmes types de dispositions dans ces répertoires, elle se manifestera avec plus ou moins de relief. Lors de ma rencontre avec des chanteurs du village de Bosa, qui forment un cuncordu, j’ai perçu au beau milieu d’un chant, la quintina. Le chanteur de la partie principale – connaissant le répertoire de Castelsardo, devenu célèbre en Sardaigne et ailleurs – me confirmait qu’il essayait volontairement de la faire émerger. J’ai alors suggéré d’exécuter à nouveau le même morceau en  demandant à la voix de basse (dont la dynamique dans cette tradition locale a plus ou moins la même intensité que celles des autres voix) de se produire avec beaucoup plus de discrétion : la quintina ressortait alors de manière nette. Cette expérience a d’ailleurs confirmé pour moi ce que j’avais observé dans l’étude du Jesu de Castelsardo et déterminé comme une des conditions pour la pleine réussite de l’effet (voir point 3).


Page précédentePage suivante


[23] Voir, par exemple, l’ex. 6, où, à partir d’un mi 165 Hz, on perçoit l’harmonique 5 qui se détache de l’amalgame sonore (entre 9″ et 14″ à peu près).

[24] CD Voches de Sardinna – Cuncordu de Orosei – Miserere –, Winter & Winter, 910022-2, Basic Edition, Munchen, 1998. Plage 3, voir, par exemple, entre 13,5″ et 17″.

[25] Cf. CD cité à la note 24. Plage 12 ; voir, par exemple, entre 22″ et 28″.

[26] Cf. CD cité à la note 16, plage 8, entre 42″ et 47″.

Page précédentePage suivante


Pour conclure, je voudrais souligner un aspect mineur de cette vocalité, bien que comportant un certain impact, qui – à ma connaissance – n’a jamais été commenté. Le mode d’émission qui caractérise la musique sarde – génériquement parlant, au-delà des différences individuelles – vise à obtenir un son d’une extraordinaire richesse spectrale, qui dans le quatuor vocal des tenores rejoint presque la saturation[27]. Elle donne lieu, entre autres, au renforcement des partiels qui se situent entre 2500 Hz et 4000 Hz. Je ne pense pas que ce phénomène soit maîtrisé par les chanteurs, il semble s’agir d’une conséquence accessoire. Lorsque les quatre voix se réunissent pour former le cuncordu, puisque chacune d’elles a une fondamentale différente, elles parviennent à rehausser divers harmoniques aigus dans une bande restreinte. Cela donne lieu à une véritable tempête de sifflements stridents. Ces clusters dissonants de partiels aigus, très perçants, provoquent presque un désagrément physique à l’audition et plus encore dans les conditions d’écoute naturelles que dans celles de l’enregistrement.

Pour une oreille non entraînée à l’écoute analytique il n’est pas aisé de les séparer du corps du son. Voici un autre passage du Jesu (voir l’enregistrement cité à la note 2) – qui inclut une quintina – et puis un exemple qui isole la bande de fréquences supérieures à 2500 Hz. En réécoutant le passage original, il sera maintenant plus facile de distinguer ces partiels à l’intérieur de l’ensemble sonore.

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 12. Le son du cuncordu.

Figure 7. Sonogramme de l’exemple 12. [agrandir]

La zone qui comporte les « sifflements » aigus, celle qui est remplie de traces très marquées entre 2500 Hz et 3000 Hz, est bien visible au-dessus d’une bande davantage dégagée. Cette dernière se superpose à son tour à une large bande basse, saturée de traces qui correspondent à des partiels de grande intensité : c’est ici – dans cette bande inférieure, situé entre 500 Hz et 1500 Hz – que se manifestent tous les phénomènes essentiels pour l’identification du timbre vocal (qui comprennent également l’émergence de la quintina).

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 13. Extraction des fréquences supérieures à 2 KHz, avec des forts pics autour de 2,5 – 3 Khz.

Voici un autre bref passage tiré cette fois-ci du Stabba (Stabat Mater) de Castelsardo[28]. À suivre un filtrage passe-haut, coupé à hauteur de 3000 Hz, qui laisse apparaître un groupe de partiels très saillants entre 3000 Hz et 4000 Hz et qui s’étend jusqu’au-delà de 6000 Hz :

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 14. Extrait du Stabba de Castelsardo.

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 15. Extraction de la bande de fréquences supérieures à 3 Khz.

Une configuration similaire se reproduit dans le canto a tenore :

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 16. Tenores.

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 17. Extraction de la bande de fréquences au-dessus de 2,2 Khz.

Dans d’autres vocalités, on retrouve ce phénomène dès que le spectre de la voix est davantage enrichi. Il est très évident dans les chants paraliturgiques de Montedoro, en Sicile, qui partagent avec ceux de la Sardaigne un répertoire et une esthétique similaires[29]. On peut le retrouver, bien que partiellement, dans la sonorité du bourdon qui caractérise la polyphonie du village de Ceriana, en Ligurie. Plusieurs chanteurs réalisent ce bourdon : un ensemble de partiels se détache à l’intérieur d’une couche comprise entre 3000 Hz et 4000 Hz.


Voici un résumé de l’enregistrement original du canto a chitarra, qui nous a servi pour cet article, sans aucun traitement de notre part.

Votre navigateur ne supporte pas ce format audio.
Exemple sonore 18. Résumé du Canto a chitarra.

Page précédente


[27] J’emploie, selon une convention d’usage courante, les termes de cuncordu et de tenores pour distinguer deux formations de la polyvocalité sarde qui se différencient par les types d’émission, de structure et de forme musicale et par leurs répertoires. Celui des tenores est presque exclusivement profane, alors que celui du cuncordu est constitué avant tout de chants sacrés. Cependant, dans d’autres lieux de la Sardaigne – comme à Scano Montiferro ou à Aidomaggiore – la basse peut adopter dans la musique religieuse ce placement de la voix qui est le sien dans le chant des tenores.

[28] Les voix entrent l’une après l’autre. CD cité à la note 16. Plage 5.

[29] Cf. le CD La settimana santa a Montedoro, par Ignazio Macchiarella, Nota, Geos cd 225, 1996.

Page précédente