Alexander V. Kharuto

Tuva Throat Singing: Acoustical Analysis and Model of Sound Production

Moscow P.I.Thaikovsky Conservatory

Bolshaya Nikitskaya str., 13, Moscow, Russian Federation

Tel: +7(495)2906092 (of.)



The phenomenon of Tuva throat singing (khoomei) is well-known  worldwide. During this singing, the voice of one man will be percept as two or more voices. The mechanism of sound production in this singing is not quite clear. In khoomei, one can hear at least two ‘voices’: a lower (bass) and a higher, which sounds like flute. The sonogram includes an equidistant overtone system which step is equal to the pitch of lower ‘voice’.  

According to so-named ‘overtone theory’, the melody of higher khoomei voice will be formed with help of movement of high-frequency formant, and all the overtones which ‘needs’ the performer for sounding will be produced by his Ferrein’s cords. Another theory, based on experimental materials, proves that in ‘two-voice’ sounding the false (vestibular) vocal cords form a kind of whistle, which generates independent a high sound. The mechanism of building an equidistant overtone system in this case has been not explained in the theory.

In this paper, a new explanation of khoomei-sounding will be given, which is based on signal theory and accords to facts fixed in previous investigations. Our model includes a low-frequency oscillator, which controls (manipulates with) the second one, high-frequency oscillator. The resulting spectrum contains only spectral components on frequencies, which are multiple of frequency of low-frequency oscillator. A high-frequency formant with changing position will be formed through this mechanism, also.


In khoomei investigations, there are crossing interests of humanities and natural sciences — physicists, acoustics, physiologists, physicians. One of the most intriguing questions now is the mechanism of sound production in throat singing. The singing of Tibet lamas, which is alike the Tuva’s one, has been analyzed for the first time by English acoustics Smith, Stevenson and Tomlinson in 1967. Similar investigation results have been published by A. Banin and V. Lozhkin in 1973 [1]. They described the process of khoomei ‘melody’ forming as a persistent sounding of a low-frequency component (burdon sound) and  the presence of high-frequency formant which changes its position and ‘highlights’ the spectrum overtones needed by performer. The overtones are produced by Ferrein’s cords in performer’s throat. Later, this theory has been named ‘overtone theory’.

The possibility of producing a very great number of overtones itself  on the basis of a low-frequency tone was doubted by other specialists. Comparative to academic singing, for example in Shaliapin’s voice, the number of overtones may be as high as in khoomei, but the effect of two-voicing does not exist.

For further investigations in this problem, a group of phoniatrists and vocal specialists has been formed (1975) and experimental acoustical and physiological studying of khoomei singers have been fulfilled. Photographic pictures and X-ray pictures (1976) of singing throat have been made [2]. The study showed that during ‘two-voice’ sounding vestibular cords, which are positioned before the Ferrein’s cords, build a ‘whistle’. At this moment, the singer amplifies the expiration and generates a 2-4 kHz tone, which is ‘some octaves higher then the main lower tone’ [2]. The lower tone sounds also at this time. Relying on these facts, the authors of [2] denied the ‘overtone theory’ [1].

On fig.1, the characteristic spectrum of khoomei sonogram is shown (style ‘sygyt’). Horizontal axis is time, and vertical axis is frequency. On the right part of sonogram, a graph of momentary spectrum is superimposed for the time moment t = 5 s. (The spectrum power increases from right to left.) At the time moment t = 3.75 s the performer finishes the ‘recitative’ part, which sounds like hoarse singing and begins the ‘vocalize’ part with its ‘two-voicing’. (All the spectral graphs have been formed with help of author’s program SPAX, especially developed for such investigations.)

A sonogram loke shown on fig.1 was published in [2], and the authors of [2] proved on this base the presence of ‘two independent mechanisms’ of sound production. From my author’s point of view, these ‘presence of two mechanisms’ can not be proved with, because we see on sonograms appearances of only one of it, the low-frequency component, which builds the first harmonic on the burdon frequency and a row of higher harmonics on multiple frequencies. The presence of a second ‘independent’ sound source would produce any spectrum line or a system of harmonics. If these harmonics coincide with the spectrum components of the first source — this fact must be explained.


Fig. 1. Sonogram of khoomei sound (style ‘sygyt’)


Possible interactions of two sound sources have been studied in the work of specialists from Tuva [3]. In this article, the authors assert, that the two voice oscillators will be self-synchronized in some way: ‘In a system which contain two connected sound sources in throat, which have neighboring oscillation frequencies, according to synchronization theory a stabilization effect of base tone occurs’ ([3], P.379). However we see no stringency in this conclusion.

Based on new results with the use of computer sound analysis and khoomei sound simulation, the author offers another explanation of the mechanism of sound production in khoomei. This explanation is also based on theory of signals and facts which have been fixed in previous investigations. These are: 1) presence of only one system of equidistant harmonics in khoomei sonograms, calculated in our work and also by other authors; 2) forming of a ‘whistle’ in the throat of singer for generating of a tone 2-4 kHz (this has been simulated physically in [2]).

In the new model, the author offers the following mechanism of ‘two-voice’ sound producing. The Ferrein’s cords block the expired air stream with a certain rhythm. The vestibular cords, which build the ‘whistle’, answer every air pressure pulse with an aerodynamic whistling on frequencies 2-4 kHz. As result, at the ‘output’ of vocal tract a sequence of pulses will be formed with the period of oscillations of Ferrein’s cords, and the pulses are ‘filled’ with high frequency oscillations produced by vestibular cords. The study of nature khoomei oscillations confirms this model. On fig.2, a fragment of oscillogram from ‘vocalize’ part of performance is shown. (The time scale is enlarged in comparison with fig.1.) These oscillations have the character of sinusoid, which is amplitude-modulated with pulses with the modulation coefficient near to 100%. The pulse duration (between two adjacent valleys) is equal to period of main tone (its frequency measured from the spectrum is f1 = 185 Hz — see the lower line on sonogram on fig.1).



Fig. 2. Oscillogram of khomei sound during the ‘vocalize’ part (see. fig.1, time moment t = 4,5 s)


In signal theory, the spectrum of such oscillations will be build as following. A sequence of pulses, modulates on amplitude oscillations with frequency .  Each of  pulses has a spectrum . Therefore, the resulting oscillation will has the spectrum



The scheme of forming such a spectrum is shown on fig.3.













Fig. 3. Spectrum of one pulse (a), spectrum of a periodical pulse sequence (b) and spectrum of sinusoidal oscillation which has been modulated with the periodical pulse sequence (c)


The resulting spectrum has a double width in comparison with that of pulse sequence, and his center position moved to the frequency . In this way appears the ‘formant’ in the area of higher frequencies. It is also known [4] that if a low-frequency oscillator with the pulse frequency  manipulates another one, which oscillations appear at the beginning of a pulse and ends when the pulse finishes, then the resulting spectrum will contain only components on frequencies , where k = 1,2,3,…  is harmonic number. Therefore, this spectrum will be build only with harmonics of low-frequency source which controls the second oscillator. In this case, the component with frequency  can be absent in spectrum: we can see such situation on fig.1 at the moment t = 4,5 s, when formant changes its position.

The result of computer simulation of a pulse sequence which is ‘filled’ with high-frequency oscillations is shown in form of sonogram on fig.4. The ‘envelope’ of resulting oscillations is alike fig.2. The pulse frequency is equal to 165 Hz; the high frequency of the ‘second oscillator’ (simulating vestibular cords) is firstly 2000 Hz, then 2150 Hz, and at the end 2000 Hz. The most powerful harmonics groups around the frequency of ‘second oscillator’ and forms a spectrum ‘formant’, which position changes and depends from the high frequency of ‘second oscillator’. Movements of this formant effects the ‘selecting’ of some spectrum overtones, but the overtones itself does not move: their frequencies are still . This simulation corresponds with real khoomei sonogram shown on fig.1.





Fig. 4. The sonogram of computer simulated pulse sequence with constant repetition
frequency (165 Hz) and changing high-frequency ‘filling’ oscillations.


On the sonogram on fig.1 one can see also some low-frequency harmonics (which are not present in the spectrum on fig.3c). Maybe, this effect can be explained through incomplete blocking of air stream by vestibular cords, which builds the ‘whistle’. In this case, a part of air pulses formed on Ferrein’s cords will pass direct to the oropharyngeal horn, and then the spectrum will contain some components from ‘usual’ voice pulses and also from high-frequency pulses formed by vestibular cords. As it has been shown above, there not any dissonance will appear, because the harmonics of both sources are multiple to lower frequency .

Consequently, our model of interaction of two oscillating systems in vocal tract during ‘vocalize’ in Tuva’s throat singing performance explains the main effects which one can hear and measure in spectrum study of this sound.



The relations between acoustic and perceived characteristics ofvowel sounds are demonstrated with respect to timbre, loudness, pitch, and expressive time patterns. The conditions for perceiving an ensemble of sine tones as one tone or several tones are reviewed. There are two aspects of timbre of voice sounds: vowel quality and voice quality. Although vowel quality depends mainly on the frequencies of the lowest two formants, voice quality depends mainly on the frequencies of the higher formants. In particular, the center frequency of the so-called singer’s formant seems perceptually relevant. Vocal loudness, generally assumed to correspond closely to the sound pressure level, depends rather on the amplitude balance between the lower and the higher spectrum partials. The perceived pitch corresponds to the fundamental frequency, or for vibrato tones, the mean of this frequency. In rapid passages, such as coloratura singing, special patterns are used. Pitch and duration differences are categorically perceived in music. This means that small variations in tuning or duration do not affect the musical interval and the note value perceived. Categorical perception is used extensively in music performance for the purpose of musical expression because without violating the score, the singer may sharpen or flatten and lengthen or shorten the tones, thereby creating musical expression.



Key Words

Formant frequencies
Voice timbre
Vowel timbre
Fundamental frequency
Overtone singing synthesis
Clé d’écoute / Bernard LORTAT-JACOB : la Quintina : polyphonie vocale de Sardaigne

La Quintina : polyphonie vocale de Sardaigne , en collaboration avec Bernard Lortat-Jacob, et la participation de Michèle Castellengo et Gilles Léothaud



Dans le gros bourg de Castelsardo, au Nord de la Sardaigne, le rituel de la semaine sainte est sous la compétence exclusive d’une confrérie, composée d’une petite centaine d’hommes : pe6cheurs, artisans, commerçants (plus quelques cadres d’ailleurs pas nombreux)

Le Lundi saint est la grande fête de Castelsardo, une fete qui se prépare durant toute l’année. Or, préparer cette fete consiste surtout à préparer les choeurs qui devront chanter en procession durant une grande partie de la nuit lors de la procession des “mystères”

Ce répertoire de la confrérie est pleinement maitrisé par les chanteurs et encore très vivant. Il est de stricte tradition orale et remonterait au moins au XVIè siècle. Il est probable qu’il s’exécute sans grand changement depuis cette époque.

A Castelsardo, chaque Lundi saint donc, de nombreux chanteurs sont “candidats” au chant et attendent d’etre choisi par leur Prieur. Celui ci compose trois choeurs , comprenant chacun toujours quatre chanteurs.

Ces douze chanteurs sont les “apotres” du Lundi saint . Ils s’adonneront à une sorte de compétition rituelle et vocale très éprouvante, durant plusieurs heures. Le premier choeur chante le Miserere (psaume 50); le deuxième, le Stabba (Stabat Mater) ; le troisième, le Jesu.

Ces chants font penser à de longues lamentations, le texte en latin semble à peine prononcé (pour les chanteurs , il est d’ailleurs relativement secondaire puisque la plupart du temps, ils n’en comprenent pas le sens). Ce sont des chants “de voyelles”, pourrait on dire, qui retiennent l’attention par leur grand beauté et leurs qualités spectrales spécifiques



la quintina 1


la quintina 2.jpg

la quintina 3la quintina 4.png


Clé d’écoute : Le Chant diphonique , en collaboration de Tran Quang Hai d’après le film Le chant des harmoniques de Hugo Zemp

Le Chant Diphonique avec Tran Quang Hai / Clé d’Ecoute du CREM-CNRS


Présentation des clés d’écoute

Les possibilités techniques offertes par le développement du multimédia ouvrent aujourd’hui de nouvelles perspectives pour ” donner à voir ” les musiques de tradition orale. Elles offrent à l’ethnomusicologie des moyens susceptibles de bouleverser en profondeur ses pratiques de communication scientifique. La possibilité d’interagir avec un objet multimédia a ouvert la voie à de nouvelles expériences perceptives permettant de guider mentalement un auditeur vers certains aspects importants de la musique écoutée. Une série de modèles musicaux interactifs, appelés ” clés d’écoute “, issus des travaux des membres du laboratoire ont été développés sur ce site web (voir liens plus bas). Ces premières réalisations significatives permettent de dégager quelques propriétés spécifiques des modes d’écriture multimédia dans le champ de l’ethnomusicologie. En développant diverses formes d’écriture multimédia, le groupe a entrepris une réflexion épistémologique sur la manière de synchroniser l’image et le son, de souligner par une représentation graphique les aspects culturellement pertinents d’une musique, ou encore d’organiser un raisonnement scientifique par le procédé de la visualisation.


Comment les styles de chant diphonique sont ils produits sur le plan physiologique ?


Les Mongols et les Touvains distinguent les différents styles de chant diphonique désignés par des termes vernaculaires.  Les travaux de Tran Quang Hai et Hugo Zemp montrent qu’il existe essentiellement deux techniques de chant diphonique, différenciées par la position de la langue dans la bouche , dite à “une cavité” ou “deux cavités”.

Leur hypothèse concernant les techniques utilisées pour chaque style est que tous les chants dont la mélodie d’harmoniques ne dépasse pas 1.000 Hz sont réalisés à une cavité, et que tout ceux dont la mélodie d’harmoniques se situe entre 1000 et 2000 Hz sont réalisés à deux cavités.


le style KARGIRAA des Touvains (ou KARKIRA des Mongols) se réalise à une cavité

le style SYGYT des Touvains se réalise à deux cavités.

La pièce touvaine proposée dans l’animation alterne ces deux styles.



Dans cette technique la langue est au repos. Les fréquences sont sélectionnée par la forme de la bouche qui constitue une seule cavité. Le controle des déformations de cette cavité est réalisé en prononçant les différentes voyelles.



Dans cette technique, la pointe de la langue touche le palais, divisant la bouche en deux cavités. Les fréquences peuvent etre sélectionnées de deux manières:

a) en déplaçant la langue de l’avant vers l’arrière et en l’ajustant  sur des positions qui correspondent à des fréquences harmoniques, du spectre émis par le larynx (harmoniques les plus aigus obtenus avec la langue à l’avant de la bouche)

b)en maintenant la pointe de la langue en position fixe contre le palais et en déformant les lèvres pour prononcer les voyelles. Le “OU” permet d’obtenir l’harmonique le plus grave, le “I” permet d’obtenir l’harmonique le plus aigu

Marc CHEMILLIER : De l’analyse acoustique à la modélisation des savoirs musicaux / Notes sur les polyphonies vocales de Sardaigne

De l’analyse acoustique à la
modélisation des savoirs musicaux

Note sur les polyphonies vocales de Sardaigne

marc chemillier


L’entretien avec Giuliano d’Angiolini réalisé pour Musimédiane à l’occasion de la sortie en France de son livre Jesu, un chant de confrérie en Sardaigne (2009) apporte de nouvelles observations à la fois fines et précises sur la quintina, cette cinquième voix « virtuelle » qui apparaît dans le spectre polyphonique de quatre chanteurs. L’auteur se réfère à des travaux anciens de Bernard Lortat-Jacob dont il analyse l’un des magnifiques enregistrements effectués par celui-ci dans les années quatre-vingt-dix (voir son livre paru en 1998). À l’époque, il avait interprété le phénomène de la quintina en invoquant une notion de « fusion » entre les voix du choeur. Guiliano d’Angiolini conteste vivement ce terme en ouvrant un débat qui, pour une large part, repose sur un malentendu. En effet, sa critique porte sur l’usage du mot « fusion » dans le sens d’une théorie acoustique bien précise dont il conteste l’application aux polyphonies de Sardaigne. Or cette théorie n’est pas celle de Bernard Lortat-Jacob qui a rectifié et précisé son analyse depuis 1998 notamment à la suite de sa collaboration en 2001 avec les acousticiens Michèle Castellengo et Gilles Léothaud. De telle sorte qu’aujourd’hui, lorsqu’il lui arrive encore de parler de « fusion », c’est dans le sens général d’interpénétration des voix et de renforcement mutuel permettant l’émergence de la quintina, et non dans le sens d’une théorie scientifique particulière dont l’utilisation serait erronée comme le suppose Guiliano d’Angiolini.

Sur le plan théorique en effet, les conceptions de Lortat-Jacob, Castellengo et Léothaud sont clairement décrites dans une animation multimédia appelée « clef d’écoute » conçue en collaboration avec Annick Armani et moi-même en février 2002 pour le site du CREM, puis décrite dans un article (Chemillier 2003) et dans un entretien avec Bernard Lortat-Jacob pour Musimédiane (2008). Giuliano d’Angiolini mentionne cette animation (note 2, p. 11), mais il ne dit rien de son contenu de sorte que ses références aux travaux de Bernard Lortat-Jacob remontent à 1998 et ne prennent pas en compte les contributions ultérieures de celui-ci. Le but de cette note est de replacer les propositions de Giuliano d’Angiolini dans le contexte de travaux plus récents de Bernard Lortat-Jacob, et de montrer en quoi les deux approches, au-delà des faux débats qui les opposent, sont en réalité complémentaires. D’un côté, le discours de Giuliano d’Angiolini consiste principalement, comme on le verra par la suite, à démêler la logique d’enchevêtrement des harmoniques dans le spectre produit par le choeur. D’un autre côté, Bernard Lortat-Jacob s’attache à montrer comment cet enchevêtrement complexe est effectivement contrôlé par les chanteurs. Ajoutons que ces deux approches sont liées au point que Bernard Lortat-Jacob avait lui-même anticipé l’analyse de Giuliano d’Angiolini dans son synopsis de l’animation en 2002 en indiquant qu’un prolongement devait être l’étude des « conditions d’émergence de la quintina » grâce au « système d’accords parfaits » chantés par le choeur.

La principale contribution de la clef d’écoute de 2002 était de fournir une preuve à la fois théorique et expérimentale (par une expérience reproductible) du fait que la quintina est obtenue en renforçant non pas un mais plusieurs harmoniques permettant de créer un spectre autonome, et que ce sont ses harmoniques 2 et 3 qui donnent l’illusion d’une cinquième voix. C’est dans ce sens qu’on peut affirmer (comme cela est fait dans l’animation) que la quintina n’est émise par aucun chanteur. Elle est formée par un spectre autonome qui se détache de celui du choeur, et qui produit sur l’auditeur la sensation d’une nouvelle fondamentale « virtuelle » ne s’identifiant à aucune de celles émises par les quatre chanteurs. Rappelons ici l’expérience. On supprime sur un fragment de l’enregistrement les harmoniques 2 et 3 de la quintina (en orange ci-dessous) avec le logiciel Audiosculpt sans toucher à sa fondamentale (en rouge), puis l’auditeur écoute l’extrait et entend clairement la disparition et la réapparition de la voix virtuelle alors même que sa fondamentale n’est pas modifiée.

Votre navigateur ne supporte pas ce format de vidéo. Giuliano d’Angiolini a procédé à une analyse minutieuse d’une version du Jesu enregistrée par Bernard Lortat-Jacob et il s’est intéressé à la répartition des harmoniques à l’intérieur des accords chantés par le choeur notamment dans l’extrait ci-après. Son analyse part du fait que la quintina double à l’octave supérieur la troisième voix du choeur appelée bogi.

Il développe son raisonnement dans trois directions :

  • Il confirme la thèse de Bernard Lortat-Jacob selon laquelle l’émergence de la quintina est due pincipalement à ses harmoniques 2 et 3 (renforcement des harmoniques 4 et 6 du bogi).
  • Il met en évidence entre ces deux fréquences une zone du spectre qualifiée d’« anti-résonance » où les autres voix s’effacent avec des harmoniques faibles,
  • Il explique la scission du spectre de la voix de bogi, dont les harmoniques paires 2, 4, 6 etc. deviennent le spectre autonome de la quintina, par un effet de « masque » de son harmonique 3 couverte par l’harmonique 4 du contra.

Comment font les chanteurs pour réaliser de telles conditions ? Guiliano d’Angiolini décrit un phénomène acoustique, mais il n’explique pas la cause physico-physiologique qui le produit. Concrètement, il s’agit de se demander

  • comment fait le contra pour masquer l’harmonique 3 du bogi ?
  • comment fait le falzittu pour atténuer son harmonique 4 ?
  • comment fait le bogi pour masquer l’harmonique 8 du contra ?

La réponse à ces questions relève de ce que j’appelle la « modélisation des savoirs ». C’est sur le terrain, en pratiquant soi-même le chant, que l’on peut y parvenir et comprendre ce que font les Sardes. C’est précisément sur ce point que l’approche de Bernard Lortat-Jacob complète les analyses de Guiliano d’Angiolini, en mettant en évidence le rôle du « réajustement vocalique » pratiqué par les chanteurs, technique de haute virtuosité permettant de créer des trous dans le spectre avec les zones non formantiques des voyelles.

Pour illustrer le principe des « zones formantiques », Bernard Lortat-Jacob part du triangle vocalique. Cette schématisation introduite en 1781 par Hellwag permet de représenter les voyelles en fonction de leur deux principaux « formants », c’est-à-dire les deux fréquences les plus renforcées dans leur spectre grâce auxquelles l’oreille parvient à les distinguer. Par exemple, le « i » comporte un deuxième formant assez haut vers 2200 Hz alors que les deux formants du « è » sont plus resserrés aux alentours de 600 et 1700 Hz, comme on peut le voir et l’entendre dans cette animation.

Votre navigateur ne supporte pas ce format de vidéo. Bernard Lortat-Jacob étudie depuis plusieurs années la manière dont les chanteurs sardes prononcent les voyelles. L’animation de 2002 rendait déjà compte de cette orientation : « Les chanteurs travaillent leurs voix pour en renforcer la dynamique dans une zone moyenne (autour de 1000 Hertz). À cette fin, ils “colorent” leurs voyelles de façon particulière, évitant par exemple les “i” à cause de leur forte dynamique dans une zone de 2000-2500 Hz. Soyons attentifs aux paroles “Mi-se-re”, au début du chant : elles sont prononcées “Mè-sè-rè” ». Il a réalisé une expérience qui met en lumière ce phénomène en demandant aux confrères de chanter « i » au lieu de « è » (entretien pour Musimédiane, 2008, écran 17). Le principe des formants vocaliques apparaît clairement, la zone entre 800 et 1200 Hz propice à l’émergence de la quintina devient peu marquée et celle-ci disparaît.

Votre navigateur ne supporte pas ce format de vidéo. C’est par une interaction directe avec les musiciens que l’analyse prend vraiment son sens. Le fait de s’immerger dans le mode de penser local caractérise la démarche de Bernard Lortat-Jacob depuis le début de ses recherches en Sardaigne, comme en témoigne cette scène de repas à Castelsardo en août 2002 (cliché Annick Armani), où des confrères se penchent sur le haut-parleur d’un ordinateur portable pour entendre la quintina isolée avec le logiciel Audiosculpt et vérifier qu’elle est bien à la hauteur voulue.

Les observations très fouillées de Giuliano d’Angiolini relèvent de l’analyse acoustique. Il reste un part essentielle du travail à faire pour relier les propriétés mises en évidence dans le spectre des quatre chanteurs et les techniques de contrôle vocal utilisées par ces derniers. Ce travail relève de l’enquête ethnomusicologique, et sur ce point, l’expérience de recherche de terrain acquise par Guiliano d’Angiolini dont témoigne plusieurs de ses publications (Ligurie en 2002, Grèce en 2007), ne s’est pas exercée dans le contexte de la Sardaigne. Concernant l’analyse de la quintina, on voit que le champ à explorer reste vaste sur le plan de la modélisation des savoirs musicaux, pour expliciter les moyens mis en oeuvre par les chanteurs dans l’émergence de la quintina en développant des savoirs spécialisés appliqués à leur pratique du chant.

En 1970, Nattiez fut engagé à l’Université de Montréal, d’abord au dépt de linguistique et à celui d’études françaises, puis à la faculté de musique où il enseigne la musicologie depuis 1972. De 1974 à 1980, il y fut dir.

 Jean-Jacques Nattiez. Musicologue (Amiens, France, 30 décembre 1945, naturalisé canadien 1975). L.èsL. modernes (Aix-en-Provence) 1967, Licence de linguistique (ibid.) 1968, M.èsL. modernes (ibid.) 1968, Certificat d’aptitude pédagogique à l’enseignement secondaire (Paris) 1970, doctorat 3e cycle (Paris) 1973. Il étudia la musique au Cons. d’Amiens et se consacra au piano en privé. Ses études universitaires furent vouées aux lettres et à la linguistique, d’abord à Aix-en-Provence puis, au doctorat, à Paris où il a soutenu une thèse sur la sémiologie musicale.En 1970, Nattiez fut engagé à l’Université de Montréal, d’abord au dépt de linguistique et à celui d’études françaises, puis à la faculté de musique où il enseigne la musicologie depuis 1972. De 1974 à 1980, il y fut dir. du Groupe de recherches en sémiologie musicale dont les travaux portèrent notamment sur les Préludes de Debussy et sur la musique des Inuit. Il est également dir. de la collection Sémiologie et analyse musicales aux Presses de l’Université de Montréal. Paru en 1975, son ouvrage Fondements d’une sémiologie de la musique, qui adapte des modèles de la linguistique structurale à l’analyse musicale, retint l’attention des musicologues du monde entier. En 1987, il en a publié une nouvelle version entièrement refondue sous le titre Musicologie générale et sémiologie. De 1980 à 1985, il fut corédacteur en chef des six premiers numéros de la Revue de musique des universités canadiennes. En 1991 paraissait aux Presses de l’Université de Montréal le premier numéro de Circuit, « revue nord-américaine de musique du XXe siècle » dont il est rédateur en chef. En 1981, Pierre Boulez lui proposa la codirection de la prestigieuse collection Musique/Passé/Présent chez l’éditeur Christian Bourgois (Paris). Outre les ouvrages de Nattiez, on y retrouve les écrits de Varèse, Berg, Hanslick, Kagel, etc., et trois volumes de Boulez dont il a préparé l’édition. Son livre Tétralogies « Wagner, Boulez, Chéreau », essai sur l’infidélité, paru en 1983, traite des détails d’interprétation dans l’oeuvre de Wagner, tandis que Wagner androgyne (1990) porte sur la relation entre la poésie et la musique dans ses opéras. Les autres ouvrages de Nattiez sont consacrés à l’influence de la musique dans l’oeuvre du romancier Marcel Proust, ainsi qu’à la sémiologie et la musicologie. Après avoir suivi des cours de direction d’orchestre avec Jacques Clément à Montréal, Fernand Quattrochi et Pierre Dervaux à Nice, et Charles Bruck à Hancock, Me, il fut dir. mus. de l’OS de Joliette-Lanaudière de 1984 à 1987.

À partir de 1973, Nattiez a donné de nombreuses conférences à travers le monde, notamment sur la sémiologie musicale, sur Wagner et Proust, ainsi que sur la musique des Inuit, plus particulièrement l’analyse de leurs jeux vocaux. Ses travaux sur la musique des Inuit ont mené à l’édition, en 1978 sur micr., des Chants et jeux des Inuit (collection Musical Sources de l’Unesco, Philips 6586036, Auvidis D-8032 et Auvidis AD-090), couronnés l’année suivante du Grand prix du disque de l’Académie Charles-Cros, et à celle, en 1989 sur CD, des Jeux vocaux des Inuit (Inuit du Caribou, Netsilik et Igloolik, Ocora C-559071). Pour la collection de l’Unesco, il collabora aussi à Chants des Aïnou (1982, Philips 6586045). Sa réédition sur micr. des enregistrements de musique de tradition orale réunis par l’ethnomusicologue roumain Constantin Brailoïu dans les années 1950, sous le titre Collection universelle de musique populaire enregistrée (1985, Musée d’ethnographie de Genève 6-VDE-30-425-340), lui valut un deuxième Grand prix Charles-Cros en 1987.

Boursier Killam du CAC (1988-90), Nattiez fut aussi élu membre de la Société royale du Canada en 1988. La même année, il se vit attribuer la médaille Dent de la Royal Musical Assn d’Angleterre pour l’ensemble de ses travaux. En 1989, l’Assn canadienne-française pour l’avancement des sciences lui décerna son Prix André-Laurendeau pour les sciences humaines. Récipiendaire du Prix Molson 1990, il fut nommé membre de l’Ordre du Canada la même année. Il a collaboré à l’EMC.

