Zurück zur Homepage
Fortsetzung Diplomarbeit Teil 2 (Forschungsteil)
Fortsetzung Diplomarbeit Teil 3 (Anhang: Glossar, Literatur, Tabellen)

MIDI-Synthese in der kognitiven Musikologie:

eine exemplarische Studie des psychoakustischen Phänomens

der subjektiven Tondauer

Diplomarbeit zur Erlangung des Magistergrades der Philosophie eingereicht an der Geisteswissenschaftlichen Fakultät der Universität Wien.

von

Gerhard Junker

Wien, am 15.3.1995.


Vorwort

Musik wurzelt in einer Erfahrungsdimension des Hörens (REENPÄÄ 1967). Der Übersetzungsprozeß des akustischen Stimulus in einen objektiven Höreindruck wird physiologisch unwillkürlich bewältigt. Die Assimilation des kognitiven Sinneseindrucks innerhalb einer in sich geschlossenen Kultur kann nur durch einen fortwährenden Sozialisationsprozeß gelingen (GRAF 1977: 190), eine interkulturelle Adaption, die in der schnellebigen Gegenwart in konvergenten Annäherungen musikalischer Stilelemente offenkundig wird, ist auch innerhalb geschlossener Gesellschaften ein ständiger Begleiter.

 

In fast allen Bereichen der Musik gibt es durch die Anwendung neuer Technologien mehr oder weniger gravierende Veränderungen. Die kulturellen Ausdrucksformen werden in einer Industrie- und Konsumgesellschaft, wie der unseren, immer stärker von hochentwickelten Methoden und Praktiken geprägt. Der letzte Schritt in dieser dynamischen Entwicklung war die Einbeziehung des Computers in das musikalische Schaffen. Noch nie zuvor gab es eine vergleichbar nachhaltige Veränderung im Kompositionsbereich, in der Klangerzeugung und Instrumentation, in der musikalischen Aufführungspraxis und anderen Teildisziplinen des Musikalltages. Nach eher wenigen experimentellen, meist elitären musikalischen Computeranwendungen der 50er- bis 70er-Jahre, kam es in den letzten zehn Jahren zu einer uferlos scheinenden Flut im Bereich der computerisierten, elektronischen und elektroakustischen Musik: mit der Präsentation des Musical Instrument Digital Interface (MIDI) setzte eine Entwicklung des "kleinbürgerlichen Pragmatismus" in der Computermusik ein. Auf einmal gab es die Möglichkeit, mit relativ geringem Finanzaufwand computerisiert Klänge zu generieren, Kompositionen nach verschiedensten Algorithmen zu erstellen, Partituren zu schreiben, interaktiv Gehörbildung zu betreiben und vielen anderen musikalischen Anwendungen am Computer nachzugehen.

Die junge Disziplin der musikalischen Informatik hat nicht zuletzt wegen der Wechselwirkung von Technik und Musik Eigengesetzlichkeiten bezüglich einer neuen Musikästhetik hervorgebracht, die künstlerische Abgrenzung sowie die wissenschaftliche Erfassung derselben stehen aber erst am Beginn. Anschauliche Publikationen und Studien bezüglich Computeranwendungen in der Musik gibt es vorrangig zu Themen über den Computereinsatz in Wissenschaft, Komposition, Ästhetik und Pädagogik (z.B.: APPLETON, 1989; COGAN, 1981; HARENBERG, 1989; HEWLETT/ SELFIDGE-FIELD, 1990; SCHAFFRATH, 1991 u.a.) , sowie zu Fragen der Technologie. Letztgenannte sind in Großauflagen - vor allem in Belangen der MIDI-Technologie - erschienen. Dabei handelt es sich i.A. um Abhandlungen bezüglich Hard- und Software in MIDI-Konfigurationen, Klangsynthesen und digitaler Signalverarbeitung.

Die polydisziplinäre Struktur der Musikwissenschaft, Aspekte der psychoakustischen Schallforschung und kognitiven Musikwahrnehmung und anderes sind die Beweggründe, mich innerhalb des großen Rahmens der Computermusik mit der MIDI-Synthese - nach nämlichen Gesichtspunkten - näher auseinanderzusetzen. Angeregt durch Zielsetzungen und Abgrenzungen Philipp ACKERMANN’s (1991: 2) habe ich in der untenstehenden Graphik versucht, die MIDI-Synthese, ihre Anwendungsmöglichkeiten, sowie ihr Umfeld in kooperierende wissenschaftliche Disziplinen und Teildisziplinen umfassend einzuordnen.

Die Graphik soll das weitreichende, beachtenswerte Feld der potentiellen Anwendungen und Forschungsbereiche des Musical Instrument Digital Interface aufzeigen und den interdisziplinären Aspekt der Thematik verdeutlichen. Zugleich wird daraus ersichtlich, wie schwer eine valide, graphische Zuordnung einzelner Themenschwerpunkte zur Computermusik zweidimensional vorgenommen werden kann, so sehr sind doch oft spezielle Materien von den verschiedenen Betrachtungsweisen der Einzeldisziplinen abhängig.

Abbildung 0/1: "MIDI": eine polydisziplinäre Form der Computermusiksynthese.

 

Diese Arbeit kann selbstredend nicht alle Perspektiven der Computermusik (bzw. der MIDI-Synthese im speziellen) diskutieren. Jedoch sollen nicht MIDI-erfahrenen Lesern einige grundlegende Einzelheiten zum Bereich "MIDI" als nötiges Basiswissen vorgestellt werden, einschlägig Eingeweihte können dieses Kompendium ohneweiters überspringen, bei Bedarf steht im Anhang ein Glossar mit zahlreichen Fachtermini zur Verfügung. Neben einer kurzen historischen Einleitung und einem Abriß über die Entstehung von "MIDI", sind die ersten Kapitel - aus zuvor besprochenem Grunde - als eine theoretische Einführung in die MIDI-Hard- und Software, in die üblichen Klangsyntheseverfahren und weitere die MIDI-Synthese betreffende Teilbereiche gegliedert. Nicht zuletzt als eine Folgerung daraus sollen im Hauptteil dieser Arbeit bestehende Mängel dieses Instrumentariums aufgezeigt und diskutiert werden. Der Schwerpunkt dabei liegt primär in einer (nach psychoakustischen Kriterien angelegten) empirischen Untersuchung möglicher mangelhaft standardisierter Implementierungen in bestehende Softwarestrukturen, nämlich in einer kritischen Betrachtung der musikalischen Behandlung empfundener und tatsächlich klingender Tondauern. MIDI fungiert dabei sowohl als Synthese- als auch als Aufzeichnungsinstrumentarium. Zuvor noch soll eine beschreibende Ausführung metrischer Strukturen und Quantisierungsmuster eines softwaregesteuerten MIDI-Sequenzers die Möglichkeiten dieses Instrumentariums vorstellen. Letztlich stellt sich die Frage nach der Einsatzmöglichkeit von "MIDI" in musikwissenschaftlichen Forschungsfragen - wie den zuvor beschriebenen - als integriertes Synthese- und Analysesystem.

Abschließend ist es mir ein Bedürfnis, dem Kollegium des Instituts für Musikwissenschaft der Universität Wien und der Forschungsstelle für Schall-forschung der österreichischen Akademie der Wissenschaften meinen Dank für die gute Zusammenarbeit und Unterstützung vor und während der Entstehung dieser Diplomarbeit auszusprechen. Mein besonderer Verbundenheit möchte ich jenen Personen aussprechen, die mit Rat und Tat sowie Anerkennung und Tadel am Gedeihen dieses Forschungsbeitrages beteiligt waren: Prof. Dr. Franz Födermayr, Dr. Emil H. Lubej, Dr. Werner A. Deutsch und vielen anderen kritisch-konstruktiven Beobachtern meiner Tätigkeit während der letzten Monate. Ebenso sei den Versuchspersonen der exemplarisch-empirischen Studie gedankt, die ihr musikalisches Vermögen ohne zu zögern in die Studie einbrachten.

Inhaltsverzeichnis

Vorwort

I

Inhaltsverzeichnis

V

Verzeichnis der Abbildungen und Tabellen

IX

Abkürzungs- und Indexverzeichnis

XI

   

Erstes Kapitel: Die Entwicklung der MIDI-Synthese: Vom Telharmonium bis zu modernen MIDI-Systemen

1.

Die Entwicklung der MIDI Synthese

1

1.1.

Ein historischer Abriß elektroakustischer Musik vor dem MIDI- Zeitalter

2

1.2.

Die Anfänge der MIDI Synthese

7

 

Zweites Kapitel: Der MIDI-Standard: Hardware- und Software-Merkmale von MIDI

2.

Der MIDI-Standard

10

2.1.

Das MIDI-Interface

11

2.1.1.

Hardware-Merkmale von MIDI

11

2.1.2.

Software-Merkmale von MIDI

14

2.2.

MIDI-Message Spezifikation

18

2.2.1.

MIDI-Nachrichten: Globalübersicht

18

2.2.2.

MIDI-Nachrichten: Befehle, Typen, Werte und Bedeutungen

20

 

Drittes Kapitel: MIDI-Instrumente

3.

MIDI-Instrumente

23

3.1.

Der Controller

25

3.2.

Tongeneratoren und Klangerzeuger

29

3.2.1.

Additive Synthese

30

3.2.2.

Subtraktive Synthese

31

3.2.3.

Frequenzmodulation-Synthese (FM-Synthese)

31

3.2.4.

Amplitudenmodulation-Synthese (AM-Synthese)

31

3.2.5.

Phase-Distortion-Synthese (PD-Synthese)

32

3.2.6.

Linear Arithmetische Synthese (LA-Synthese)

32

3.2.7.

Wavetable-Synthese

32

3.2.8.

Vektor-Synthese (VS)

33

3.2.9.

Sample-Synthese (Sampling)

33

3.2.10.

Granular-Synthese

33

3.2.11.

Karplus-Strong-Synthese

34

3.2.12.

Resynthese

34

3.2.13.

Time Slice-Verfahren

34

3.2.14.

Software-Synthesesysteme

35

 

Viertes Kapitel: Die Aufnahme mit MIDI

4.

Die Aufnahme mit MIDI

36

4.1.

Der MIDI-Sequenzer

38

4.1.1.

Die Funktionsweise eines Software-Sequenzers

40

4.1.2.

Die Sequenzerspuren

41

4.1.3.

Physikalisch-rhythmische Auflösung des Tempos

44

4.2.

Die Editoren

46

4.2.1.

Der Event-Editor (Grid-Editor)

46

4.2.2.

Der Matrix-Editor (Key-Editor)

47

4.2.3.

Der Noteneditor (Score-Editor)

48

4.2.4.

Der Schlagzeugeditor (Drum-Editor, Percussion-Editor)

50

4.2.5.

Der Controller-Editor

51

4.2.6.

Der logische Editor

52

     

Fünftes Kapitel: Metrische Strukturen im MIDI-Sequenzer

5.

Metrische Strukturen im MIDI-Sequenzer

55

5.1

Rhythmus und Metrum: Allgemeines

56

5.2.

Neurobiologische Aspekte in der Rhythmusforschung

59

5.3.

Quantisierungen im MIDI-Sequenzer

61

5.3.1.

Arten und Methoden der Quantisierung

62

5.3.1.1.

Standardquantisierungen

62

5.3.1.2.

Stufenweises bzw. näherungsweises Quantisieren

64

5.3.1.3.

Intelligentes Quantisieren

66

5.3.1.4.

Quantisierung nach Modellen

67

5.3.1.5.

Sonstige Methoden der rhythmischen Beeinflussung

70

     

Sechstes Kapitel: Psychoakustische Grundlagen der kognitiven Musikologie

6.

Psychoakustische Grundlagen der kognitiven Musikologie

71

6.1.

Allgemeine Einführung

72

6.2.

Psychoakustische Grundlagen

72

6.2.1.

Die subjektive Tondauer akustischer Stimuli

73

6.2.2.

Praktische Umsetzung dynamischer Hörempfindungen

79

6.3.

Tondauer im MIDI-Sequenzer

80

6.4.

MIDI-Sequenzermodell der subjektiven Tondauer

81

6.4.1.

Die Problematik der Tondauer in MIDI-Sequenzern

83

6.4.1.1.

Grenzen der technischen Realisierbarkeit

83

6.4.1.2.

Der Einfluß der Klangerzeugung

84

 

   

Siebentes Kapitel: Experiment: Vorstudie und Hauptversuch

 

7.

Experiment

87

7.1.

Vorstudie: Naturaufnahme versus MIDI-synthetisierte Aufnahme

88

7.1.1..

Beschreibung des Versuchs

89

7.1.1.1.

Beispiel 1: Klavier

90

7.1.1.2.

Beispiel 2: Idiophone

93

7.1.2.

Versuchsergebnisse

94

7.1.3.

Interpretation und Kritik am Ergebnis

95

7.2.

Hauptversuch: Variation synthetischer Klänge

99

7.2.1

Versuchsablauf

101

7.2.2.

Der Einfluß der Hüllkurven auf die Klangwiedergabe

105

7.2.3.

Statistische Auswertung des Hauptversuchs

111

7.2.4.

Clusteranalyse

121

7.2.4.1.

Cluster 1

122

7.2.4.2.

Cluster 2

124

7.2.5.

Instrumentenvergleich

132

7.2.6.

Velocityvergleich

133

7.2.7.

Gegenüberstellung: Notenlänge - Velocity

137

     

Achtes Kapitel: Zusammenfassung

8.

Zusammenfassung

141

8.1.

Zusammenschau des Experiments

142

8.2.

Quantisierungsmodell nach Hüllkurven- und Artikulations-kriterien

144

     

Anhang: Literaturverzeichnis, Glossar, Tabellen, Notenbeispiele

1.

Unabhängige Bibliographie

148

2.

Publikationen in Periodika

157

2.1.

The Journal of the Acoustic Society of America (JASA)

157

2.2.

Computer Music Journal

159

2.3.

Music Perception

159

2.4.

Acustica

159

2.5.

Keys

160

2.6.

Keyboards

160

 

Glossar

161

 

Tabellen 1 bis 16

187

 

Notenbeispiele

203

 

Curriculum Vitae

205

Verzeichnis der Abbildungen und Tabellen:

Kap./

Abb.

 

Seite

     

0/1

MIDI: eine polydisziplinäre Form der Computermusiksynthese

III

2/1

MIDI-Anschluß

12

2/2

Das MIDI-Interface mit einem seriell/parallel Interface (UART)

14

2/3

MIDI-Bytes

16

2/4

MIDI-Event

17

2/5

Übersicht der MIDI-Message Typen

18

2/6

MIDI-Nachrichten: Befehle, Typen, Werte und Bedeutungen

20

3/1

MIDI-Synthese als zentrales Steuerungsorgan

30

4/1

Übersicht gängiger Softwaresequenzer

39

4/2

Programmoberfläche des Sequenzers "Cubase Score"

43

4/3

Programmoberfläche des Sequenzers "Cakewalk Professional"

44

4/4

Event-Editor des Sequenzers "Master Tracks Pro"

46

4/5

Der Matrix-Editor des Sequenzers "Cakewalk Professional"

47

4/6

Der Noteneditor des Programms "Encore"

49

4/7

Drum-Editor in "Cubase Score"

50

4/8

Der Logical Editor des Sequenzer "Cubase Score"

53

5/1

Bereich minimaler Tonkennzeiten verschiedenfrequenter Klänge

60

5/2

Quantisieren im Event-Editor

63

5/3

Beispiel für ein "Groove-Template" des Sequenzers "Cubase"

68

5/4

Schlagzeugeditor mit angewandten Quantisierungsmodellen

69

6/1

Mithörschwellen-Zeitmuster einer Impulsfolge

74

6/2

Modell der subjektiven Tondauer

75

6/3

Verdopplung der Dauer von Tonimpulsen

76

6/4

Musikalische Implikation subjektiver Tondauer

79

6/5

Listeneditor im Sequenzer "Cubase"

81

6/6

Modell subjektiver Tondauern in MIDI-Sequenzern

82

6/7

ADSR-Hüllkurve eines Klangerzeugers

86

7/1

MIDI-Aufnahme versus akustisches Instrument

88

7/2

Interpretationsvergleich Mozart KV 281/3: Audio- versus MIDI-Aufnahme

96

7/3

Interpretationsvergleich Mozart KV 281/3: MIDI-Einspielungen

96

7/4

Interpretationsvergleich Liszt h-moll Sonate: Audio- versus MIDI-Einspielung

97

7/5

Interpretationsvergleich Liszt h-moll Sonate: MIDI-Einspielungen

97

7/6

Variation der Hüllkurve eines Klanges zur empirischen Überprüfung von musikalischer Tondauer

100

7/7

Versuchsaufbau der exemplarisch-empirischen Studie

102

7/8

Intensitätsverlauf eines Klaviertons und eines natürlichen Orgeltons der Tonhöhe a=220 Hz

103

7/9

Intensitätsverlauf der Einschwingphasen eines Klavier- und eines natürlichen Orgeltons

104

7/10

Absolute Orgeltondauer der 1/16 Note f 1, Tempo 120

106

7/11

Absolute Orgeltondauer der 1/16 Note f 2, Tempo 120

107

7/12

Absolute Klaviertondauer der 1/16 Note f 1, Tempo 120

108

7/13

Absolute Klaviertondauer der 1/16 Note f 2, Tempo 120

109

7/14

Exemplarisches Notenlängenprofil für die Person 1, HK 1 (legato)

112

7/15

Statistische Auswertung der Versuchsperson 1

114

7/16

Tabellarisches Gesamtergebnis der statistischen Auswertung für zehn Versuchspersonen

115

7/17

Notenlängenprofil: Orgel nicht anschlagdynamisch, HK 1,2,3 (leg.)

117

7/18

Notenlängenprofil: Orgel nicht anschlagdynamisch, Xam, Min/Max

118

7/19

Notenlängenprofil: Orgel anschlagdynamisch, HK 1,2,3 (portato)

119

7/20

Notenlängenprofil: Klavier versus Orgel, HK3 (staccato)

120

7/21

Notenlängenprofil Cluster 1: Orgel nicht anschlagdynamisch (port.)

122

7/22

Statistische Auswertung: Cluster 1

123

7/23

Statistische Auswertung: Cluster 2

125

7/24

Notenlängenprofil Cluster 2: Orgel nicht anschlagdynamisch (leg.)

126

7/25

Notenlängenprofil Cluster 1: Orgel anschlagdynamisch (portato)

127

7/26

Notenlängenprofil Cluster 2: Orgel anschlagdynamisch (portato)

127

7/27

Notenlängenprofil Cluster 2: Orgel nicht anschlagdynamisch (port.)

129

7/28

Notenlängenprofil Cluster 2: Orgel anschlagdynamisch (portato)

129

7/29

Notenlängenprofil Cluster 2: Klavier anschlagdynamisch (portato)

130

7/30

Notenlängenprofil Cluster 2: Klavier anschlagdynamisch (staccato)

131

7/31

Notenlängenprofil Cluster 1: Instrumentenvergleich (portato)

132

7/32

Notenlängenprofil Cluster 2: Instrumentenvergleich (portato)

133

7/33

Velocityprofil der Artikulationen legato, portato und staccato

134

7/34

Velocityprofil: Orgel nicht anschlagdynamisch; Cluster 1 (staccato)

135

7/35

Velocityprofil der Hüllkurven 1,2,3; Cluster 1 (portato)

135

7/36

Velocityprofilvergleich: Orgel anschlagdynamisch versus nicht anschlagdynamisch, HK 1 (legato)

136

7/37

Gegenüberstellung: Notenlänge - Velocity, HK 1,2,3(legato)

137

7/38

Gegenüberstellung: Notenlänge - Velocity, HK 1 (portato)

138

7/39

Gegenüberstellung: Notenlänge - Velocity, HK 1(staccato)

139

7/40

Gegenüberstellung: Notenlänge - Velocity, HK 2; Xam, Min/Max, S

140

8/1

Sequenzermodell anhand der Erkenntnisse der empirischen Studie für die Artikulationsart portato

145

     

Anhang:

     

Tab. 1

Beispiel für eine MIDI-Implementierungstabelle

187

Tab. 2

Umwandlungstabelle: Dezimal, Hexadezimal, Binär

188

Tab. 3

General MIDI - Standard

189

Tab. 4

Auswertung der MIDI-Aufnahme: F. Liszt, h-moll Sonate

190

Tab. 5

Auswertung der MIDI-Aufnahme: Mozart Klaviersonate KV 281/I

191

Tab. 6

Auswertung der MIDI-Aufnahme: Mozart Klaviersonate KV 281/III

192

Tb. 7-16

Statistische Auswertung Person 1-10

193

Nbsp. 1

J. S. Bach: Invention in F-Dur, 4 Takte

203

Nbsp. 2

Franz Liszt: Sonate an Robert Schumann; h-moll, 11 Takte

203

Nbsp. 3

W. A. Mozart: Klaviersonate KV 281/3, 8 Takte

204

Nbsp. 4

W. A. Mozart: Klaviersonate KV 281/1, 3 Takte

204

Abkürzungen

Abb. Abbildung

ANSI American National Standards Institute, Inc

ca. zirka

CCRMA Center for Computer Research in Music and Acoustic (Stanford University)

CMJ Computer Music Journal

DB Dezibel

ders. derselbe

dez. dezimal

d.h. das heißt

div. diverse

engl. englisch

et al. et altera, und andere

etc. et cetera, usw.

evtl. Eventuell

Fi absolute Häufigkeit

hex. Hexadezimal

Hg. Herausgeber

HK Hüllkurve

i.a. im allgemeinen

JASA The Journal of the Acoustic Society of America

Kap. Kapitel

Max Maximale Notenlänge

MIDI Musical Instrument Digital Interface

Min Minimale Notenlänge

ms Millisekunden

n Stichprobe, Laufvariable

o. oder

ppq pulses per quaternote

qpm quaternotes per minute

S Standardabweichung

t Zeit, Zeitachse

Ti objektive Dauer eines Schallimpulses

Ts subjektive Dauer eines Schallimpulses

T’ Periodendauer bzw. Zeitintervalle von Schallimpulsen

u. und

u.a. unter anderen(m)

u.ä. und ähnliche(s)

usw. und so weiter

u.v.a. und viele andere

vergl. vergleiche

Vol. Volume

Xam Arithmetisches Mittel

Xme Median

z.B. zum Beispiel

 


 

 

Erstes Kapitel

Die Entwicklung der MIDI-Synthese

Vom Telharmonium zu modernen MIDI-Systemen

 

1. Die Entwicklung der MIDI-Synthese

1.1. Ein historischer Abriß elektroakustischer Musik vor dem MIDI-Zeitalter

Seit jeher galt die Suche nach neuartigen Musikinstrumenten und musikalischen Ausdrucksmöglichkeiten als ein wichtiger Bestandteil des Musizierens. Naturgemäß war eine derartige Entwicklung mit gesellschaftlichen Anforderungen eng verbunden. Durch den Einsatz verschiedenster Materialien oder durch Veränderung der Spieltechnik versuchte man in der "präelektrifizierten" Musikwelt Tonhöhe, Lautstärke und Klangfarbe zu manipulieren bzw. zu modifizieren. Dies führte auch zu entsprechenden Ergebnissen, meistens aber relativ unspektakulär. Die eigentliche Innovationsflut setzte erst mit den ersten elektrischen Musikinstrumenten (Elektrophone) und der synthetischen Klangerzeugung ein.

Hierzu eine chronologische, komprimierte Aufstellung zum besseren Verständnis des Status Quo:

1760 Jean-Baptiste Laborde erfindet ein Cembalo, das auf der elektrischen Beeinflussung eines Glockenspiels beruht (NOLL, 1994: 118).

1887 George F. Diekmann läßt sich das erste E-Piano patentieren (NOLL, 1994: 118).

1896: Das Telharmonium bzw. Dynamophon wird von Thaddeus Cahill (1867-1934) erfunden. Die Tonerzeugung erfolgt durch Generatoren, die von Elektromotoren angetrieben werden. Über spezielle Mischtransformatoren können harmonische Obertöne im Sinne der Additiven Synthese dazugemischt werden, um die Klangfarbe zu ändern (DOBSON, 1992: 186). Die ganze Konstruktion wiegt rund 200 Tonnen! Kompositionen für das Telharmonium: u.a. von Edgard Varèse: "Equatorial, 1934".

1906: Lee De Forest entwickelt die Elektronenröhre, die als Spannungsgenerator, Modulator und Verstärker verwendet werden kann.

1920: Als erstes Elektrophon von praktischem Musizierwert wird das Aetherophon (auch Theremingerät oder Thereminovox genannt) vom russischen Physiker Lev Sergeyevich Termenin (später: Leon Theremin) konstruiert. Kompositionen u.a. von: Bohuslav Martinu, Miklós Rósza, Edgar Varèse.

1921: Elektromagnetische Tonabnehmer werden erstmals bei Stahlsaiten-instrumenten in der Folk-, Country- und Western Musik verwendet.

1924: Das "Rumorarmonio" (oder "Russolophon"), eine Art Lärmtöner wird von Russolo gebaut (HARENBERG, 1989: 32).

1928: Das in der Klangfarbe variable, einstimmige elektronische Tasteninstrument Ondes Martenot (auch Ondes Musicales genannt) wird in Paris von Maurice Martenot (1898-1980) präsentiert. Ähnlich wie schon das Aetherophon funktioniert dieses Instrument nach dem Differenztonprinzip. Kompositionen für das Ondes Martenot: A. Honegger, O. Messiaen, D. Milhaud, E. Varèse, u.a. (DOBSON, 1992:113).

1930: Das Trautonium von Friedrich Trautwein wird an der Berliner Musikhochschule erstmals der Öffentlichkeit vorgeführt. Später wird sein Trautonium von Oskar Sala zum Mixturtrautonium (1952) weiterentwickelt. Über 300 Film-Soundtracks hat Oskar Sala mit seinem Instrument maßgeblich gestaltet. Kompositionen für das Trautonium: Paul. Hindemith, R. Strauss, Harald Genzmer, P. Höffer, Carl Orff u.a.

1935: Die Hammondorgel, eine konsequente Weiterentwicklung des Telharmoniums, wird von Laurens Hammond gebaut.

1946 Der Kanadier Hugh Le Caine konstruiert den Synthesizer Sackbut, benannt nach einem mittelalterlichen Posauneninstrument (NOLL, 1994: 123).

1948: Das Electronium, eine monophone, elektronische Orgel, wird von René Seybold konstruiert. Kompositionen u.a. von K. Stockhausen (DOBSON, 1992: 65).

1949: Der Begriff "Elektronische Musik" (bzw. "authentische Musik") wird von W. Meyer-Eppler verwendet und einem gewissen Repertoire zugewiesen (HARENBERG, 1989: 21).

Pierre Schaeffer praktiziert in Paris die von ihm benannte "Musique concrète": In dieser Musik wird nicht nur elektronisch erzeugtes Klangmaterial verwendet, sondern man bedient sich ebenso natürlicher Instrumente, Geräusche, etc.

1952: Das erste Studio für elektronische Musik wird im Funkhaus des NWDR (heute WDR) in Köln unter der Leitung von Karlheinz Stockhausen eingerichtet.

1954: Robert A. Moog gründet eine Firma zur Herstellung elektronischer Musikinstrumente. Den kommerziellen Durchbruch seiner Grundideen zur Klangsynthese (mittels analoger Spannungssteuerung) schafft er ab 1970, als er den Minimoog auf den Markt bringt.

1955: Der durch einen binären Lochstreifencode gesteuerte erste Synthesizer "RCA Mark I Synthesizer" wird von Harry F. Olson und Herbert Belar gebaut.

1956: L.A. Hiller und L.M. Isaacson versuchen an der University of Illinois, USA, mit Hilfe eines Computers zu komponieren. Konkrete Ergebnisse erzielen sie auf der Großrechenanlage ILLIAC.

1962: Das Mellotron, ein elektromechanisches Keyboard für die Wiedergabe von zuvor aufgenommenen Klängen, wird in Birmingham erfunden und ab 1964 von der Firma Mellotron Manufacturing vermarktet (DOBSON, 1992: 101).

1965: James Gabura und Gustav Cimaga experimentieren an der Universität von Toronto mit sogenannten Hybrid-Systemen. Dabei werden bestimmte Regelfunktionen in analogen Audiostudios von Computern übernommen (HARENBERG, 1989: 53-60).

1970: Der ARP-Synthesizer ersetzt die bis dahin üblichen zeitraubenden Steckverbindungen durch Kreuzschienenfelder.

1974: Dave Smith, der Gründer von Sequential Circuits, entwickelt ein digitales Interface, das zwischen Tastatur (Prophet 10) und einem Sequenzer vermittelt.

Die erste wissenschaftliche Konferenz zum Thema Computermusik findet an der Michigan State University statt.

1975: Der Polymoog von Oberheim, ein mehrstimmiger Synthesizer, der durch dividieren einer hohen Frequenz die zwölf Töne der chromatischen Skala für jede Oktave erzeugt, wird präsentiert.

1978: Der fünfstimmige Synthesizer Prophet 5 wird von der amerikanischen Firma Sequential Circuits veröffentlicht.

1979: New England Digital (NED) bringt das erste kommerzielle Synclavier auf den Markt. Dieses digitale Synthesizer- und Audioproduktionssystem basiert in seiner ersten Ausführung auf Additiver- und FM-Synthese.

1982 Anläßlich der NAMM-Show wird der Prototyp des MIDI-Interfaces von Sequential Circuits und Roland vorgestellt.

1983: Der erste MIDI-Synthesizer, der Prophet 600 kommt auf den Markt. Kurz darauf folgen der Roland JX-3P und der Yamaha DX7.

1.2. Die Anfänge der MIDI-Synthese

Schon lange vor der Etablierung des Musical Instrument Digital Interface (MIDI) war man in der Lage, Synthesizer untereinander und/oder Computer miteinander kommunizieren zu lassen. Der oft dünne, einstimmige Klang eines elektronischen Instrumentes konnte auf diese Art und Weise aufgewertet werden. Die beiden zusammengeschalteten Geräte arbeiteten ursprünglich zwar weiterhin nur monophon, der Klang jedoch konnte vielfältig variiert werden. Die gebräuchlichste Art, zwei analoge Synthesizer miteinander zu verbinden, war die sogenannte Gate/CV-Methode (PENFOLD, 1991: 8-18) . Weitere konkurrierende Verfahren waren das Okt/Volt-Prinzip (z.B. Moog und Roland) und das Hz/Volt-System (z.B. Korg) (GEORGES/ MERCK, 1993: 168). Die ersten Interfaces im Musikbereich transportierten ihre Befehlssignale in Form von elektrischen Spannungen. Im wesentlichen handelte es sich um Informationen über Tonhöhe (CV =Control Voltage), Dauer (Gate), und Synchronisation (Clock). Die einzelnen Hersteller versuchten - ohne sich mit der Konkurrenz abzusprechen - vergeblich, ihre eigenen Normen durchzusetzen. Synthesizer ein und desselben Systems ließen sich im allgemeinen untereinander koppeln und von einer Tastatur aus spielen. Wollte man eine Hardwareerweiterung, so mußte man sich auf das bereits bestehende System oder gar dieselbe Marke beschränken.

Bald nach den bereits erwähnten Verfahren (Gate/CV- Okt/Volt- und Hz/Volt-Methode) kamen die digital gesteuerten Analogsynthesizer (Roland, Sequential Circuits, Oberheim). Die sogenannte Master-Slave-Steuerung, die im Computerbereich zu dieser Zeit längst üblich war, wurde damit bei Musikinstrumenten erstmals auf digitalem Weg realisiert. Da die Mikroprozessoren herstellerspezifisch ihre eigene Sprache sowie unterschiedliche Datenformate verwendeten, konnte wiederum keine Standardisierung bzw. Normierung erreicht werden.

Nicht zuletzt aus marktstrategischen Gründen erfolgte Anfang der 80er Jahre eine Annäherung von verschiedenen Herstellern elektronischer Musikinstrumente. Es wurde angestrebt, eine standardisierte Schnittstelle mit Übersetzungsfunktion zu schaffen, welche in jedes elektronische Musikinstrument eingebaut werden konnte und eine Koppelung zwischen diesen erlaubte. Erstmals wurde dieses konkrete Projekt bei einem Kongreß der Audio Engineering Society (AES) im November 1981 in New York vorgestellt. Dave Smith (Sequential Circuits) hatte zusammen mit Chet Wood (Sequential Circuits), Tom Oberheim (Oberheim) und Ikutaroo Kakehashi (Roland) ein Interface initiiert und entwickelt, das den Namen USI (Universal Synthesizer Interface) trug. Es transportierte elektrische Signale des TTL-Typs (0/5 Volt) und arbeitete mit einer Geschwindigkeit von 19.200 Bauds (Bits/Sekunde), was der höchsten Übertragungsrate einer RS-232C Schnittstelle entspricht. Nach erfolgter Einigung dieser drei Herstellerfirmen wurden auch konkurrenzierende Firmen in die Diskussion einbezogen, um einerseits deren Rat bzw. Vorschläge einzuholen und andererseits eine größtmögliche Breitenwirkung in der Standardisierung zu erreichen.

Die Zusammenkunft anläßlich der NAMM (National Association of Music Merchants) im Jänner 1982 brachte dann die gewünschte Einigung: Roland und Sequential Circuits stellten - trotz einiger Anlaufschwierigkeiten - Prototypen des MIDI-Interfaces vor. Eingebaut waren diese in zwei neue analoge Synthesizermodelle: den Prophet 600 und den Jupiter 6. Erstmals konnten zwei digitale Synthesizer unterschiedlichen Fabrikats miteinander kommunizieren. Noch im selben Jahr wurde das erste internationale MIDI-Dokument zwischen Sequential Circuits (USA) und Roland (Japan) erarbeitet. Der MIDI-Standard wurde durch die MIDI-Spezifikation 1.0 festgelegt (IMA, 1985), die Schnittstelle technisch durch einen Optokoppler gegenüber dem ursprünglich verwendeten USI-Prinzip aufgewertet und die Übertragungsgeschwindigkeit auf 31.250 Baud erhöht.

Um eine Institutionalisierung des MIDI-Standards zu gewährleisten, wurde im Jahr 1983 eine Koordinationsvereinigung gegründet: die IMA (International MIDI Association). Seitens der Hersteller wurden ebenfalls zwei Vereinigungen gegründet: das "JMSC" (Japanese MIDI Standard Committee) und 1985 die "MMA" (MIDI Manufactures Association). MIDI stellt keine Norm, sondern lediglich eine Spezifikation dar; es ist daher nicht möglich, gewisse Abweichungen des MIDI-Standards zu verbieten bzw. auszuschließen. Es liegt allerdings im Interesse der Hersteller, ihre Geräte voll MIDI-kompatibel zu produzieren, da nicht zuletzt davon der Verkaufserfolg ihrer Instrumente und Geräte abhängig ist. Trotzdem gab und gibt es in seltenen Fällen kleinere Abweichungen, die allerdings keine oder nur unwesentliche Nachteile für den Anwender darstellen.

Die ersten Hersteller, die sich der MIDI-Spezifikation 1.0 anschlossen und als Gründungsmitglieder der IMA gelten sind nach BRAUT (1993:35):

· Big Briar

· Bontempi

· Kawai

· Korg

· Lexicon

· Moog

· Octave Plateau

· Passport Design

· Roland

· Sequential Circuits

· Siel

· Yamaha

1983 wurden die ersten elektronischen MIDI-Geräte und MIDI-Synthesizer zum öffentlichen Vertrieb angeboten.

 


 

Zweites Kapitel

Der MIDI-Standard

Hard- und Software-Merkmale von MIDI

2. Der MIDI-Standard

Die MIDI-Spezifikation wird von der MIDI-Manufacturers-Association (MMA) herausgegeben und legt die technischen Daten und den Befehlssatz für MIDI fest. Fundamental soll an dieser Stelle vorweggenommen werden, daß MIDI lediglich eine Hard- und Softwarestruktur darstellt, also an der eigentlichen Klangerzeugung nur sekundär als Steuerelement beteiligt ist. Ursprünglich wurde die MIDI-Normierung hauptsächlich vorgenommen, um die Kommunikation zwischen Tastatur und Tonerzeugern (verschiedener Hersteller) zu gewährleisten. Die rasche Entwicklung von modernen, elektronischen Musikinstrumenten und Studiogeräten erforderte jedoch eine kontinuierliche, den Bedürfnissen entsprechende Erweiterung des MIDI-Standards (z.B. Sample-Dump-Standard 1986, MIDI Time Code 1987, Standard MIDI-Files 1988, etc.). Das äußere Erscheinungsbild der MIDI-Hardware-Technik sowie grundlegende Datenformate und Befehlsstrukturen sind seit ihrer vereinheitlichten Einführung 1982 allerdings praktisch unverändert geblieben:

2.1. Das MIDI-Interface

Im allgemeinen wird eine Schnittstelle sowohl durch Hardware-Merkmale ("das Transportmittel", sowie unverzichtbare Bauelemente), als auch durch Software-Merkmale (die Sprache, das Datenformat, die Befehlsstruktur) definiert:

2.1.1. Hardware-Merkmale von MIDI

Um Informationen und Daten zwischen verschiedenen Geräten und Systemen (Tastaturen, Tongeneratoren, Sampler, Computer, etc.) austauschen zu können, müssen diese über ihre MIDI-Schnittstellen verbunden werden. Als Anschlüsse werden meist fünfpolige DIN-Buchsen verwendet, allerdings sind nur drei Leitungen tatsächlich notwendig (siehe Abbildung 2/1). Das MIDI-Interface arbeitet digital, d.h. es verarbeitet Informationen nicht in Form von analogen Spannungen, sondern kodiert alles in binärer Form (Bytes). Die Datenübertragung dieser seriellen asynchronen Schnittstelle erfolgt gerichtet ("duplex": eine Datenleitung pro Richtung) mit einer Geschwindigkeit von 31.250 Baud (=Bits/Sekunde). Die Toleranz beträgt dabei +/-1%. Das Konzept dieser seriellen Übertragung von Impulsen bedeutet, daß ein Bit nach dem anderen über ein einziges Kabel läuft, d.h. pro Takteinheit wird ein Bit über eine Leitung übertragen. Bei 31.250 Bauds (entspricht 1 MHz dividiert durch 32) sind ca. 316 Mikrosekunden notwendig, um ein nutzbares MIDI-Byte (8+2 Bits) zu transferieren. Innerhalb einer Sekunde kann eine MIDI-Schnittstelle mehr als 3000 solcher Bytes verarbeiten. Die Übertragungsrate begrenzt die Anzahl an Informationen, die innerhalb von einer Sekunde übermittelt werden können.

Abbildung 2/1: MIDI-Anschluß

Die Signale werden mit Hilfe einer 5 mA Stromschleife (am DIN-Stecker: Anschluß 4 und 5) zwischen den MIDI-Anschlüssen transferiert. Eine logische Spannung von +5 Volt wird durch ein Bit "0" repräsentiert, eine logische Spannung von 0 Volt stellt ein Bit "1" dar. Um Masseschleifen und elektrische Störgeräusche zu vermeiden, ist jeder MIDI-Eingang mit einer optoelektrischen Isolation (Optokoppler) ausgestattet, d.h. es existieren keine direkten elektrischen Verbindungen. Durch diese galvanische Trennung werden Erdungs- bzw. Brummschleifen ausgeschlossen, auch Potentialunterschiede zwischen zwei Geräten, die empfindliche elektronische Bauteile zerstören könnten, sind nicht möglich. Das Prinzip dieser optoelektrischen Isolation besteht darin, eine LED-Anzeige (Elektroluminiszenzdiode) über eine elektrische Schleife zu versorgen. Je nach Spannung (0 bzw. +5 Volt) beleuchtet die LED einen photoelektrischen Transistor. Neben diesem Optokoppler besteht das MIDI-Interface aus einem UART (Universal-Asynchronous-Receiver/Transmitter) und einigen wenigen diskreten Bauteilen (siehe Abbildung 2/II).

Die Umwandlung des MIDI-Datenstrom (siehe: 2.1.2.; Software-Merkmale von MIDI) von seriell auf parallel durch den UART-Baustein vollzieht sich folgendermaßen: Beim Empfang eines Start-Bits am MIDI-Eingang wartet der Asynchronempfänger (UART, meist Motorola 6850) darauf, acht Bits in Serie zu empfangen, um diese einzeln in seinem internen Register abzulegen. Signalisiert das Stop-Bit den vollständige Transfer eines MIDI-Bytes, werden die acht Bits gleichzeitig (d.h. parallel auf acht Signalleitungen) in einem Datenbus zusammengefaßt an den Mikroprozessor weitergeleitet. Zuvor gelangen die zu übertragenden Daten in einen Zwischenspeicher (Buffer), um den zentralen Prozessor (CPU) nur anzusprechen, wenn tatsächlich MIDI-Daten vorhanden sind. Dieser Vorgang erfolgt bis zu 3000mal innerhalb einer Sekunde, geräteintern können die Datenströme mit einer Taktfrequenz von vielen Megahertz weiterverarbeitet werden. (siehe auch Abbildung 2/2). Den umgekehrten Prozeß - wie zuvor beschrieben - durchläuft ein MIDI-Byte bei der Datenausgabe durch ein parallel/serielles Interface (BRAUT, 1993: 41).

Abbildung 2/2: Das MIDI-Interface mit einem seriell/parallel Interface (UART)

2.1.2. Software-Merkmale von MIDI

Sieht man von der MIDI-Implikation in das neu entwickelte MediaLink-Protokoll in LAN-Schleifen (=Local Area Network) ab (was erhebliche Vorteile mit sich bringt, wie: bis zu 32.000 mal schneller als die herkömmliche MIDI-Schnittstelle, die Möglichkeit über extrem lange Distanzen bidirektional zu kommunizieren sowie andere Datenformate zu übertragen), so hat sich in der Hardware-Entwicklung und Hardeware-Anwendung seit der ersten Standardisierung nichts verändert. Augenscheinlich erklärt sich dies durch Gründe der Kompatibilität.

Anders im Software-Bereich: Rasch verbreiteten sich die MIDI-Schnittstellen über zahlreiche Gerätegruppen. Heute ist ein MIDI-Interface in fast allen elektronischen Instrumenten- und Gerätegattungen zu finden, die akustische Signale verarbeiten, wie Mischpulte, Effektgeräte, Synchronizer, Bandmaschinen, Harddiskrecorder etc. Wäre die MIDI-Sprache auf ihrem ursprünglichen Stand geblieben, hätte sie längst der technologische Fortschritt überrollt.

Mit dem ersten am 5. August 1983 abgeschlossenen MIDI-Dokument (MIDI Detailed Specifications Version 1.0) wurde ein Rahmenwerk geschaffen, innerhalb dessen die verschiedensten Gerätehersteller arbeiten konnten d.h. MIDI-Geräte sollten über einen Standardmodus verfügen, der es erlaubt, mit anderer MIDI-Hardware einwandfrei zusammenarbeiten zu können. Die MIDI-Autoren entwickelten eine sehr flexible Sprache, die den Anforderungen einer kontinuierlichen Weiterentwicklung gerecht war, z.B.:

1986 - Sample Dump Standard

1987 - MIDI Time Code (MTC)

- Standard MIDI-File (SMF).

1988 - Umwandlung auf: MIDI Version 4.1

1991 - General MIDI (GM), General Standard (GS)

1992 - MIDI Machine Control

Wie bereits beschrieben, ist der MIDI-Datenstrom in 10-Bit-Worten organisiert; von eigentlichem Interesse sind nur die acht Daten-Bits, die zwischen den zur Synchronisation benötigten Start- und Stop-Bits liegen. Die übermittelten MIDI-Informationen dienen dazu, das Spiel eines Musikers, Sequenzers etc. in Informationseinheiten zu übersetzen. Der Empfänger muß wissen, welche Nachricht ihm transferiert wurde. Dabei wird grundsätzlich zwischen zwei Kategorien unterschieden: Statusbytes und Datenbytes.

Statusbyte

Das Statusbyte bestimmt Befehlstyp und Adresse des Geräts, an das die nachfolgenden Datenbytes gerichtet sind, oder es definiert solche Ereignisse, bei denen keine Datenbytes folgen (ACKERMANN, 1991: 189-190). Das Statusbyte hat eine zweiteilige 4+4 Form (die beiden Hälften werden Nibble genannt). Aus vier Bits ergeben sich maximal 16 Möglichkeiten (24) der Adressierung, d.h. ebenso viele Geräte können über eine einzige Leitung getrennt softwaregesteuert angesprochen werden bzw. kommunizieren. Das "Most Significant Bit" (MSB) eines Statusbytes hat zur eindeutigen Identifikation immer den Wert 1 (siehe Abbildung 2/3).

Datenbyte

Datenbytes dienen zur Übermittlung von numerischen Werten eines Parameters (z.B. Notennummer, Anschlagstärke, Controller-Daten etc.). Das "Most Significant Bit" (MSB) eines Datenbytes hat hier immer den Wert 0. Damit bleiben sieben Bits für die Kodierung von Zahlenwerten, was einen möglichen Wertebereich von 0 bis 127 ergibt. Reicht dies nicht aus, so werden zwei Datenbytes übertragen, was den Bereich auf maximal 16384 Möglichkeiten erweitert (siehe Abbildung 2/3).

Abbildung 2/3: MIDI-Bytes

Eine MIDI-Nachricht besteht aus einem Statusbyte und 0,1 oder 2 Datenbytes. Eine besondere Möglichkeit zur Einsparung von Daten stellt der sogenannte Running-Status dar. In diesem Modus wird das Statusbyte einmalig gesendet, darauf folgen nur noch Datenbytes. Erst wenn ein MIDI-Event anderen Typs gesendet wird, folgt wieder ein Statusbyte usw. So läßt sich die Datenmenge um bis zu 30% reduzieren (GORGES/ MERCK, 1993: 178). (Beispiel für ein MIDI-Event siehe Abbildung 2/4).

Abbildung 2/4: MIDI-Event: z.B. Note On, eingestrichenes C ("Middle C" / C3), Anschlagstärke (Velocity) 19.

Neben dem zuvor exemplarisch beschriebenen "Note On"-MIDI-Befehl gibt es noch zahlreiche MIDI-Befehlstypen mit unterschiedlichsten Funktionen. Die wichtigsten davon sollen nicht unerwähnt bleiben, eine Beschreibung aller Typen würde den für diese Arbeit vorgesehenen Rahmen sprengen. Der guten Übersichtlichkeit wegen erfolgt diese Zusammenfassung im nächsten Abschnitt global in einer graphischen sowie in einer detaillierteren tabellarischen Aufstellung:

2.2. MIDI-Message Spezifikation

Die von MIDI zur Verfügung gestellte Befehlsstruktur entspricht einem Keyboard-orientierten Modell von musikalischen Informationen. In einer makroskopischen, graphischen Darstellung kann folgende Struktur an MIDI-Nachrichten konstatiert werden (Abbildung 2/5):

2.2.1 MIDI-Nachrichten: Globalübersicht

Abbildung 2/5: Übersicht der MIDI-Message Typen.

Kanalnachrichten dienen zur Steuerung eines bestimmten, einzelnen Gerätes mit einer definierten Adressierung (Channel Number). Systemnachrichten werden ohne Berücksichtigung einer Kanalnummer an das ganze MIDI-Netzwerk geschickt und von allen MIDI-Geräten empfangen (ACKERMANN, 1991: 192).

Die nachfolgende Tabelle liefert einen Gesamtüberblick der möglichen MIDI-Nachrichten. Dabei werden die einzelnen "Messages" in verschiedenen numerischen Darstellungen aufgelistet (dezimal, hexadezimal, binär). Variable Bits werden durch Buchstaben repräsentiert, die dabei möglichen Werte finden sich jeweils in der letzten Zeile des Abschnittes eines Nachrichtentyps.

2.2.2 MIDI-Nachrichten: Befehle, Typen, Werte und Bedeutungen

A. Channel Messages

Channel Voice Messages

Befehl

Hex

Binär

Daten Byte 1

Wert

Daten Byte 2

Wert

Note Off

8n

1000nnnn

Note Number

0-127

Velocity Wert

0-127

Note On

9n

1001nnnn

Note Number

0-127

Velocity Wert

0-127

Poly. Aftertouch

An

1010nnnn

Note Number

0-127

Pressure Wert

0-127

Control Change

Bn

1011nnnn

Controller

0-120

Control Wert

0-127

Progrm. Change

Cn

1100nnnn

Prog. Number

0-127

-

-

Channel Afterth.

Dn

1101nnnn

Pressure Val.

0-127

-

-

Pitch Bend

En

1110nnnn

Bend Val. LSB

0-127

Bend Wert MSB

0-127

MIDI-Kanäle: Werte für nnnn (binär) bzw. n (hex) von 0-15

Controller Messages

Dezimal

Hex

Binär

Controller Type

0

00

00000000

Programm Bank Nummer MSB

1

01

00000001

Modulation

2

02

00000010

Breath Kontrolle

4

04

00000100

Foot Controller

5

05

00000101

Portamento Zeit

6

06

00000110

Dateneingabe MSB

7

07

00000111

Channel Volume (Hauptlautstärke)

8

08

00001000

Balance (Stereo Lautstärke)

10

0A

00001010

Pan (Stereo Panorama)

11

0B

00001011

Expression Controller

12

0C

00001100

Effekt Controller 1 MSB

13

0D

00001101

Effekt Controller 2 MSB

16-19

xx

000xxxxx

Generelle Verwendung (herstellerspezifisch)

20-31

-

-

nicht definiert

32

20

00100000

Programm Bank Nummer LSB

33-63

xx

00xxxxxx

LSB-Wert für Controller 1-31

64

40

01000000

Damper Pedal (Sustain Ein/Aus)

65

41

01000001

Portamento (Ein/Aus)

66

42

01000010

Sostenuto (Ein/Aus)

67

43

01000011

Soft Pedal (Ein/Aus)

68

-

-

nicht definiert

69

45

01000101

Haltepedal 2 (Sustain 2 Ein/Aus)

70-79

-

-

nicht definiert

80-83

xx

0xxxxxxxx

Generelle Verwendung (herstellerspezifisch)

84-90

-

-

nicht definiert

91

5B

01011011

Effekt 1

92

5C

01011100

Effekt 2

93

5D

01011101

Effekt 3

94

5E

01011110

Effekt 4

95

5F

01011111

Effekt 5

96

60

01100000

Daten Increment (+)

Tabelle 2/6: MIDI-Nachrichten

Fortsetzung nächste Seite

Fortsetzung

Dezimal

Hex

Binär

Controller Type

97

61

01100001

Daten Decrement (-)

98

62

01100010

Nicht registrierte Parameter-Nummer - LSB

99

63

01100011

Nicht registrierte Parameter-Nummer - MSB

100

64

01100100

Registrierte Parameter-Nummer 1 - LSB

101

65

01100101

Registrierte Parameter-Nummer 2 - MSB

102-120

-

-

nicht definiert

121-127

xx

xxxxxxxx

Reserviert für Channel-Mode-Nachricht

xx (hex) bzw. xxxxxxxx (binär): Variable für dezimale Werte von 16-127

Channel Mode Messages

Daten Byte 1

Daten Byte 2

Controller

Beschreibung

Wert

Beschreibung

121

Reset all Controllers

0

-

122

Local Control

0

Local Off

123

All Notes Off

0

Setzt alle Noten auf 0

124

Omni Mode Off

0

Setzt alle Noten auf 0

125

Omni Mode On

0

Schaltet Poly-Modus aus

126

Mono Mode On

0

Schaltet Mono-Modus aus

127

Poly Mode On

0

-

B. System Messages

System-Exclusive Messages

 

Binär

Hex

Dezimal

System Exclusiv Status Byte

11110000

F0

240

Hersteller ID Kode

0mmmmmmm

00-7F

0-127

Ende der System Excl. Message

11110111

F7

247

mmmmmmm: herstellerspezifischer Kode von 0 bis 127

System-Common Messages

Status Byte

Daten Bytes

Binär

Hex

Dez

Beschreibung

Byte 1

Byte 2

11110001

F1

241

MTC Quarter Frame

0tttvvvv

-

11110010

F2

242

Song PositionPointer

0ccccccc

0nnnnnnn

11110011

F3

243

Song Select

0yyyyyyyy

 

11110110

F6

246

Tune Request

-

-

11110111

F7

247

EOX

-

-

ttt: Message Typ, vvvv: Wert, cccccc: Position LSB, nnnnnn Position MSB, yyyyyy: Song Nummer

System Real-Time Messages

Binär

Hex

Dezi

Beschreibung

11111000

F8

248

Zeitkode

11111001

F9

249

nicht definiert

11111010

FA

250

Start

11111011

FB

251

Continue

11111100

FC

252

Stop

11111101

FD

253

nicht definiert

11111110

FE

254

Active Sensing

11111111

FF

255

System Reset

Tabelle 2/6: MIDI-Nachrichten

Der bei weitem umfangreichste Teil der MIDI-Nachrichten ist jener der "Controller Messages", eine Untergruppe der "Channel Voice Messages". Nicht zuletzt ist dies ein Indiz dafür, daß die Hauptaufgabe von MIDI darin besteht, Steuerungsaufgaben auszuführen.

In seiner ersten Anwendung wurde der MIDI-Standard entwickelt, um einen Dialog zwischen einem "Controller" (=MIDI-Instrument) und einem Tongenerator (Sampler, Synthesizer, etc.) herzustellen. Das nächste Kapitel enthält einen Querschnitt dieses umfassenden Bereiches der MIDI-Controller und MIDI-Instrumente.

 


 

Drittes Kapitel

MIDI-Instrumente

MIDI-Controller und Tongeneratoren

3. MIDI-Instrumente

Die zahlreichen Software-Definitionen und MIDI-Messages, die im vorigen Kapitel aufgelistet wurden, bedürfen selbstredend einer entsprechenden Hardwareunterstützung, um von praktischem Nutzen zu sein; alle Geräte und Instrumente müssen dem MIDI-Standard entsprechen.

Traditionelle akustische Instrumente unterscheiden sich nicht nur in der Art und Weise der Klangerzeugung und in ihrem äußeren Erscheinungsbild von den verschiedensten elektronischen und computerisierten Instrumentengattungen: konventionelle Musikinstrumente stellen im Allgemeinen eine einzige, geschlossene physikalische Einheit dar, während MIDI-Instrumente in ihrer Konzeption (und häufig auch technisch) in zwei differierende, getrennte Komponenten unterteilt werden:

Er stellt im technischen Sinne die Mensch-Maschine-Schnittstelle dar und dient als Eingabemedium, das menschliches Handeln in - für den Tonerzeuger - verständliche "Controller Messages" transformiert bzw. einen Sequenzer als Daten-Input dienlich ist.

Der eigentliche Klangerzeuger, der ankommende binäre MIDI-Befehle in akustische Schallereignisse umwandelt bzw. akustisch verstärkbare analoge Ausgangsspannungen liefert.

3.1. Der Controller

Die verschiedensten Herstellerfirmen und Forschungsinstitute haben seit der Einführung von MIDI zahlreiche Innovationen hervorgebracht. Neben dem traditionellen Klaviertastatur-Typus haben sich für sehr viele Instrumentengattungen Eingabegeräte in mehr oder weniger traditioneller Form etablieren können. Ebenso wurden experimentelle MIDI-Umsetzer gebaut und teilweise auch der breiten Öffentlichkeit zugänglich gemacht:

Die zahlreichen MIDI-Wandler, eingeteilt primär nach der Musikinstrumentensystematik von SACHS und HORNBOSTEL (1914), sowie sekundär nach formellen, praxisbezogenen Kriterien der elektronischen Klangerzeugung:

1. "Klassische" MIDI-Wandler (Entwicklung als rein elektronische MIDI-Geräte):

2. Chordophon-to-MIDI-Wandler:

Praktisch kann an jeder schwingenden Metallsaite, unter Verwendung eines handelsüblichen MIDI-Tonabnehmers, eine Frequenzdetermination vollzogen werden. "MIDI-fizierte" Instrumente aus außereuropäischen Kulturen, wie z.B. die Sitar, sind gegenwärtig keine exotische Seltenheit mehr.

3. Aerophon-to-MIDI-Wandler:

Verbreitet sind auch kombinierte Instrumente bestehend aus einem blasdruckempfindlichen Mundstück zur Artikulation bzw. Dynamisierung und einer herkömmlichen Pianotastatur, die als MIDI-Controller für Tonhöhe und Tondauer dient.

4. Membranophon-/Idiophon-to MIDI-Wandler:

Die Konvertierung von Idiophon- bzw. Membranophon-Schwingungen bedarf in der MIDI-Synthese keiner Unterscheidung, da weder die Form der physikalischen Anregung, noch der Ton- oder Klangerzeuger selbst einen Einfluß auf die Wandlung in MIDI-Daten hat. Bei der großen Instrumentengruppe mit nicht harmonischen Spektren erfolgt lediglich eine Transformation der Anschlagdynamik in Velocity-Werte (=MIDI-Anschlagdynamik: Wertebereich von 0 bis 127), bei Instrumenten mit zusammengesetzt-periodischen Schwingungsverhältnissen erfolgt (wenn technisch möglich) eine Frequenzerkennung mit entsprechender MIDI-Noten-Zuweisung.

5. Sonstige MIDI-Wandler u. experimentelle Wandler (exemplarische Aufstellung):

Dieser Gruppe an MIDI-Konvertern sind Geräte und Instrumente zugeordnet, die weder in der zuvor beschriebenen Systematik eindeutige Entsprechungen aufweisen, noch der Kategorie der "klassischen" MIDI-Instrumente zugeordnet werden können, d.h. sie genießen keine breite Akzeptanz und kommen weniger zum Einsatz.

Diese komprimierte Auflistung erhebt selbstverständlich keinen Anspruch auf Vollständigkeit, da neben der großen Anzahl an Herstellern sogenannter konventioneller MIDI-Instrumente eine breite Palette an Experimentalinstrumenten und auch Hybridinstrumenten existiert . Letztere werden allerdings nur mit wenigen Ausnahmen in höherer Auflage angefertigt.

3.2. Tongeneratoren und Klangerzeuger

Die MIDI-Synthese an sich ist eine modular aufgebaute, primäre Form der Tonerzeugung, die auf ihr untergeordnete Syntheseformen zurückgreifen muß, um ein entsprechendes Schallereignis bzw. analoge Spannungen am Ausgang zu produzieren. D.h. das eigentliche MIDI-Setup repräsentiert lediglich eine Steuereinheit ("Controller"), die ("sekundäre") Klangerzeuger bzw. Tongeneratoren kontrolliert (siehe Abbildung 3/1). Die konkrete, physikalische Erzeugung von synthetischen, elektronischen Klängen (und evtl. Geräuschen) erfolgt nach einem mehr oder weniger komplexen Verfahren. Vier Hauptkriterien sind dabei i.a. zu erfüllen (NOLL, 1994:128):

 

Bis vor wenigen Jahren war man aus technischen Gründen in der synthetischen Klangerzeugung fast ausschließlich auf die subtraktive Synthese angewiesen, um einen vernünftigen Rahmen an technischem und finanziellem Aufwand nicht zu überschreiten. Heute ist man in der Lage, theoretisch alle existierenden Syntheseformen auf digitaler Ebene zu realisieren. Die wichtigsten Syntheseformen, welche die zuvor beschriebenen Kriterien erfüllen, werden anschließend kurz umrissen:

Abbildung 3/1: MIDI-Synthese als zentrales Steuerungsorgan für sämtliche analoge und digitale, Hard- und Software Klangerzeugungssynthesen

3.2.1. Additive Synthese

Diese Verfahren wird auch "Fourier-Synthese" genannt: komplexe Schwingungen werden durch die Addition von einfachen Sinusschwingungen erzeugt, d.h. Klangspektren werden Oberton für Oberton aufgebaut. Jeder Obertongenerator (üblich 32, 64 oder 128) kann einzeln in seiner Amplitude reguliert werden, bis die gewünschte Klangfarbe erzielt ist. Naturinstrumente können analysiert und durch die Nachbildung des Teiltonspektrums resynthetisiert werden. Um diese technisch sehr aufwendige Syntheseform lebendiger zu gestalten und die stationären Anteile zu verkürzen, bedient man sich verschiedenster Nachbearbeitungsmethoden, wie separat programmierbarer Obertöne, der Kombination mehrerer Spektren, subtraktiver Nachbearbeitung, etc. Praktische Anwendung fand diese Art der Klangerzeugung lange Zeit beim Aufbau von Klangregistern in elektronischen Orgeln.

3.2.2. Subtraktive Synthese

Diese Syntheseform war lange bis zur revolutionierenden Digitaltechnik das einzige verfügbare Klangerzeugungsprinzip in Synthesizern, da es relativ einfach aus analogen spannungsgesteuerten Bausteinen realisiert werden konnte. Aus einem komplexen teiltonreichen Frequenzspektrum (z.B. Rauschen) werden durch Filterung unerwünschte Komponenten entfernt. Dieser Prozeß kann im Zeitverlauf durch Hüllkurven, Modulation und/oder andere Spielhilfen ("Controller") beeinflußt werden. Ein derartiges, modular aufgebautes Instrument besteht aus den Komponenten: Noise-Generator, Filter (VCF, DCF), Verstärker (VCA, DCA), Envelope-Generator (EG, Contour), Low Frequency Oscillator (LFO).

3.2.3. Frequenzmodulation-Synthese (FM-Synthese)

Die FM-Synthese wurde 1973 von John Chownig an der Universität Stanford (USA) entwickelt und wenig später von der japanischen Firma Yamaha patentiert. Klänge werden auf der Basis von Operatoren (Sinusoszillatoren und andere Wellenformen) erzeugt. Eine Trägerschwingung mit der gewünschten Tonhöhe (=Carrier) wird von einer anderen (=Modulator) verändert. Der Träger ist direkt mit dem Audioausgang verbunden, der Modulator ist nur in seiner Auswirkung auf den Träger hörbar. Darüber hinaus werden in der Praxis verschiedene Operatoren mit Rückkopplungsmöglichkeiten ausgestattet (bei Yamaha sogenannter "Algorithmus"). Die aktuelle Syntheseform wurde bei Yamaha in der SY-Serie in die Praxis umgesetzt: die AFM-Synthese (Advanced Frequency Modulation) erlaubt frei programmierbare Algorithmen sowie das Einbinden von gesampelten Wellenformen als Modulatoren.

3.2.4. Amplitudenmodulation-Synthese (AM-Synthese)

Diese Syntheseform wird häufig zur Erzeugung von Glockenklängen und anderen komplexen metallischen Klängen verwendet. Die Amplitude einer Trägerfrequenz wird zur Modulation verwendet. Das Verfahren gehört zu den ältesten Effekten der elektronischen Musik und ist in der Fernmeldetechnik als Ringmodulation bekannt. Das am Ausgang anliegende, als "Schwingungsmultiplikation" bezeichnete Signal setzt sich aus der Summe und der Differenz zweier Schwingungen zusammen, die beiden ursprünglichen Frequenzen werden dabei unterdrückt.

3.2.5. Phase-Distortion-Synthese (PD-Synthese)

Die Arbeitsweise der PD-Synthese ist stark an jene der FM-Synthese angelehnt. Eine Grundwellenform kann in einem "Wave-Shaper-Modul" dynamisch unter Zuhilfenahme verschiedener Parameter phasenverzerrt werden. Bei diesem Verfahren der "nonlinear distortion" (nichtlineare Verzerrung) werden sehr komplexe Spektren erzeugt. Der Klangcharakter der PD-Synthesizer ähnelt Geräten der FM-Synthese.

3.2.6. Linear Arithmetische Synthese (LA-Synthese)

Die "Linear Arithmetic Synthese" wird ausschließlich in Geräten der japanischen Firma Roland verwendet. Das Syntheseprinzip geht davon aus, daß der Mensch primär zur Erkennung des Musikinstrumententypus die Einschwingphase heranzieht, und nicht den (quasi-)stationären Klanganteil. Einschwingvorgänge (bzw. Attack-Phasen) verschiedenster Instrumente werden bei LA-Synthesizern digital gespeichert, der stationäre Anteil und die Ausklingphasen werden durch volldigitale, subtraktive Synthese realisiert. Die LA-Synthese resultiert also aus einer Kombination von PCM-Samples und subtraktiver Synthese.

3.2.7. Wavetable-Synthese

Die Wavetable- oder Wellenform-Synthese ist eine Klangerzeugung, die auf fertigen ROM-gespeicherten digitalen Wellenformen basiert, diese durch additive oder subtraktive Nachbearbeitung verändert und so neue Klangfarben erzeugt. Diese Syntheseform hat sich seit einigen Jahren sehr verbreitet und ist in der beschriebenen oder auch in einer leicht abgewandelten Form in den meisten modernen Synthesizer integriert.

3.2.8. Vektor-Synthese (VS)

Ein dreidimensionaler Vektor, der das Mischungsverhältnis zwischen vier unabhängigen Oszillatoren bzw. Tongeneratoren (XY-Funktion) über die Zeitachse (Z-Funktion) steuert, gibt dieser Art der Klangerzeugung den Namen. Erstmals wurde diese erweiterte Form der Wavetable Synthese 1986 im Prophet VS Synthesizer (Sequential Circuits) implementiert.

3.2.9. Sample-Synthese (Sampling)

Naturklänge werden digital aufgenommen (ADC), d.h. das Signal wird in eine Zahlenfolge transformiert und als solche gespeichert. Die dadurch gewonnenen Daten können, wie auch bei anderen Syntheseformen, durch digitale Filter, LFO’s, EG’s, etc. geformt und anschließend mit einem DAC in analoge Spannungen konvertiert werden. Die 1979 mit dem Fairlight CMI erstmals kommerziell eingeführte Syntheseform ist heute die wahrscheinlich am häufigsten verwendete Klangerzeugung in der professionellen elektronischen Musikproduktion. Sowohl RAM- als auch ROM-Sample-Geräte werden in großer Auswahl von verschiedensten Herstellern angeboten.

3.2.10. Granular-Synthese

Die Granular-Synthese stellt eine Erweiterung der Wavetable-Synthese dar, indem sie versucht, die starren Klänge der Wellenform-Synthese durch dynamische Veränderungen zu erweitern. Die elementaren Wellenformen werden in etwa 5-20 ms dauernde Grains oder Granules zerlegt; durch eine zeitliche Aneinanderreihung dieser Granulate entstehen lange Klänge mit dynamischen Klangveränderungen.

3.2.11. Karplus-Strong-Synthese

Diese Klangsynthese wird speziell für die Erzeugung perkussiven Tonmaterials, wie den Klang gezupfter Saiten oder Trommeln, angewendet. Ein digitales Verzögerungsglied (Delay), zeitgleich mit der Periodendauer des gewünschten Tones, wird mit einem von einem Zufallszahlengenerator erzeugten Rauschsignal gefüllt. Während dieses Vorganges wird der Rauschgenerator ausgeschaltet und der Ausgang durch ein Lowpass-Filter zurück in das Zeitverzögerungsglied geschickt. Bei jedem Durchgang durch diese Schleife verliert das Signal Frequenzanteile im oberen Bereich (ACKERMANN, 1991: 115-116). Die auf diese Weise erzeugten Klänge klingen, verglichen mit anderen Syntheseformen, besonders dynamisch.

3.2.12. Resynthese

Ein vorliegender Klang wird im Zeitbereich mit Hilfe einer Fouriertransformation nach Spektralkomponenten im Frequenzbereich analysiert. Bei nicht stationären Klängen muß dies in kontinuierlichen, kurzen Zeitabständen erfolgen, um dynamische Werte der verschiedenen Spektren für die Berechnung von Amplituden- und Frequenzhüllkurven zu erhalten. Nach dem Prinzip der additiven Synthese werden die so berechneten Hüllkurven mit Hilfe vieler Sinusoszillatoren reproduziert (bzw. resynthetisiert). Der eigentliche Nutzen der Resynthese besteht nicht darin, Klänge ausschließlich zu reproduzieren. Der große Vorteil liegt in der direkten Beeinflußbarkeit jeder Sinuskomponente und Hüllkurve und damit in der enormen Flexibilität der Klanggestaltung (z.B.: "Phasenvocoder").

3.2.13 Time Slice-Synthese

Mehrere starre Frequenzspektren werden, ähnlich wie bei der Granular-Synthese, zeitlich hintereinander angeordnet und durch Interpolation ineinander überblendet. Die dabei gewonnenen Wellenformen können wiederum als Ausgangsmaterial für eine weitere Verarbeitung dienen.

3.2.14 Software-Synthesesysteme

Schon in den späten 50er Jahren kam es zur Entwicklung von Softwaresystemen in der Computermusik (ACKERMANN, 1991: 145ff). Entsprechend groß ist gegenwärtig das Angebot dieser Syntheseform. Die Erzeugung der Klangdaten ist sehr komplex und beansprucht entsprechende Rechenzeiten. Darum handelt es sich um sogenannte "Non-Realtime-Systeme", d.h. die akustische Ausgabe erfolgt nicht simultan mit der Klanggenerierung. Exemplarisch sollen einige Softwaresysteme aufgelistet werden:

Erst seit wenigen Jahren stehen leistungsstarke Prozessoren zur Verfügung, die in der Lage sind, Klänge in Echtzeit zu generieren (z.B.: Motorola 56001 DSP, Dreams SAM 8905, u.a.).

 


 

Viertes Kapitel

Die Aufnahme mit MIDI

Der MIDI-Sequenzer

 

4. Die Aufnahme mit MIDI

Beschäftigten sich die vorigen Kapitel mit historischen Abhandlungen und allgemein gehaltenen Spezifikationen zum Thema MIDI, so wird in diesem Abschnitt ein spezieller Bereich des praktischen Einsatzes behandelt: der Sequenzer.

Eine intensive Nutzung dieses Aufzeichnungsverfahrens begann lange vor dem digitalen MIDI-Standard. In den 60er-Jahren wurden elektronische Synthesizer mit Analogsequenzern ausgestattet (Moog, ARP, Polyfusion, E-mu), die manuell vorjustierte Triggersignale und Steuerspannungen repetativ generierten. Die maximale Anzahl an gespielten Noten war durch die entsprechenden Regelelemente am Instrument allerdings beschränkt. Der erste auf einem Honeywell-Computer DDP-224 implementierte Sequenzer wurde 1970 von Max Mathews vorgestellt: "GROOVE" (Generated Real-time Output Operations on Voltage-controlled Equipment) regelte via Steuerspannungen einen analogen Synthesizer (ACKERMANN, 1991: 255-256). Die Entwicklung von Sequenzern wurde in dieser Zeit u.a. von den Anforderungen der musizierenden Öffentlichkeit an Rhythmusmaschinen und Begleitautomationen vorangetrieben. Der Einsatz von vorproduzierten Sequenzer-Rhythmuspatterns und Sequenzer-Baßlinien unterstützte ein neues Segment im Popularmusikbereich, jenes des "Elektronenorgel-Alleinunterhalters". Für damalige Verhältnisse hochtechnisierte Instrumente lieferten ensemblehafte Klangkulissen, obgleich nur von einer Person bedient. Das erste Gerät, mit dem man eine Sequenz in Echtzeit einspielen konnte, war der 1976 vorgestellte E-mu "4060". Mit der Mikrochip-Technologie wurden leistungsfähigere Sequenzer in Synthesizer eingebaut, sogenannte "Hardware-Sequenzer" ("Software-Sequenzer" bewerkstelligen eine Steuerung von externen Computern via Datenleitung).

4.1. Der MIDI-Sequenzer

Die ersten MIDI-Sequenzer waren jene des Hardwaretypus. Die Daten wurden dabei auf herkömmlichen Cassettenrecordern gespeichert. Hardware-Sequenzer der Gegenwart werden mit großen RAM-Speicherbausteinen (für bis zu 100.000 Noten- oder Controller-Werte oder mehr) und meist mit Diskettenlaufwerk ausgestattet, um auch umfangreiche Musikkompositionen bewältigen zu können. Breite Akzeptanz fand der MIDI-Sequenzer mit der Etablierung von preiswerten und leistungsfähigen Softwaresystemen ab Mitte der 80er Jahre. Unterstützt wurde dieser Trend (vor allem in Europa) von der "Low Budget"-Preispolitik der Firma Atari, die rasch auf die große Nachfrage reagierte und standardmäßig ihre Computer der 1040 ST-Baureihe mit einer MIDI-Schnittstelle ausrüstete. Das erste echte MIDI-Sequenzerprogramm, "MIDI/4" von der Firma Passport, wurde aber für APPLE-Computer Anfang 1984 am Markt präsentiert. Opcode, Dr. T’s und Marc of the Unicorn waren weitere Apple-Softwareanbieter, die ihre Produkte primär im nordamerikanischen Raum verkauften. Denen gegenüber stehen die deutschen Firmen Jellinghaus, Steinberg und C-LAB (1992 von "Emagic" übernommen), die sich am europäischen Markt (anfänglich mit Sequenzersoftware für Atari-Computer) durchsetzen konnten. Nach und nach wurden die einzelnen Programme den drei häufigsten Computerplattformen (IBM-PC, Apple-Mac und Atari) angepaßt, so daß gegenwärtig die populärsten Sequenzerprogramme für diese Computersysteme käuflich erhältlich sind.

Anschließend ein kurzer tabellarischer Überblick über die gebräuchlichsten am Markt befindlichen Software-Sequenzer mit Angabe der unterstützten Computertypen (Primärquellen: ACKERMANN, 1991: 310-311; GORGES/ MERCK, 1993: 326-333; JACOBS/ GEORGHIADES, 1991: 102-104; div. Hersteller-unterlagen):

Sequenzer-Herstellerfirma

Produktname

IBM-PC

Apple

Atari

sonst.

Big Noise

Cadenza

x

-

-

-

Blue Ribbon

Bars and Pipes

-

-

-

C/Ami

C-LAB Software, Hamburg

(bis 1992, dann: Emagic)

Creator

Notator

-

-

-

-

x

x

-

-

Coda Music, Minneapolis

Finale

Music Prose

-

-

x

x

-

-

-

NeXT

Digital Music

Genesis

x

-

-

-

Dr. T’s Music, Massachusetts

Beyond

KCS

Tiger Cub

Quick Score Pro 4.0

-

-

-

x

x

x

-

-

-

x

x

-

-

C/Ami

C/Ami

-

Dynaware

Ballade

x

-

-

-

Emagic

Notator Logic 2.0

x

x

x

P.-PC

G.C. Geerdes

Star-Track

Delight

-

-

-

-

x

x

-

-

Hybrid Arts Software

SMPTE-Track II

-

-

x

-

Jim Miller

Personal Composer

x

-

-

-

Marc of the Unicorn, MA

Performer

Profess. Composer

-

-

x

x

-

-

-

-

MicroIllusion

Music X

-

-

-

x

Opcode Systems, California

Vision

x

x

-

-

Passport Designs, California

Encore

Pro 4

Master Tracks Pro

Trax

x

-

x

x

x

x

x

x

x

-

x

x

-

-

x

-

Soft Arts

Live

Score Perfect Pro.

-

x

-

x

x

x

-

-

Steinberg GmbH, Hamburg

Cubase (-Audio)

Cubase Score

Twentyfour

x

x

-

x

x

-

x

x

x

-

-

C/Ami

Twelve Tone Systems, MA

Cakewalk Profess.

x

-

-

-

Voyetra

Sequencer Plus

x

-

-

-

(x = unterstützt, - = nicht unterstützt; Abkürzungen: P.-PC = Power PC, C/Ami = Commodore/ Amiga)

Tabelle 4/1: Übersicht gängiger Softwaresequenzer

4.1.1. Die Funktionsweise eines Software-Sequenzers

Grundsätzlich funktioniert ein MIDI-Sequenzer nach dem Prinzip eines herkömmlichen Mehrspur-Tonbandgerätes: hier wie dort werden eine größere Anzahl an Aufnahmespuren im Computerprogramm definiert, die einen parallelen mehrkanaligen Aufnahme- und Wiedergabebetrieb ermöglichen. Auch die ikonographischen Gestaltungen der (WIMP-)Funktionstasten sind üblicherweise dem Bedienfeld einer Bandmaschine oder eines Cassettengerätes nachempfunden (siehe Abbildungen 4/2 und 4/3). Der wesentliche Unterschied zu konventionellen Aufnahmeverfahren ist das Faktum, daß ein MIDI-Sequenzer ausschließlich MIDI-Befehle (in binärem Datenformat) in Echtzeit oder auch schrittweise aufzeichnen und wiedergeben kann, dabei aber keine Audiosignale intern verwaltet. Diese Tatsache bringt einige Vorteile gegenüber "physikalischen" Aufnahmen mit sich:

 

Die wichtigsten formalen Elemente des Sequenzers, die ein einwandfreies Funktionieren sichern, sind (neben den bereits besprochenen Hardware- und Softwareanforderungen) die Organisation der Aufnahmespuren, das "Tempo" (Systemtakt, "Tick", Auflösung, Quantisierung) und die verschiedenen Editoren (Nachbearbeitung, Notendarstellung, etc.).

4.1.2. Die Sequenzerspuren

Stand vor der Einführung von MIDI und ganz zu Beginn des MIDI-Sequenzerzeitalters obligat nur eine einzige Aufnahmespur zur Verfügung, so kann man bei gegenwärtigen modernen Produkten auf zumindest 16 Spuren aufzeichnen und simultan wiedergeben. Professionelle Anbieter vertreiben i.a. keine Sequenzersoftware mit weniger als 64 Spuren, manche Programme können sogar (zumindest theoretisch) beliebig viele Spuren verwalten.

Die am MIDI-In-Anschluß eingehenden Daten werden - entsprechend der gewählten Vorgabe - einer Spur ("Track") zugeordnet. Dem Sequenzer obliegt nun die Aufgabe, die als binärer Kode vorliegenden MIDI-Events (Note-On, Note-Off, Controller, etc.) versehen mit einer zeitlichen Entsprechung (Systemtakt) zu speichern. Liegen diese Informationen systemintern gespeichert vor, so können sie umgehend einer kumulativen (z.B. "step-by-step"), destruktiven oder auch einer dissoziativen Weiterverarbeitung zugeführt bzw. unter Anwahl des richtigen MIDI-Ausgangs (z.B. Standard MIDI-Out, PC-Soundkarte, MPU, etc.) und einer entsprechenden Peripheriegerät-Adressierung (MIDI-Kanal des externen Tonerzeugers) unmittelbar wiedergegeben werden.

Üblicherweise wird jede Spur einem MIDI-Kanal zugeordnet, um ein einzelnes Instrument anzusteuern. Es ist aber ebenso möglich, mehrere Spuren einem einzigen MIDI-Kanal und damit ein und dem selben Instrument zuzuordnen. Begrenzt ist diese Möglichkeit lediglich durch die Anzahl der verfügbaren Stimmen ("voices") des Klangerzeugers (oder "Soundmodul"). Die meisten MIDI-Instrumente verfügen über 16 bis 32 Stimmen, wenige Ausnahmen sind mit 64 Stimmen ausgestattet. Ein- oder wenigstimmige Soundmodule sind aus der Vergangenheit bekannt und teilweise aus verschiedensten Gründen noch im Einsatz (argumentiert wird u.a. mit: "warmer", analoger Klang, Liebhaberei, etc.). Eine aktuelle Besonderheit stellt der einstimmige "Virtual Acoustic Synthesizer" VL1 von Yamaha dar, der neben bekannten Syntheseformen erstmals im kommerziellen Bereich auf sogenanntes "physical Modelling" zurückgreift (WAEHNELDT. in: KEYBOARDS, 1994/1: 48-58).

Darüber hinaus können einzelne Spuren zu Gruppen verknüpft werden, um einfacher manipulieren zu können oder auch, um bestimmte, zusammengehörige Instrumentengruppen zusammenzufassen (Streichinstrumente, Holzbläser, Schlaginstrumente, etc.). In einer weiteren Funktion ("Mixdown") können diese Gruppenspuren - vergleichbar mit der Endabmischung einer Mehrspurproduktion - zu einer einzigen Summenspur vereinigt werden. Neben den herkömmlichen MIDI-Aufnahmespuren können in verschiedensten Sequenzerprogrammen noch andere, seltener verwendete Spur-Klassen vorkommen. Der Vollständigkeit halber sollen einige davon erwähnt werden, eine genauere Beschreibung erfolgt in diesem Zusammenhang notwendigerweise nicht:

Abbildung 4/2: Programmoberfläche des Sequenzers "Cubase Score":

Abbildung 4/3: Programmoberfäche des Sequenzers "Cakewalk Professional".

Der prinzipielle graphische und logische Aufbau entspricht dem zuvor angeführten Programm: "Roll-Down-Menüleiste", Transportfeld und Sequenzerspuren im Taktraster.

4.1.3. Physikalisch-rhythmische Auflösung des Tempos

Ein wichtiges Kriterium für die funktionale Beurteilung von Sequenzern ist das rhythmische Auflösungsvermögen, um eine möglichst hohe Aufnahme- und Wiedergabegenauigkeit zu gewährleisten. Als Maß der Analogie dafür haben die Hersteller den PPQ-Wert eingeführt, der die Anzahl der "Ticks" pro Viertelnote angibt. Dabei übliche Werte liegen im Bereich von 384 (192) "Ticks" (z.B. Cubase) und 480 (240) "Ticks" (z.B. Cakewalk), d.h. ein Takt wird in 1536 bis 1920 Zeitpunkte aufgerastert. Bei einem gewählten mittleren Tempo von ca. 120 Viertelnoten in der Minute kommt ein "Tick" etwa einer 1024stel Note gleich (entspricht ca. 1,3 Millisekunden bei 384 PPQ).

Der Vorteil dieser Methode, das Tempo in "Ticks" zu zählen, liegt darin, daß der Sequenzer nicht an ein absolutes Zeitmaß gebunden ist. Der Anwender kann das Tempo bei Aufnahme und Wiedergabe beliebig wählen; dadurch ist es auch möglich, kontinuierliche Tempoverläufe (affrettando, allentando, calando, rallentando, ritardando, ritenuto, etc.) in der sogenannten Master-Spur zu erzeugen. Jede hereinkommende MIDI-Note wird auf das nächst höhere "Tick" im Systemtakt aufgerundet. Den Rundungsfehler dieser Abweichung von der tatsächlichen Eingabe nennt man Quantisierungsfehler. Bei professionellen Produkten liegt dieser systematische Fehler bei durchschnittlichen Wiedergabetempi deutlich unter einer Millisekunde. Bei extrem langsamen Tempi (ca. 40-50 Viertelnoten pro Minute) kann der Quantisierungsfehler auf maximal zwei Millisekunden anwachsen, bei älteren oder amateurhaften Produkten mit einer Auflösung von (24) 48 bis 96 PPQ kann der Fehler bei ca. 16 ms liegen.

4.2. Die Editoren

Das Herzstück jedes MIDI-Sequenzers bildet die Möglichkeit einer Nachbearbeitung. Sind die technisch-physikalischen Voraussetzungen einer exakten Datenaufzeichnung erfüllt, so ist die Leistungsfähigkeit von "Song-" und "Noteneditoren" als Maß einer funktionalen Bewertung heranzuziehen. Die käuflichen Produkte stellen dabei eine unterschiedliche Anzahl an "Werkzeugen" zur Verfügung, die dem Bearbeiter vielfältige Mittel zur nachträglichen Manipulation und zur graphischen Darstellung bieten.

4.2.1. Der Event-Editor (Grid-Editor)

Wohl kaum ein Sequenzer, der die Bezeichnung professionell für sich beansprucht, bietet diese Darstellungsform nicht. Die MIDI-Nachrichten und deren Parameter werden dabei zeitlich gereiht in alphanumerischer Form tabellarisch aufgelistet (Abbildung 4/4):

Abbildung 4/4: Event-Editor des Sequenzers "Master Tracks Pro"

Der hier exemplarisch abgebildete Event-Editor der ersten Spur eines Sequenzer-Songs besteht nebst der "WIMP"-Funktionsleiste aus folgenden Einträgen:

Spalte 1: Event-Typus (Note, Controller, etc.): in diesem Falle MIDI-Noten.

Spalte 2: gibt die Note-On-Position in der Zeitachse (Takt:Viertelnote:PPQ) an.

Spalte 3: MIDI-Kanal.

Spalte 4: Note (musikalische Tonhöhe).

Spalte 5: Dynamik "Note-On" (Velocity).

Spalte 6: Dynamik "Note-Off" (Velocity).

Spalte 7: Notenlänge (Takt:Viertelnoten:PPQ).

Alle Werte lassen sich verändern, Einspielfehler, Dynamikwerte, Notenlängen etc. können gezielt korrigiert werden. Die Funktion des "Quantisierens" wird in einem zentralen Kapitel dieser Arbeit genau besprochen.

4.2.2. Der Matrix-Editor (Key-Editor)

Dieser Editor stellt die über die Zeitachse angeordneten "Note Events" in Bezug zu einer die relative Tonhöhe repräsentierenden Klaviertastatur dar. Die Noten werden durch horizontale Balken symbolisiert, die abhängig von ihrer Tonhöhe, Tondauer und zeitlichen Abfolge im Bildschirmfenster positioniert sind. Zusätzlich kann die Anschlagstärke (Velocity) je nach Programm entweder durch unterschiedlichen Schwärzungsgrad oder durch Balken am unteren Fensterrand graphisch angezeigt werden (Siehe z.B. "Drum Editor" des Sequenzer Cubase Score Abbildung 4/7).

Abbildung 4/5: Der Matrix Editor (bzw. "Piano Roll" oder "Key-Editor") des Sequenzers "Cakewalk Professional".

Praktisch identisch mit dem Event-Editor können auch hier Noten oder Notengruppen sowohl in der Zeitachse als auch in der Tonhöhe verschoben werden. Nach Belieben kann kopiert, gelöscht oder eingefügt werden, jeder verfügbare Parameter ist in einem vorbestimmten Wertebereich veränderbar.

4.2.3. Der Noteneditor (Score Editor)

Die gegenwärtige Notendarstellung bildet die Grundlage dieser Benutzeroberfläche. MIDI-Note-Events einer oder mehrerer Sequenzerspuren werden als Notat dargestellt, ganze Partituren können erstellt und bearbeitet werden. Wiederum sind praktisch alle Möglichkeiten einer Bearbeitung möglich, d.h. die grundsätzliche Funktion innerhalb des Programms ist die gleiche geblieben, lediglich die Art der graphischen Darstellung ist eine Andere. Viele Software-Sequenzer weisen zusätzlich zur Notendarstellung und -bearbeitung die Eignung zum Notendruck auf. Vielfach besser sind allerdings spezielle, für diesen Zweck bestimmte Notensatz- bzw. Notationsprogramme, die anspruchsvolleren Bedürfnissen und Anforderungen eher gerecht werden. Neben jenen im MIDI-Verbund arbeitenden Notenschreibprogrammen gibt es auch Notensatz-Software ohne MIDI-Fähigkeiten. Die Eingabe des Notentextes erfolgt hier über die Computertastatur oder heutzutage immer mehr durch Mausmanipulationen.

Abbildung 4/6: Der Noten Editor des Programms "Encore" am Beispiel der zweistimmigen Invention in a-Moll (J. S. Bach BWV 784).

Das Programm bietet im Roll-Down-Menü reichlich graphische Symbole, Textverarbeitung, Dynamik- und Notenzeichen u.v.a. zur Bearbeitung eines Notentextes an.

Doch auch die modernsten Notendruckprogramme weisen einige von Musikkritikern und Programmanwendern aufgezeigte Mängel auf. Die größten Probleme treten bei rhythmischen Darstellungen (interpretatorische Feinheiten), bei der Vorzeichensetzung (enharmonische Verwechslungen), bei Tempoänderungen (accelerando und ritardando), bei Dynamikbezeichnungen (Velocity bei MIDI entspricht selten der Dynamik in Notentexten), beim Zeilen- und Seitenumbruch sowie bei der Verbindung und Ausrichtung von Notenhälsen im Interesse der musikalischen Lesbarkeit auf.

4.2.4. Der Schlagzeugeditor (Drum Editor, Percussion Editor)

Im MIDI-Standard (GM, GS) werden Schlagzeugklänge und Klänge von Perkussions-Instrumenten durch Tastenzuordnung identifiziert, d.h. jede MIDI-Note entspricht einem bestimmten Sound bzw. Instrumententeil (z.B. General MIDI-Standard: C1=Bassdrum, C#1=Stick, D1=Snaredrum, D#1=Handclap, F1=Low Floortom, F#1=Hihat closed, usw.). Wird eine Schlagzeugspur über eine MIDI-Tastatur eingespielt, so ist es sinnvoll, wenn im Schlagzeugeditor eines Sequenzers eine sogenannte "Drum-Map" erstellt wird. In dieser Liste stimmt jede MIDI-Note mit einer Zeile und damit einem (ev. dem GM-Standard entsprechenden) Instrument überein. Diese Art der Darstellung gibt eine gute Übersicht über die bei der Aufnahme zur Verfügung stehenden Schlaginstrumente sowie deren Einsatz, dargestellt entlang der horizontalen Zeitachse (siehe Abbildung 4/7).

Abbildung 4/7: Drum Editor in "Cubase Score".

Links befindet sich die beliebig zusammenstellbare "Drum-Map", rechts daneben werden die aufgezeichneten Note-Events abgebildet und editiert. Der Grad der Schwärzung und die darunterliegenden Balkendarstellungen dienen als Indikator für die Dynamik (Velocity) des jeweils aktiven Schlaginstruments (Spur: "Hi Hat Clos"). Auch andere MIDI-Controller können im unteren Feld graphisch dargestellt werden.

Bei der Betrachtung des abgebildeten Schlagzeug-Editors fällt auf, daß sich die graphische Darstellung lediglich auf rautenförmige Symbole beschränkt, die Notenlängen können lediglich in der "Drum-Map" nachgelesen werden. Der eingestellte Wert von 32 PPQ entspricht bei einer von Cubase verwendeten Auflösung von 384 PPQ einer 1/48stel Note, also einem sehr kleinen Notenwert. Dies ist insofern sinnvoll, da im Schlagzeug-Editor i.a. nur perkussive Klänge mit einer kurzen Attackzeit (Einschwingphase) von wenigen Millisekunden bearbeitet werden, und aus diesem Grund keine großen Notenlängen notwendig sind.

4.2.5. Der Controller-Editor

Es ist nicht immer nur ein Anliegen, Noten in ihrer Position zu verschieben, sie zu transponieren, Anschlagstärken zu variieren etc. Es gibt noch andere MIDI-Events, die unter gewissen Umständen nachbearbeitet werden. Besonders die Controller-Werte sind davon betroffen. Aus diesem Grunde wurden teils eigene Controller-Editoren in Software-Sequenzern implementiert, teils wurden verschiedenste Bearbeitungsmöglichkeiten in bereits bestehenden Editoren integriert, wie z.B. Abbildung 4/7 zeigt: im Feld unterhalb der Note-Events lassen sich praktisch alle gängigen Contoller-Werte graphisch darstellen und per Maus editieren. Eine ähnliche Möglichkeit bietet der sogenannte MIDI-Mixer. Die mischpultähnliche Programmoberfläche setzt sich aus zahlreichen Schiebereglern zusammen, die per Maussteuerung in Echtzeit MIDI-Befehle (meist Controller Nummer 7: Gesamtlautstärke oder "Channel-Volume") ausführen. Die Bewegungen lassen sich auf einer Sequenzerspur aufzeichnen, so daß eine MIDI-interne "Mischpult-Automatisation" zur Verfügung steht. Werden Controller-Werte, wie Velocity-Verläufe, Pitchbender, Aftertouch, Modulation, usw. in einer Liniengraphik oder Balkengraphik nacheditiert, so kann es zu größeren Datenmengen kommen, da auch im sogenannten "Running Status" jede Werteänderung das Setzen eines neuen Datenbytes bewirkt, um einen kontinuierlichen Verlauf zu erzielen. Auf diese Weise lassen sich relativ einfach Funktionen wie Fade-In, Fade-Out, Kompression usw. realisieren.

4.2.6. Der logische Editor

Nicht alle Bearbeitungswünsche lassen sich unter Zuhilfenahme einer graphischen Darstellungsform in die Tat umsetzen. Das Editieren wird vor allem dann eine zeitaufwendige Angelegenheit, wenn es sich um die gleichzeitige Bearbeitung einer größeren Anzahl von MIDI-Events handelt. Aus diesem Grunde haben verschiedene Hersteller einen Editor entworfen, der sich grundlegend von allen zuvor besprochenen Bearbeitungsmöglichkeiten unterscheidet: er basiert auf logischen Verknüpfungen und funktioniert nach mathematischen Kriterien. In dieser Art von Editor stehen zur Manipulation der MIDI-Noten und Controller-Werte weder Notendarstellungen, noch andere animierende Graphiken zur Verfügung (siehe Abbildung 4/8).

Das Programm "Cakewalk Professional" von Twelve Tone Systems bietet zum Beispiel für derlei logische Operationen eine leistungsfähige Programmiersprache, die Cakewalk Application Language (CAL): in an die Programmiersprache "C" angelehnten Makros können logische Routinen anhand vorgegebener Algorithmen erstellt werden und einer Spur oder nur einem Bereich zugeordnet werden (NOLL, 1990: 239). Weniger in Informatik Geschulte können bei anderen Programmen auf benutzergeführte logische Editoren zurückgreifen:

Der Sequenzer "Cubase Score" bietet die Möglichkeit, anhand eines vorjustierten Rasters Veränderungen vorzunehmen (Abbildung 4/8):

Abbildung 4/8: Der Logical Editor des Sequenzers "Cubase Score"

Zeile "Auswählen": im Bereich "Violine", Takt 1 bis 3, sind alle "C3"-Noten auf MIDI-Kanal 1, mit einer Velocity von über 65 und einer Notenlänge über 2 PPQ ausgewählt.

Zeile "Verändern": Der Eventtyp (Note) wird beibehalten, "falsche" Noten werden durch eine Skalenkorrektur (Mixolydisch C) berichtigt, die Velocity (Wert 2) wird für alle C3-Noten um 35 erhöht, der MIDI-Kanal auf 1 gesetzt, und die Notenlänge mit 192 PPQ festgelegt.

Aufgrund der in der letzten Zeile angewählten Funktion "Transformieren", wird die Operation nach dem Kommando "Ausführen" vollzogen.

Dem Benützer werden vom Programm zahlreiche Möglichkeiten der Editierung angeboten; die am häufigsten angewendeten sind u.a. das gleichzeitige Löschen oder Transponieren von mehreren Noten und die Skalenkorrektur.

Die kurze exemplarische Vorstellung verschiedener Editoren dient als Grundlage für die experimentelle Anwendung des MIDI-Sequenzers, die in den anschließenden Abschnitten diskutiert wird. Explizite, herstellerspezifische Details wurden in dieser Einführung nicht berücksichtigt. Bezüglich offener Fragen sei auf Handbücher und Herstellerunterlagen des jeweils verwendeten Sequenzer-Programms, sowie auf die zitierte Literatur zum Thema MIDI verwiesen (Ackermann, Aichler, Braut, Ekkehard, Gorges, Lorenz, Micklisch, Noll, Penfold, Schaffrath, Vollmuth, u.a.; siehe Literaturverzeichnis).

 


 

Fünftes Kapitel

Metrische Strukturen im MIDI-Sequenzer

Quantisierungen und DNA-Grooves

 

5. Metrische Strukturen im MIDI-Sequenzer

5.1. Rhythmus und Metrum: Allgemeines

Jedes spezifische, akustische Schallereignis bedarf einer Minimaldauer, um überhaupt auditiv wahrnehmbar zu sein. Die hörbare Länge eines Klangereignisses differiert; begründet ist dies im Zusammenwirken von Faktoren, wie Frequenzspektrum, Tonhöhe und diverser Umwelteinflüsse (z.B. maskierende Störgrößen) (COGAN, 1984: 141ff). Abgesehen von der Problematik der Erfaßbarkeit ist Rhythmus zweifelsohne ein vielschichtiger Begriff, der im umgangssprachlich-musikalischen Bereich obligat als vorstellungsstereotyper Terminus, ohne weitere Reflexion verwendet wird. Die große Anzahl an Wortbestimmungen im musikwissenschaftlichen Diskurs verdeutlicht aber die Definitionsproblematik (SACHS, 1953). Immer wieder stößt man auf den zentralen Sachverhalt der umstrittenen Abgrenzung der Begriffe Rhythmus und Metrum. So diskutierten Gerstenberger und Dürr (1963) in ihrer Untersuchung die völlig konträren Ansichten der Musiktheoretiker Husman (1958), Riemann (1903), Schneider (1958), Metzger (1963) und Klages (1934). (MARIAN, 1989:18-19)

Einigkeit scheint lediglich über die Verbundenheit der musikalischen Phänomene Rhythmus, Metrum und Takt als für die in der Zeitdimension maßgeblich zu herrschen, sieht man etwa von z.B. NEUMANN, (1959) und WELLEK, (1963) ab, die darüber hinaus die Begriffe "Zeitgestalt" bzw. "musikalische Zeit" einführen. M. HAUPTMANN (1853) ging in einer noch gegenwärtig verwendeten operationalen Definition davon aus, daß Rhythmus die Art der Bewegung im ständigen Maß des Metrums ist, das Metrum also ein Bezugssystem darstellt.

Nach GABRIELSSON (1973) bildet der Rhythmus die Grundlage für die Erfahrung folgender Eigenschaften in der Musik:

1. Struktureller Aspekt: - Takteinheiten

- Akzente

- Komplexitätsgrad

2. Motivationaler Aspekt: - wahrgenommenes Tempo

3. Emotionaler Aspekt: - vital/ langweilig

- aufregend/ ruhig

Ein weiterer Beitrag zur Klassifikation musikalischer Rhythmen, jener von Helga de la MOTTE-HABER (1968) bestreitet nicht nur die wissenschaftliche Untermauerung der Systematisierung RIEMANNs (1903), sondern liefert auch Befunde über die Prägnanz verschiedenster musikalischer Begriffe, bezogen auf den Terminus Rhythmus. Die höchsten Affinitäten weisen dabei die beiden Begriffe Allegro und Presto auf; offensichtlich dürfte der Rhythmusbegriff i.A. mit der Vorstellung des Schnellen korrelieren. Riemann hatte die Tempobeurteilung von Rhythmen als die "Wertung der den Rhythmus eines Tonstückes beherrschenden mittleren Zeiten an dem normalen Mittelmaß des gesunden Pulses" (RIEMANN, 1903: 7) beschrieben, bei H. MOTTE-HABER (1968: 92-98) werden die Durchschnittsprofile dieser mittleren Tempi entweder mit sehr geringer Korrelation (Andante) bzw. überhaupt mit negativer Korrelation (Adagio) ausgewiesen.

Aktuelle Aspekte der Rhythmusforschung wurden von der Royal Swedish Academy of Music publiziert (SUNDBERG, 1983). In dieser analytischen Konzeption steht die Unterscheidung der rhythmischen Dauer nach drei verschiedenen Ansatzpunkten im Vordergrund: die Tondauer als solche, die Zeitspanne zwischen zwei Tönen (Pausendauer) und die Periodendauer vom Einsatzpunkt eines Tones bis zum nächsten Einsatzpunkt. Dieser Ansatz unterstreicht die Wichtigkeit der auditiven Pause in der Rhythmusforschung. Der Hauptversuch dieser Arbeit (7. Kapitel) stützt sich neben einem später besprochenen psychoakustischen Modell auf Aspekte der Rhythmusforschung hinsichtlich der musikalischen Artikulation: die musikalische Notation und Aufführungspraxis kommt den erwähnten Konzepten rhythmischer Dauer durch die Verwendung der Artikulationen "legato", "portato" und "staccato" nach.

Eine Operationalisierung des Terminus Rhythmus für diese vorliegende Arbeit lautet verbaliter:

Rhythmus wird dann objektiv (unabhängig vom Tempo) wahrgenommen, wenn in einer Folge von Schallereignissen ein Ton gegenüber einem anderen verlängert wird, lauter ist oder sich in seiner Klangfarbe oder Tonhöhe deutlich von anderen abhebt. Eine Modifikation des vorliegenden rhythmisierten Musikmaterials gegenüber der Regulierungsfunktion - dem Metrum - wird als interpretatorisch-musikalischer Aspekt empfunden.

Eine subjektive Rezeption kann auch ohne zuvor genannte Faktoren der Akzentuierung erfolgen. Hat sich eine subjektive Rhythmisierung eingestellt, so neigt der Mensch dazu, sie beizubehalten, auch wenn sich der Rhythmus objektiv geändert hat (BECK, in: BRUHN/ OERTER/ ROESING, 1993: 459-466).

Im konkreten Fall: Hat sich der Rezipient mit einem bestimmten rhythmischen Pattern (z.B. eines MIDI-Sequenzers) vertraut gemacht, so bedarf es bei einer Akzentuierungsänderung einer entsprechend großen Varianz, um die Unterschiedsschwelle (JND) in der rhythmischen Wahrnehmung des Menschen anhand dieser Modifizierung zu überschreiten.

Bezüglich dieser operationalen Definition gilt es einige bekannte konstitutive Erkenntnisse festzuhalten, die gewissermaßen als Nährboden einer Diskussion über metrische Strukturen und Notenlängen im MIDI-Sequenzer dienen.

5.2. Neurobiologische Aspekte in der Rhythmusforschung

Die zeitliche Verarbeitung von akustischen Reizen ist ein bedeutender Bereich in der musikalischen Rhythmusforschung. Im Vordergrund stehen dabei die Bildung kognitiver Verarbeitungseinheiten nach physischen Merkmalen und musikalisch-zeitgebunden Strukturen.

E. PÖPPEL (1988: 31-49) hat in diesem Zusammenhang eine fünfstufige Klassifikation subjektiver Zeitphänomene beschrieben:

1. Gleichzeitigkeit: 0 ms, maximal 2 bis 5 ms Zeitdifferenz zwischen zwei akustischen Reizen. Es kann nur ein Schallereignis perzeptiv wahrgenommen werden.

2. Ungleichzeitigkeit 2 bis 5 ms Zeitdifferenz bzw. Unwesentlich größer als 5 ms. Eine eindeutige Reihung der Klänge läßt sich nicht etablieren.

3. Aufeinanderfolge "Ordnungsschwelle" ab 30-50 ms. Eine Reihungsrelation kann erfolgen.

4. Gegenwart Präsenzzeit ca. 3-5 Sekunden ("Wahrnehmungseinheiten"). Töne werden zu Wahrnehmungsgestalten zusammengefaßt.

5. Dauer Zeitphänomene größer als die Präsenzzeit werden in der Wahrnehmung verzerrt.

Ergänzend zu dieser Aufstellung ist zu bemerken, daß die Einschwingzeit eines Klanges im zeitlichen Bezug eine wichtige Rolle spielt. Dieser Prozeß in der Entfaltung eines Klangspektrums stellt eine fundamentale Begrenzung in der Tonhöhen- und Klangwahrnehmung dar. Um die Tonhöhe eines Klanges zu erkennen, muß eine Mindestanzahl an Schwingungsperioden rezipiert werden. Die Tonkennzeit für einen tiefen Klang ist entsprechend höher als bei einem hochfrequenten Schallereignis (DODGE/ JERSE, 1985: 46) (siehe Abbildung 5/1: minimale Tonkennzeiten) Das absolute Minimum der Tondauer liegt nach OLSON (1967) bei ca. 13 Millisekunden in einem Bereich von etwa 2000 Hertz.

Abbildung 5/1: Bereich minimaler Tonkennzeiten verschiedenfrequenter Klänge, nach MEYER-EPPLER (1954: 29-39) bzw. David BUTLER (1992: 89-90).

Die zuvor aufgezeigten Fakten zeigen deutlich, daß die menschlich-perzeptive Bewußtseinsbildung von musikalischer Rhythmik vorrangig in kurzen Zeitspannen erfolgt. In der Verarbeitung akustischer Reizpaare oder in der Erfassung von Abweichungen gegenüber vorgegebenen rhythmischen Mustern erweist sich das Gehör als äußerst sensibles Organ (MARIAN, 1989: 75-80).

Die Studie von Peretz & Morais (in: BRUHN/ OERTER/ ROESING, 1993: 443-444) bringt - nach den Einkanaltheorien (z.B. Welford, 1959; in: BUTLER, 1982: 149) um 1960 und den Modultheorien der menschlichen Informationsverarbeitung der 70er Jahre - einen neuen Aspekt in die kognitive Rhythmusverarbeitung des akustischen Cortex: empirische Belege deuten auf eine getrennte Verarbeitung von zeitlich aufeinanderfolgenden Schallereignissen (z.B. Rhythmen) und gleichzeitigen Klängen (z.B. Akkorde) hin.

5.3. Quantisierungen im MIDI-Sequenzer

Die Funktion des Quantisierens ist zweifelsohne das wichtigste Werkzeug des MIDI-Sequenzers, und verdeutlicht die Überlegenheit gegenüber herkömmlichen Audioaufnahmen auf ein Magnetband oder einen anderen Massenspeicher. Galt vor wenigen Jahren die Auto-Korrekturfunktion aufgezeichneter MIDI-Noten durch nachträgliches Quantisieren noch als "bad player’s medicine" (JACOBS/ GEORGHIADES, 1991: 96), so hat sich diese Bearbeitungsoption inzwischen als kreatives und musikalisch reizvolles Utensil entpuppt.

Ursprünglich war die Quantisierungsimplikation in den MIDI-Sequenzer darin gedacht, rhythmische Ungenauigkeiten einer Aufnahme wiedergabeseitig zu korrigieren (fallweise kann die Modifikation auch bereits aufnahmeseitig erfolgen). Dabei wurden die MIDI-Noten entsprechend einer justierbaren Einstellung (z.B.: 1/4-Note, 1/8-Note, 1/16-Note, 1/32-Note, Triolen etc.) gerundet und - nach einer linearen Interpolation berichtigt - in der Zeitachse angeordnet. Bald erkannte man die unbefriedigende Lösung einer starren Arithmetik, welche die musikalische Wiedergabe häufig statisch und "leblos" gestaltete. Ebenso kann es in kommerziellen Anwenderprogrammen bei Quantisierungen nach starren metrischen Rastern zu musikalischen Absurditäten und zu sinnwidrigen bzw. unlesbaren Notentexten kommen (DESAIN/ HONING, 1990: 56-66). Gegenwärtig versucht man durch verschiedenste Algorithmen und Methoden der Quantisierung den vielfältigen Anforderungen der Anwender gerecht zu werden.

5.3.1. Arten und Methoden der Quantisierung

Als "Quantisieren" bezeichnet man den Eingriff, MIDI-Noten mit Hilfe des Sequenzerprogrammes nach einer bestimmten Methode auf einen zuvor gewählten Werteraster umzusetzen. Dabei werden lediglich Note-Events in ihrer Position beeinflußt bzw. Notenlängen verändert, andere MIDI-Events (z.B. MIDI-Contoller) werden nicht verschoben.

5.3.1.1. Standardquantisierungen

Diese Standardfunktion ermöglicht es, MIDI-Noten auf den nächstliegenden Quantisierungswert zu verschieben, die ursprünglichen Notenlängen bleiben dabei erhalten oder sie werden dem Quantisierungsalgorithmus entsprechend variiert. In vielen Sequenzern läßt sich diese Funktion bereits während der Aufnahme aktivieren. Darüber hinaus kann häufig anhand einer Akkorderkennung eine Ordnung bezüglich der zeitlichen Positionierung der Akkordtöne erfolgen (Arpeggio im Millisekundenbereich).

Die üblichen Standardquantisierungen sind:

Abbildung 5/2: Quantisieren im Event Editor.

Die Abbildung zeigt einen mehrtaktigen Ausschnitt einer Schlagzeugspur (entsprechend GM, GS: C1=Bassdrum, D1=Snaredrum, F#1=Hihat, etc.)

Gewählt wurde eine Note-On-Quantisierung im Achtelnoten-Raster: die Notenlänge wurde auf 1/16-Noten quantisiert (1/16-Note entspricht 96 PPQ bei einer Auflösung von 384 PPQ bzw. 1536 Ticks pro Takt).

5.3.1.2. Stufenweises bzw. näherungsweises Quantisieren

Diese Quantisierungsart stellt einen sensibleren Algorithmus in der rhythmischen Bearbeitung als der zuvor besprochene dar. Die zu quantisierenden MIDI-Noten werden dabei nicht einem starren Raster angeglichen, sondern tendenziell - bei jeder Betätigung dieser Funktion - dem justierten Wert angenähert. Üblicherweise wird die stufenweise Adaption prozentuell vom Anwender bestimmt (0% = keine Annäherung, 100% = absolute Annäherung, dazwischen wird linear interpoliert ev. mit Rundung in Richtung einer Annäherung an die Nullabweichung).

z.B.: MIDI-Event: Note-On Takt 1, 2. Viertelnote, 48 PPQ Abweichung.

Grundzustand: 48 PPQ Abweichung

001 / 02 / 048

1. Quantisierung: z.B. 66%

001 / 02 / 016

2. Quantisierung: z.B. 50%

001 / 02 / 008

3. Quantisierung: z.B. 75%

001 / 02 / 002

4. Quantisierung: z.B. 50%

001 / 02 / 001

5. Quantisierung: keine Abweichung

001 / 02 / 000

Durch eine zusätzliche Funktion können MIDI-Noten, die sich bereits nahe am gewählten Quantisierungsraster befinden, von der Bearbeitung ausgenommen werden, indem ein Wertebereich von z.B. 0 bis 96 PPQ als ein zu übergehender definiert wird.

z.B.: MIDI-Event: Note-On Takt 5, 1. Viertelnote, 68 PPQ Abweichung. Bereich 0-24.

Grundzustand: 68 PPQ Abweichung

005 / 01 / 068

1. Quantisierung: z.B. 50%

005 / 01 / 034

2. Quantisierung: z.B. 33% mit Rundung

005 / 01 / 022

3. Quantisierung: keine Veränderung <24 PPQ

005 / 01 / 022

Die Weite der Annäherung pro Quantisierungsvorgang ist frei parametrierbar; der zusätzlich definierbare Wertebereich, der optional von einer Quantisierung ausgeschlossen bleibt, bildet ein relativ brauchbares Instrument einer musikalisch-lebendigen Nachbearbeitung.

Eine Sonderform des näherungs- bzw. stufenweisen Quantisierens stellt das sogenannte Zonenquantisieren dar:

Um jede exakte Quantisierungsposition herum (z.B. jede 1/4-Note, 1/8-Note, etc.) wird eine Zone definiert, die durch eine bestimmte Anzahl von PPQ’s bzw. Ticks angegeben wird. Nur jene Werte, die sich innerhalb dieses Bereichs befinden werden wahlweise absolut oder näherungsweise quantisiert.

z.B.: 1. Takt einer MIDI-Sequenzerspur mit 384 PPQ Auflösung: Bereich 0-5 PPQ (Ticks) Abweichung, absolute Quantisierung der 1/4-Noten.

Einspielzustand: rhythmische Abweichungen aller Events

1. Noten-Event

001 / 01 / 003

2. Noten-Event

001 / 01 / 198

3. Noten-Event

001 / 02 / 008

4. Noten-Event

001 / 02 / 193

5. Noten-Event

001 / 03 / 001

6. Noten-Event

001 / 03 / 188

7. Noten-Event

001 / 04 / 011

8. Noten-Event

001 / 04 / 201

9. Noten-Event

001 / 04 / 383

Quantisierter Zustand:

1. Noten-Event quantisiert >

001 / 01 / 000

2. Noten-Event

001 / 01 / 198

3. Noten-Event

001 / 02 / 008

4. Noten-Event

001 / 02 / 193

5. Noten-Event quantisiert >

001 / 03 / 000

6. Noten-Event

001 / 03 / 188

7. Noten-Event

001 / 04 / 011

8. Noten-Event

001 / 04 / 201

9. Noten-Eventquantisiert >

002 / 01 / 000

Die Quantisierung erfolgte im angeführten Beispiel nur für MIDI-Noten, die in einem Bereich von +/- 5 PPQ um die Quantisierungsposition der 1/4-Noten lagen. Andere Noten-Events wurden auf Grund der vorliegenden Einstellungen nicht transformiert.

5.3.1.3. Intelligentes Quantisieren

Manche Sequenzerprogramme haben intelligente Quantisierungsalgorithmen implementiert, die den Prozeß des rhythmischen Umformens nach analytischen Kriterien vollziehen. Diese Quantisierungsfunktion ist nicht nur ein wichtiges Bearbeitungswerkzeug innerhalb eines MIDI-Sequenzers, sondern sie bildet auch ein zentrales Kriterium in der automatischen Transkription von Musikstücken (CHOWNING et al., 1984; SCHLOSS, 1985; MONT-REYNAUD/ GOLDSTEIN, 1985: 391-397), sowie in praktisch allen parallelen Echtzeitanwendungen zwischen Musikern und Computern (DESAIN/ HORNING, 1989: 56-66).

Die Programmroutine verfügt dabei über eine Art von künstlicher Intelligenz (AI bzw. KI), die es erlaubt, gewisse typische Merkmale eines Musikers zu erkennen oder bestimmte Interpretationsstile zu erfassen. Die Quantisierungsfunktion respektiert interpretatorische Abweichungen als musikalische Akzentuierung, quantisiert aber die gesamte Sequenzerspur bzw. Event-Selektion nach metrischen Betrachtungsweisen und intelligenten Prozeduren. Unter Zuhilfenahme dieser Quantisierungsfunktion soll nach Möglichkeit die lebendige, nuancierte Interpretation des musikalischen Ausgangsmaterials erhalten bleiben, lediglich "Unsauberkeiten" wie Tempoabweichungen, permanentes Vorziehen oder zu spätes Anschlagen von Noten soll ausgeglichen werden.

5.3.1.4. Quantisierung nach Modellen

Die häufig als Groove-Quantisierung bezeichnete modellorientierte Manipulation von MIDI-Noten ist das Resultat einer konsequenten Forschung bezüglich anwenderbezogener musikalischer Datenverarbeitung im Bereich der Computermusik. Diese Bestrebungen werden im allgemeinen Sprachgebrauch als "Humanizing" bezeichnet. Das angepeilte Ziel dabei ist die "Vermenschlichung" einer exakt quantisierten Sequenzerspur.

Die bisher angeführten computerisierten Prozesse der Rhythmisierung benutzten alle mathematisch definierbare Algorithmen, die im System vorgefertigt implementiert waren. Die Quantisierung nach Modellen stellt einen weiteren Schritt in Richtung einer "Humanisierung" des starren und vorgefertigten Quantisierungsrasters dar, der dem Ruf der Anwender nach einem lebendigen, gehörgerechten Werkzeug - MIDI-Sequenzer betreffend - am nächsten kommt. Das Quantisieren nach einem Modell ermöglicht es dem Anwender, seine Sequenzeraufnahme einer rhythmischen Schablone anzugleichen (siehe Abbildung 5/3). Dabei kann diese Vorlage einem repräsentativen Vorbild nachempfunden (z.B. rhythmische Analyse einer Musikerpersönlichkeit), ein persönliches Konstrukt des Sequenzeranwenders oder auch ein kommerziell vorgefertigtes Rhythmuspattern sein (BRÜSE, 1992/12: 44-52).

Die Erstellung von Quantisierungsmustern vollzieht sich also entweder nach empirisch-experimentellen Methoden (bestimmten persönlichen Präferenzen entsprechend) oder gemäß einer Analyse von Phrasierungen nach einem verwertbaren Quantisierungsgerüst, welches von diversen Musikern verwendet wird. Die zweitgenannte "kleptomane" Vorgangsweise der Rhythmisierung gibt einem Computersequenzer die Möglichkeit, z.B. ein beliebiges Klavierstück der Interpretation von Glenn Gould (oder auch anderen Musikergrößen) anzugleichen, zumindest aber anzunähern. Der Grad der Anpassung hängt - neben anderen wichtigen Faktoren - vor allem von der Exaktheit der zuvor erfolgten musikalisch-metrischen Vermessung des jeweiligen Interpreten und der Annäherung der Dynamisierung ab, die neben der Quantisierung eine entscheidende Rolle spielt. Ein weites Experimentierfeld eröffnet die Möglichkeit, erstellte "Groove-Templates" genialer musikalischer Exegesen mit beliebigem Musikmaterial zu verknüpfen: z.B. der "Zillertaler Hochzeitsmarsch" phrasiert und "interpretiert" nach Horowitz? Eine Bach-Invention quantisiert nach den "Rolling Stones"? - Die individuelle Erstellung von "Grooves" ermöglicht mannigfaltige Variationsmöglichkeiten in der Bearbeitung von Sequenzeraufnahmen, die Sinnhaftigkeit sowie die ästhetische Komponente dieser Anwendungsoptionen ist allerdings in Frage zu stellen.

Abbildung 5/3: Beispiel für ein "Groove-Template" des Sequenzers Cubase.

Die Quantisierungseinstellung "PushB1&3" wurde angewählt. Mit dem Mauszeiger bzw. den Symbolen (Radierer, Stift, "Fußtritt") können die als Rauten dargestellten Notensymbole bearbeitet werden. Die darüberliegende numerische Darstellung liefert Auskunft über die gegenwärtige Position der angewählten Note (Takt/Viertel/PPQ). Im konkreten Fall: Die exakte Quantisierungsposition der angewählten MIDI-Note (0001.03.186) würde bei der Position 0001.03.192 liegen.

Abbildung 5/3 zeigt ein Rhythmusmodell bzw. "Groove-Template" anhand einer einfachen 1/4-Notenabfolge, die bestimmte Abweichungen um den numerisch exakten Wert aufweist. Die untenstehende Graphik (Abbildung 5/4) illustriert die praktische Anwendung einzelner Rhythmusmodelle anhand einer Schlagzeugeinspielung:

Abbildung 5/4: Schlagzeugeditor mit angewandten Quantisierungsmodellen:

Die Abbildung zeigt verschiedene Schlaginstrumente, die entlang der Zeitachse von Takt 1 bis 3 in einem 1/16-Notenraster angeordnet sind. Die einzeln bearbeiteten Instrumente sind nach verschiedenen rhythmischen Quantisierungsmodellen von ihrer exakten Position verschoben worden und ergeben zusammen ein "lebendig" klingendes, rhythmisch- musikalisches Konstrukt.

5.3.1.5. Sonstige Methoden der rhythmischen Beeinflussung

Neben den bereits besprochenen Methoden der Rhythmisierung eines kommerziellen MIDI-Sequenzers gibt es herstellerspezifisch weitere Verfahren der Beeinflussung der Zeitbasis:

Durch die Tempomodulation bzw. eine stetige Variation der Zeitbasis einer Sequenzerspur innerhalb eines starren Quantisierungsrasters erreicht man eine lebendigere Musikwiedergabe.

Das Sequenzerprogramm Logic 2.0 von Emagic leitet automatisch MIDI-Rhythmusschablonen aus Audiodaten ab. Damit erfolgte die erste kommerzielle Umsetzung der Forschungsergebnisse von CHOWNING (1984), SCHLOSS (1985) und MONT-REYNAUD/ GOLDSTEIN (1985). Praktisch dieselbe Funktion der Rhythmisierung anhand von Audioaufnahmen erfüllt das Programm ReCycle der deutschen Firma Steinberg. Dabei werden sogenannte "Groove Templates" vom vorliegenden Tonmaterial abgeleitet, die anschließend im Sequenzer "Cubase" als Quantisierungsvorlage einer Verwendung zugeführt werden können.

MIDI bietet dem Anwender vielfältige Möglichkeiten der rhythmischen Gestaltung von Sequenzeraufnahmen. Allerdings ist beim Einsatz der zuvor angeführten Bearbeitungsalgorithmen immer die Notwendigkeit bzw. Sinnhaftigkeit der Modifikation zu bedenken, gegebenenfalls ist von einer ungewollten oder unkontrollierten Manipulation besser abzusehen.

 


 

Sechstes Kapitel

Psychoakustische Grundlagen der kognitiven Musikologie

Subjektive Tondauer und die praktische Realisierung

im MIDI-Sequenzer

 

6. Psychoakustische Grundlagen der kognitiven Musikologie

6.1. Allgemeine Einleitung

Als die "Urahnen" des MIDI-Sequenzers - die Lochwalzenklaviere - Musikstücke maschinell wiedergaben, war man vom Postulat nach psychologisch und physiologisch adäquater musikalischer Reproduktion noch weit entfernt; als Don Buchla (GORGES. In: KEYBOARDS, 1994/6: 44-48) 1963 ein Gerät mit der Bezeichnung "Analoger Sequenzer" baute, waren entsprechende Kenntnisse seitens der Wissenschaft längst vorhanden, die Umsetzung in die Praxis ließ jedoch auf sich warten.

Erste Annäherungen der Sequenzerhersteller an die Problematik einer gehörphysiologisch-humanisierten Musikwiedergabe wurden durch analytische Quantisierungsfunktionen ab etwa Ende der 80er Jahre vollzogen; eine konsequente Weiterentwicklung derselben stellt die im 5. Kapitel besprochene Implementierung der modellorientierten Quantisierungsfunktion dar, die vor allem auf die Arbeit der Rhythmusforscher Ray Williams und Ernest Cholakis (BRÜSE. in: KEYBOARDS, 1992/12: 44-52) von WC Music Research zurückgreift. Mit dieser Maßnahme wurde sehr wohl ein wesentlicher Schritt in Richtung einer lebendigen, musikalisch - gehöradäquaten Computeraufnahme vollzogen, gegenwärtiges psychoakustisches Wissen wurde allerdings nur bedingt in die kommerzialisierte Praxis umgesetzt.

6.2. Psychoakustische Grundlagen

Die Psychoakustik beschreibt und erklärt Phänomene der akustischen Perzeption sowie die physiologischen Eigenschaften des menschlichen Gehörs. Sie ist oft in der Lage, zu bestimmten musikalischen Fällen ein physikalisches Korrelat zu finden. (ECKEL, 1989: 9)

Elektroakustische Kommunikationssysteme erreichen dann ihre größte Effektivität, wenn die akustische Übertragungskette der Prämisse der musikalisch-physiologischen Kommunikation, nämlich dem menschlichen Gehör angepaßt und also empfängerorientiert ist (ZOLLNER/ZWICKER, 1993: 281). Verschiedenste musikpsychologische Modelle und Erkenntnisse geben uns Auskunft über entsprechende Adaptionen der humanen Musikperzeption und Hörempfindung (ROEDERER, 1993; TERHARDT, 1988). Neurophysiologische Grundlagen des peripheren Hörsystems, dem Außen- und dem Mittelohr, sind hinreichend bekannt; zur "Kardinalfrage" bezüglich der neuronalen Verarbeitung vom Innenohr zum Cortex auditivus existieren verschiedenste Theorien und Modelle, die auf der Ortsinformation der Wanderwellentheorie von G. von BÉKÉSY (1960) aufbauen und diese in Hinsicht des Zeit-Periodizitätsaspektes und seines neuronalen Abbilds erweitern (z.B.: KEIDEL, 1975; KLINKE/HARTMANN, 1983).

Die Analyse der Physiologie des Gehörorgans und der zerebralen Verarbeitung von akustischen Stimuli soll nicht zum zentralen Thema dieser Arbeit werden, vielmehr interessiert die Umsetzung wissenschaftlicher Erkenntnisse in die praktische Anwendung des MIDI-Sequenzens. Von besonderem Interesse dabei ist die Einbeziehung von Erfahrungen bezüglich der subjektiven Tondauer:

6.2.1. Die subjektive Tondauer akustischer Stimuli

Nach Hugo FASTL (1982) werden Mithörschwellen-Tonheits-Zeitmuster als das Maß für das spektrale und zeitliche Auflösungsvermögen bezeichnet, welches sich aus der Verdeckung eines kurzen Tonimpulses durch spektrale und/oder zeitlich benachbarte maskierende Schallimpulse ableitet. Relativ einfach lassen sich Mithörschwellen-Muster für akustische Impulse mit beliebiger spektraler und zeitlicher Struktur empirisch erstellen (FASTL, 1982) oder auch nach bestehenden mathematischen Verfahren errechnen (siehe Abbildung 6/1) (FASTL. in: ACUSTICA 1979: 282-294).

Dabei kann konstatiert werden, daß die maskierende Wirkung eines Tonimpulses über seinen objektiven Beginn und das objektive Ende hinausreicht, also nicht auf den Bereich der physikalischen Präsenzzeit des Tonimpulses beschränkt bleibt.

Abbildung 6/1: Mithörschwellen-Zeitmuster einer Impulsfolge (FASTL, 1982: 10).

(Einzeltonimpulse, Ti=10 ms, T’= 60 ms) Die strichliert eingezeichnete Kurve repräsentiert tatsächlich gemessene Werte einer Mithörschwelle.

E. ZWICKER (in: ACUSTICA 1970: 214-218) konnte nachweisen, daß Schallimpulse bei gleicher objektiver Dauer wesentlich länger erscheinen, als Schallpausen. Ebenso konstatierte er, daß zur auditiven Verdopplung der subjektiven Dauer von kurzen Schallimpulsen deren objektive Dauer um etwa den Faktor 2,6 erhöht werden mußte.

Aus dieser Erkenntnis und aus empirischen Befunden der Mithörschwellen-Zeitmuster entwickelt Fastl ein Modell der subjektiven Tondauer (Abbildung 6/2):

Abbildung 6/2: Modell der subjektiven Tondauer: subjektive auditive Dauer Ts eines kurzen Schallimpulses der objektiven Dauer Ti (FASTL, 1982: 13ff). Ts wird in der praktischen Anwendung bei einem Pegelwert von 10 dB über dem Minimum (bzw. Hörschwelle) definiert.

Anhand empirischer Meßergebnisse erhält man nach H. FASTL (1982) den Nachweis für das von E. ZWICKER (in: ACUSTICA 1970, 214-218)) beobachtete psychoakustische Phänomen. Für kurze Schallimpulse bis 500 ms gilt folgende Funktion für die objektive bzw. subjektive Verdoppelung von Tonimpulsen (Abbildung 6/3):

Abbildung 6/III: Verdoppelung der Dauer von Tonimpulsen:

In einer objektiven Betrachtung müßte bei einer Verlängerung des Impulses Ti auf 2Ti eine Verlängerung der auditiven Wahrnehmung um den Faktor 2 eintreten (strichlierte dünne Linie). Tatsächlich muß ein Schallereignis bis zu ca. 3,2-fach verlängert werden, um auch subjektiv eine Längenverdopplung zu erzielen (strichlierte dicke Linie).

Das von Hugo Fastl präsentierte Konzept der subjektiven Tondauer basiert neben den erwähnten Erkenntnissen von E. Zwicker im wesentlichen auf einer Studie von EGAN und HAKE (in: JASA 1950: 622-630), die den ersten Beitrag zur genaueren Bestimmung der Mithörschwelle lieferte. Die bei den Experimenten von WEGEL und LANE (1924: 266-285) 1924 in den Bell Telephone Laboratories noch auftretenden Schwebungen zwischen Testsignal und maskierendem Signal wurden durch die Verwendung von Schmalbandrauschen anstelle von Sinustönen bei EGAN und HAKE vermieden. Zu ähnlichen Ergebnissen kam die im selben Jahr durchgeführte Studie von Hawkins und Stevens, die wiederum von WATSON (in: JASA 1963: 283-288) bestätigt wurde. FELDTKELLER und ZWICKER (1967) lieferten empirische Befunde über Mithörschwellen von Sinustönen und Schmalbandrauschen, TERHARDT/ STOLL/ SEEWANN (in: JASA 1982: 679-688) erweiterten das Modell bezüglich pegel- und frequenzabhängiger Charakteristika, die auf die Funktion der Verdeckung ihren Einfluß geltend machen.

1973 erfolgte eine terminologische Definition des Begriffs Verdeckung seitens des American National Standards Institute (ANSI, 1973: 26):

Die zuvor besprochenen Studien und Definitionen betrafen primär Erkenntnisse der sogenannten Simultanmaskierung, d.h. ein akustisches Signal wird von einem zweiten, gleichzeitig erklingenden akustischen Signal verdeckt. Im Zusammenhang mit dem Konzept der subjektiven Tondauer interessieren aber vorrangig die Erkenntnisse bezüglich einer Vor- bzw. Nachverdeckung (ANSI, 1973):

Gemäß der Intensität der Maskierung bei der Simultanmaskierung als Funktion der Frequenz, gilt auch für die Vor- und Nachverdeckung: Ein Signal wird von einem anderen maskiert, wenn ihre Frequenzen nahe beisammen liegen, oder das frühere Signal eine tiefere Frequenz aufweist.

Übliche Werte der Nachverdeckung liegen bei 200 (bis max. 300) Millisekunden, der Wert für die maximale Dauer ist abhängig von der Schallintensität des Maskierers und dem Frequenzintervall zwischen dem Maskierer und dem verdeckten Signal, sowie der Schallintensität des maskierten Signals. Der zeitliche Mithörschwellenverlauf für die Nachverdeckung ist annähernd linear.

Die Vorverdeckung erreicht die Grenzen ihrer Wirksamkeit bereits bei ca. 25 ms (PICKET. in: JASA, 1959: 1613-1615; ELLIOTT. in: JASA, 1962: 1108-1115). Ein nahezu linearer Mithörschwellenverlauf kann hier nicht konstatiert werden, vielmehr nimmt die Maskierung mit steigender Zeitdifferenz rapide ab.

Sowohl Vorwärts- als auch Rückwärtsmaskierung sind Resultate zeitabhängiger Eigenschaften des neuronalen Gehörmechanismus. Das psychoakustische Phänomen der Vorverdeckung suggeriert, daß bereits angeregte Nervenzellen vergleichsweise nicht so sensitiv reagieren, wie ruhende Zellen. Die Nachverdeckung basiert auf dem interferierenden Prozeß eines noch nicht vollständig neuronal verarbeiteten akustischen Stimulus, der von einem nachfolgenden Signal (mit höherer Intensität) verdeckt wird.

6.2.2. Praktische Umsetzung dynamischer Hörempfindungen

Die aufgezeigten Gesetzmäßigkeiten subjektiver Hörempfindungen werden (einer Annahme nach) im praktischen Musikalltag unbewußt permanent angewendet. Der ausübende Musiker bzw. Instrumentalist ist sich dessen bewußt, daß eine Achtelnote der Länge einer Achtelpause entspricht, und eine Viertelnote doppelt so lange zu klingen hat, wie eine Achtelnote (siehe Abbildung 6/4). Dieser objektive Sachverhalt wird subjektiv durch einen Regelkreis über das Gehörorgan überprüft und nach dem gehörphysiologischen Behandlungsschema optimiert. Ein geübter Musiker ist in der Lage, sein Instrumentalspiel gehöradaptiert zu gestalten (bzw. er hat eine psychoakustisch angepaßte Spielweise längst automatisiert).

Abbildung 6/4: Musikalische Implikation subjektiver Tondauer:

Gegenüberstellung eines musikalischen Rhythmusnotats mit dem objektiven Tonimpuls Ti und der subjektiven Impulsdauer Ts (FASTL, 1981: 71-76).

Die erfolgte kurze Abhandlung bezüglich der tatsächlich klingenden und der subjektiv empfundenen Tondauer verdeutlicht die Unerläßlichkeit einer Einbindung in die musikalische Aufführungspraxis. Die obligat bewerkstelligte Transformation psychoakustischer Kenntnisse im praktischen Musizieralltag wird in verwandten Sparten (besonders jener der elektronischen bzw. elektroakustischen Musik) nicht gemeinhin verwirklicht: die MIDI-Synthese z.B. bietet bis zum heutigen Tage keine Möglichkeit der musikalisch-akustischen Anpassung nach zuvor besprochenen Kriterien. Dieser Umstand soll durch das im folgenden Abschnitt besprochene Modell aufgezeigt werden und nicht zuletzt potentiellen Herstellerfirmen und Anbietern von MIDI-Softwaresequenzern eine Anregung zu Verbesserungen ihrer Produkte sein.

6.3. Tondauer im MIDI-Sequenzer

Die Aufzeichnung von Sequenzerspuren und MIDI-Events kann prinzipiell auf zwei Arten erfolgen:

Die üblichere und raschere Möglichkeit der Aufzeichnung ist selbstredend die Echtzeitaufnahme. Durch die Möglichkeit der Nachbearbeitung jeder einzelnen Note ist eine entsprechende Effizienz gegeben. In der kommerziellen Praxis ist es üblich, die einzelnen aufgenommenen Spuren nach im Kapitel 5 besprochenen Algorithmen zu quantisieren, d.h. die "Note-On"-Events werden häufig einem absoluten Quantisierungswert angeglichen. Darüber hinaus neigen viele Anwender dazu, durch eine Notenlängenquantisierung ein absolut starres MIDI-Notengerüst zu erzeugen, welches dem Spielverhalten eines Menschen absolut nicht entspricht und jeglicher psychoakustischer Grundlage entbehrt. Das Endergebnis einer derartigen Transformation unter Ausnutzung standardmäßiger Quantisierungsmöglichkeiten sieht zum Beispiel folgendermaßen aus:

Abbildung 6/5: Listeneditor im Sequenzer Cubase.

Dieser Bildausschnitt veranschaulicht die Kritik an einer starren Quantisierung von MIDI-Noten: Notenbeginn, Notenende und Notenlänge sind numerisch absoluten Werten zugeordnet (musikalisch: 1/32-Notenraster, entspricht 48 PPQ), der Note-Off-Befehl eines Events und der Note-On-Befehl des nächsten Events sind deckungsgleich.

Die Abbildung 6/5 ist ein visualisiertes Beispiel dafür, wie kritisch mit der Funktion des Quantisierens in der Praxis umzugehen ist. Besonders die konsequente Angleichung von Notenanfängen und -enden läßt keine Musikwiedergabe nach dem Modell der subjektiven Tondauer zu.

6.4. MIDI-Sequenzermodell der subjektiven Tondauer

Ein an den MIDI-Sequenzer adaptiertes, auf subjektiven Tondauern von Schallen basierendes Modell soll anhand von Abbildung 6/6 erläutert werden:

Abbildung 6/6: Modell subjektiver Tondauer in MIDI-Sequenzern.

Trotz unterschiedlicher objektiver Tondauer werden die perzipierten Tonlängen subjektiv gleich empfunden.

Die Abbildung 6/6 zeigt eine vereinfachte schematische Darstellung des Listeneditors (bzw. Grid-Editor oder Event-Editor): Sechs MIDI-Noten sind seriell als Viertelnoten über die Zeitachse von Takt 5 bis einschließlich Takt 6 angeordnet. Die Anschlagdynamik (Velocity) kann anhand unterschiedlicher Graustufen abgelesen werden. Die Notenlängen wurden nach dem Kriterium der subjektiven Tondauer ihrer Dynamik entsprechend gewählt, so daß sich in der auditiven Wahrnehmung der objektiv unterschiedlichen Tonimpulse ein Kontinuum subjektiv gleichlang klingender Viertelnoten mit unterschiedlicher Lautstärke ergibt. Zur Verdeutlichung der Modellvorstellung befindet sich unter der graphischen Darstellung der MIDI-Noten im Listeneditor eine idealisierte Visualisierung des Mithörschwellen-Zeitmusters der Impulsfolge, sowie eine exemplarische musikalische Notation mit entsprechender Dynamisierung.

6.4.1. Die Problematik der Tondauer in MIDI-Sequenzern

Die modellorientierte Übersetzung der Erkenntnisse von ZWICKER (in: ACUSTICA 1970) und FASTL (1982) in die Struktur eines MIDI-Sequenzers scheint in einer ersten Darstellung einleuchtend und valide zu sein. Erst bei einer näheren Betrachtung stößt man an die Grenzen der (praktischen) Realisierbarkeit.

6.4.1.1. Grenzen der technischen Realisierbarkeit

Wie bereits im 2. Kapitel beschrieben wurde, handelt es sich beim MIDI-Standard um eine Kompromißlösung bezüglich technischer Realisierung und finanziellem Aufwand. Die Kosten-Nutzen-Rechnung wurde hinsichtlich einer möglichst großen Breitenwirkung seitens der Konsumenten angelegt, MIDI sollte dem "kleinbürgerlichen Pragmatismus" entgegenkommen und sich entsprechend weit verbreiten.

Die technische Restriktion macht sich besonders in der seriell arbeitenden Datenverarbeitung bemerkbar, die nur eine beschränkte Anzahl von Übertragungen pro Zeiteinheit zuläßt. So kann das MIDI-Interface innerhalb einer Sekunde ca. 3000 Bytes verarbeiten, zur vollständigen Darstellung einer MIDI-Note sind 3(2) MIDI-Bytes notwendig (Siehe Kapitel 2.1.2.). Durch die vorgegebene Taktfrequenz (31.250 bps) wird für den systeminternen Datentransfer eine Zeit von 960(640) Mikrosekunden benötigt, d.h. vom Softwarebefehl (z.B."Note-On") bis zum MIDI-Interface des Klangerzeugers benötigen die drei MIDI-Bytes weniger als eine Millisekunde.

Die physikalisch-rhythmische Auflösung des Tempos (Siehe Kapitel 4.1.3.) innerhalb eines Software-Sequenzers bildet ein weiteres Kriterium. Je nach Tempo der Sequenzeraufnahme und je nach Auflösungsvermögen (PPQ) ist hier mit einem durchschnittlichen Fehler von 0,5 bis maximal 2 Millisekunden zu rechnen.

Zu weiteren Verzögerungen in einem MIDI-System kommt es seitens der Klangerzeuger durch die Transformation eines anhand binärer Daten vorliegenden MIDI-Befehls in eine analoge Spannung am Ausgang des Geräts. Übliche Werte der Reaktionszeit von Klangerzeugern (im Mono-Mode) bewegen sich für Einzelnoten in einem Bereich zwischen 3 und 15 ms (GORGES, 1993: 343-346; HENLE. in: KEYS, 1990b: 4/40-42), im polyphonen Modus kommt es bei üblichem Betrieb zu Verzögerungszeiten bis zu 35 ms, in Ausnahmefällen treten temporäre Verschiebungen bis zu 70 ms auf (z.B. Kawai K4) (HENLE. in: KEYS, 1990a: 2/96-106; HEIL/HENLE. in: KEYS, 1990: 6/62-67)! Da es sich i.a. um konstante Abweichungen handelt, kann diese Hardwareverzögerung als feste Größe in die empirische Untersuchung eingehen und ist somit als Störfaktor auszuschließen.

Zusammenfassend läßt sich konstatieren, daß es üblicherweise erst im polyphonen Spiel zu mehr oder weniger großen Timing-Fehlern kommt. Ein MIDI-Mehrklang ist auf Grund des seriellen Datentransfers ein Arpeggio im Millisekundenbereich. Erfolgt die Sequenzer-Wiedergabe im sogenannten Running Status oder Running Mode, so wird das Statusbyte nur einmal pro MIDI-Eventtypus gesendet, d.h. die Verzögerung zwischen zwei MIDI-Noten beträgt dann 0,64 ms (2 Datenbytes werden übertragen, das entspricht 2 x 0,32 ms bei 31.250 Baud und einer Wortlänge von 8+2 Bits).

6.4.1.2. Der Einfluß der Klangerzeugung

Herkömmliche Musikinstrumente sind komplizierte physikalische Gebilde, bei denen meist mehrere gekoppelte Resonanzsysteme den Schwingungsvorgang beeinflussen (MEYER, 1980: 34). Die schlagartige Beendigung der Anregung einer Schallquelle stellt genauso eine Unstetigkeit im zeitlichen Schwingungsverlauf dar, wie der plötzliche Toneinsatz. In den meisten Fällen wird eine Stimulation aber nicht so abrupt unterbrochen, wie etwa ein staccato gespielter Ton beginnt. Von besonderem Interesse sind also die spezifischen Einschwingvorgänge, die bereits bei Naturinstrumenten eine entsprechend große Varianz - vom Instrument und von der Frequenz abhängig - aufweisen. Eine noch wesentlich größere Differenzierung in der Gestaltung von Hüllkurven kann in der synthetischen Klangerzeugung konstatiert werden. Ein- und Ausschwingphasen von theoretisch beliebig langer Dauer können erzeugt werden.

Die theoretische Transformation des subjektiven Tondauermodells in einem MIDI-Sequenzer ist grundsätzlich leicht vollziehbar. Es muß allerdings - wie besprochen - die Tatsache berücksichtigt werden, daß "MIDI" lediglich eine Hard- und Softwareinfrastruktur zur Verfügung stellt, und an der eigentlichen Klangerzeugung nur sekundär als Steuerelement beteiligt ist. Eine aufgezeichnete MIDI-Note kann also beinahe unendlich viele Klänge und Wellenformen verschiedenster MIDI-Tongeneratoren triggern, d.h. ein und dieselbe MIDI-Note kann Schallereignisse mit unterschiedlichsten Charakteristiken auslösen. Das bedeutet in der Praxis, daß z.B. ein Klang mit langer Einschwingphase den stationären Zustand noch nicht erreicht hat, obwohl die MIDI-Note bereits mit dem Note-Off-Befehl längst beendet wird, oder z.B. ein Note-Off gesendet wird und die Ausklingphase noch einige Sekunden andauert. Das bedeutet, daß eine Untersuchung bezüglich subjektiver Tondauer und Maskierungseffekte nur für ein ganz bestimmtes Klangmaterial erfolgen kann (Abbildung 6/7).

Die Notenlängen des zu untersuchenden Tonmaterials bewegen sich idealerweise in einem Bereich zwischen 15 ms und 300 ms, um eine Unterscheidung zwischen subjektiv wahrgenommener und objektiv klingender Länge vornehmen zu können. Weiters sollte der Klang eine kurze Ein- und Ausschwingphase und eine in der Amplitude relativ stationäre Zeitfunktion aufweisen, um repräsentative Ergebnisse zu erzielen. Geeignet erscheinen besonders - wegen ihrer relativ einfachen Transformation in MIDI-Noten - perkussive Instrumente (geschlagene Idiophone und Membranophone), stationäre Orgelklänge sowie das Klavier.

Die Ergebnisse des praktischen Vergleiches der einzelnen Instrumententypen werden im nächsten Abschnitt diskutiert.

Abbildung 6/7: ADSR-Hüllkurve eines Klangerzeugers.

Die Attack-Time Ta (Einschwingvorgang bis zum Amplitudenmaximum) ist in diesem konkreten Beispiel relativ kurz dargestellt (wenige Millisekunden für perkussive Klänge), die Release-Time Tr (Ausklang nach dem Note-Off) wird üblicherweise nach natürlichen akustischen Gegebenheiten gewählt. Die Decay-Time Td beschreibt den zeitlichen Bereich vom Amplitudenmaximum bis zum (quasi-) stationären Zustand (Sustain-Time Ts).


Zurück zur Homepage
Fortsetzung Diplomarbeit Teil 2 (Forschungsteil)
Fortsetzung Diplomarbeit Teil 3 (Anhang: Glossar, Literatur, Tabellen)