Helena Lewandowska
Lingvistik för Kognitionsvetare – Laboration 2
Pedagoggränd 11D – 101, 90730 UMEÅ
Phone: 070-5889679, E-mail: [email protected]
2007-09-23
Laboration 2
Del 1. IPA beskrivning
Uppgift:
Utifrån IPA-tablån och din kunskap i svenska beskriv vilka klusiler, nasaler och
frikativor som finns i svenska. Utgå från din egen variant. Beskrivningen skall använda
sig av de parametrar som bygger upp IPA-tablån (artikulationssätt, artikulationsställe
och stämbandston).
I svenskan finns 19 skrivna konsonanter, b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, x & z.
Några av dessa låter dock lika, c – s och k – q, vilket innebär att antalet ljud är färre,
dvs. 17 stycken.
Frågan handlar om ljud, inte bokstäver, och du skall utgå från IPA-tablån, inte
alfabetet. Du behöver inte använda långa prosabeskrivningar utan, som frågan säger,
de parametrar som IPA-tablån är uppbyggd av. T.ex. är [b] helt beskriven med tre
ord: ”tonande bilabial klusil”. Observera att inte alla konsonanter i svenskan
efterfrågas, bara klusiler, nasaler och frikativor.
B – symboliseras b och är ett plosivt ljud som skapas bilabialt. Det innebär med andra ord
att luft stängs in bakom läpparna, skapar ett visst tryck och som sedan släpps ut snabbt.
Tonande.
C, S – symboliseras ş och är ett frikativt ljud som skapas retroflext. Det innebär med
andra ord att luft pressas mellan främre delen av tungan och gommen och skapar ljud
när friktion uppstår däremellan. Tonlöst.
D – symboliseras d och är ett plosivt ljud som skapas alveolärt. Det innebär med andra ord
att luft stängs in mellan främre delen av tungan och gommen, skapar ett visst tryck som
sedan släpps ut snabbt. Tonande.
F – symboliseras f och är ett frikativt ljud som skapas labiodentalt. Det innebär med andra
ord att luft pressas mellan den nedre läppen och den övre tandraden och skapar ljud när
friktion uppstår däremellan. Tonlöst.
G – symboliseras g och är ett plosivt ljud som skapas i velar. Det innebär med andra ord att
luft stängs in mellan bakre delen av tungan och gommen, skapar ett visst tryck som
sedan släpps ut snabbt. Tonande.
H – symboliseras ɦ och är ett frikativt ljud som skapas glottalt. Det innebär med andra ord
att luft passerar fritt från halsen och skapar ljud när friktion uppstår. Tonande.
J – symboliseras j och är ett frikativt ljud som skapas palatalt. Det innebär med andra ord att
sidorna på tungan rör vid gommen och att luften som passerar skapar ljud när friktion
uppstår. Tonande.
K, Q – symboliseras k och är ett plosivt ljud som skapas i velar. Det innebär med andra ord
att luft stängs in mellan bakre delen av tungan och gommen, skapar ett visst tryck som
sedan släpps ut snabbt. Dvs. som g fast tonlöst.
Helena Lewandowska
Lingvistik för Kognitionsvetare – Laboration 2
Pedagoggränd 11D – 101, 90730 UMEÅ
Phone: 070-5889679, E-mail: [email protected]
2007-09-23
L – symboliseras ɭ och är ett lateralt approximerat ljud som skapas retroflext. Det innebär
med andra ord att en stor del av tungan vidrör gommen medan luft pressas mellan.
Tonande.
M – symboliseras m och är ett nasalt ljud som skapas bilabialt. Det innebär med andra ord
att läpparna pressas samman för att förhindra att luft kommer ut och istället låter luften
passera via näsan. Tonande.
N – symboliseras n och är ett nasalt ljud som skapas alveolärt. Det innebär med andra ord
att främre delen av tungan, samt gommen pressas samman för att förhindra att luft
kommer ut och istället låter luften passera via näsan. Tonande.
P – symboliseras p och är ett plosivt ljud som skapas bilabialt. Det innebär med andra ord
att läpparna pressas samman för att förhindra luften och skapa ett visst tryck som sedan
släpps ut snabbt. Dvs som b, fast tonlöst.
R – symboliseras ɽ och är ett ”flappande” ljud som skapas retroflext. Det innebär med
andra ord att tungspetsen vidrör gommen och tillåts fladdra när luft passerar mellan
tungspets och gom. Tonande.
T – symboliseras t och är ett plosivt ljud som skapas alveolärt. Det innebär med andra ord
att luft stängs in mellan den främre delen av tungan och gommen för att sedan släppas ut
snabbt. Dvs. som d, fast tonlöst.
V – symboliseras v och är ett frikativt ljud som skapas labiodentalt. Det innebär med andra
ord att luft pressas mellan den nedre läppen och den övre tandraden och att ljud uppstår
av friktionen däremellan. Dvs. som f, fast tonande.
Helena Lewandowska
Lingvistik för Kognitionsvetare – Laboration 2
Pedagoggränd 11D – 101, 90730 UMEÅ
Phone: 070-5889679, E-mail: [email protected]
2007-09-23
Del 2. Akustiska element i klusiler
Du tycks ha använt fjolårets formuleringar av uppgiften här också.
Uppgift:
Använd filen aba.waw. mät durationerna av de olika akustiska elementen i de sex
konsonanterna i filen.
De akustiska elementen eller faserna i en klusil är beskrivna i boken, kapitel 4. Det är
inte de olika klusilerna som efterfrågas, utan de element de består av. Dina svar har
inget med frågan att göra.
De ungefärliga durationerna för de sex konsonanterna i filen.
b
Manlig
00.113
Kvinnlig 00.077
1.
d
00.113
00.068
g
00.110
00.043
p
00.165
00.110
t
00.125
00.110
k
00.138
00.117
Hur många element kan finnas i en klusil?
Klusiler är samlingsnamnet på foner. Exempelvis finns dentala ljud, samt att de dentala
ljuden kan vara tonande eller tonlösa. Totalt finns 11 olika ”grupper” bilabiala,
labiodentala, dentala, alveolära, postalveolära, retroflexa, palantala, velära, uvulära,
pharyngeala och glottala. Samtliga kan dessutom vara antingen tonande eller tonlösa.
Det finns sedan åtta olika sätt att kombinera klusilerna plosivt, nasalt, vibrerande,
vidrörande/flappande, frikativt, lateralt frikativt, approximant och lateral aproximant.
Det borde innebära att det rent teoretiskt sett borde kunna finnas 8 element i varje klusil
även om alla kombinationer inte anses vara möjliga.
2.
Vissa klusiler har fler element än andra, vilka?
Alla åtta sätt jag beskrivit ovan är dock inte möjliga för de olika klusilerna. Den klusil
som har flest enligt IPA är den tonande alveolära klusilen som har åtta element. Enligt
IPA är den också den enda. Näst efter den kommer den tonande retroflexa klusilen med
sex element. Resterande klusiler varierar mellan att ha 1-5 element.
3.
Finns det några könsskillnader?
De manliga konsonanterna hade alla längre duration och borde kanske därför vara
enklare att identifiera.
Helena Lewandowska
Lingvistik för Kognitionsvetare – Laboration 2
Pedagoggränd 11D – 101, 90730 UMEÅ
Phone: 070-5889679, E-mail: [email protected]
2007-09-23
Del 3. Perception av klusiler
Din formulering av frågorna är inte enligt årets version.
Uppgift:
Öppna filen k1.wav och skriv ned vad du hör.
Öppna k2.wav och skriv ned vad du hör.
Öppna k3.wav och skriv ned vad du hör.
1.
Skriv ned vilka element som ingår i de olika klusilerna i de olika filerna.
K1: Jag hörde ”aba” och de element som jag anser ingår är: ă b aˑ
(Dvs. ett kort a följt av b och sedan ett lite längre a.)
K2: Jag hörde ”apa” och de element som jag anser ingår är: ă p aˑ
(Dvs. ett kort a följt av p och sedan ett lite längre a.)
K3: Jag hörde ”apba” och de element som jag anser ingår är: ă p b aˑ
(Dvs. ett kort a följt av pb och sedan ett lite längre a.)
2.
3.
Inspektera sedan spektrogrammen: vilka akustiska element ingår i de olika klusilerna i
de olika filerna?Återigen: ta reda på vad akustiska element är för något.
VPM
K1: [a
voiced, front, open, unrounded.
b
voiced, bilabial, plosive.
a]
voiced, front, open, unrounded.
K2: [a
p
a]
voiced, front, open, unrounded.
voiceless, bilabial, plosive.
voiced, front, open, unrounded.
K3: [a
p
b
a]
voiced, front, open, unrounded.
voiceless, bilabial, plosive.
voiced, bilabial, plosive.
voiced, front, open, unrounded.
Förklara varför du hörde de klusiler du hörde i de tre filerna
Klusilerna är enklare att höra om de omges av vokaler. De två första filerna primar
mig att höra ”apba” i den tredje filen. Eftersom jag hörde ”apa” närmast innan hör jag
först ett ”p” och sedan ett ”b” eftersom även ”aba” primar mig.
Helena Lewandowska
Lingvistik för Kognitionsvetare – Laboration 2
Pedagoggränd 11D – 101, 90730 UMEÅ
Phone: 070-5889679, E-mail: [email protected]
4.
2007-09-23
Sök på Internet efter kategorisk perception/cathegorical perception och skriv en
sammanfattning på 300 ord om ämnet.
Kategorisk perception är det fenomen där vi uppfattar en gradvis förändring från
stimulus till stimulus som en stegvis förändring istället för som en kontinuerlig
förändring. Dessa steg anses vara tydligt definierade kategorier där stimuli tillhörande
olika kategorier tydligt kan åtskiljas av exempelvis en försöksperson.
Det innebär att en verklighet där det inte finns några skarpa gränser sorteras upp i
distinkta fack av våra perceptuella mekanismer. När perceptionen skapas lägger vår
hjärna till gränser som inte har någon verklig motsvarighet. Gränserna ges av ett
system av kategorier som vanligen är en produkt av inlärning. (Gärdenfors, Hur homo
blev sapiens…).
Inom lingvistiken testas kategorisk perception exempelvis genom att först låta
försökspersoner försöka höra skillnaden mellan fonemen ”ba”, ”da” och ”ga”. Därefter
får försökspersonerna höra ”ba”, ”da” och ”ga” hopparade på olika sätt och skall då
bestämma huruvida paren är identiska eller ej. Stavelserna som används är framställda
av Francisco Lacerda vid institutionen för lingvistik vid Stockholms universitet med
hjälp av parametersyntes. Detta gäller ett visst sådant experiment, som du kan
referera till, men det är ju inte generellt sett så att Francisco Lacerda har gjort de
stavelser som man testar kategisk perception med.
Exempelvis får FP höra ”ba” kort följt av ”ga”, ”ba” kort följt av ”da”, alternativt ”ba”
kort följt av ”ba” osv. FP skall urskilja om de var lika eller olika. En sida på Internet
med detta experiment finns på http://www.ling.gu.se/~anders/KatPer/Applet/test.html
Dessa två test görs för att kunna jämföra FPs förmåga att identifera ”ba”, ”da” och
”ga” med FPs förmåga att diskriminera mellan dem.
Medan det första testet visar att ”ba”, ”da” och ”ga” i viss utsträckning flyter ihop
(kontinuerlig förändring) så visar det andra testet att det trots allt verkar finnas tydliga
gränser där vi kan diskriminera de olika ljudparen. Detta verkar missuppfattat.
Det har visat sig vara så att stimuli enklast identifieras inom kategorier, medan de
diskrimineras med störst säkerhet vid kategorigränserna.
I kontrast till kategorisk perception finns ett annat fenomen vid namn McGurk
effekten har fått sitt namn av en av de personer som undersökt detta fenomen. Kort
kan McGurk effekten beskrivas som det sätt hjärnan tolkar två olika slags signaler
tillsammans. Detta verkar inte höra hit.
Helena Lewandowska
Lingvistik för Kognitionsvetare – Laboration 2
Pedagoggränd 11D – 101, 90730 UMEÅ
Phone: 070-5889679, E-mail: [email protected]
2007-09-23
Del 4. Frikativor och nasaler
Uppgift:
Beskriv de frikativor som finns i filen fors.wav mha spectrum section. Vilka
frekvensområden innehåller mest energi etc.
Female
Frekv. Intervall
3240-7760 Hz
120-6760 Hz
1560-7640 Hz
Female
”kraft” område
~5120 Hz
~640 Hz
~5120 Hz
Male
Frekv. Interval
2480-7760 Hz
120-4440 Hz
1520-7680 Hz
Male
“kraft” område
~6760 Hz
~800 Hz
~6760 Hz
K
Y
S
S
2360-7000 Hz
360-6240 Hz
3480-7960 Hz
~5760 Hz
~2640 Hz
~7400 Hz
2360-7760 Hz
240-7560 Hz
2960-7960 Hz
~2860 Hz
~2600 Hz
~5120 Hz
S
K
Ä
R
1520-6920 Hz
~4680 Hz
760-6800 Hz
~1000 Hz
200-3680 Hz
2800-4640 Hz
~1640 Hz
~3520 Hz
160-7920 Hz
148-2840 Hz
~1720 Hz
~2680 Hz
V
A
S
80-400 Hz
120-3720 Hz
3560-7960 Hz
~200 Hz
~880 Hz
~7320 Hz
240-3400 Hz
200-5120 Hz
3400-7880 Hz
~320 Hz
~920 Hz
~7200 Hz
F
O
R
S
I tabellen ovan redovisas de mätvärden jag kommit fram till efter att ha studerat spectrogram i
ljudfilen. Uppgiften efterfrågar frikativor, inte samtliga segment.
2. IPA-beskrivningens parametrar utgår från artikulationen. Hur relaterar sig er akustiska
beskrivning till den artikulatoriska?Eftersom uppgiften handlar om frikativor enbart är det
inte relevant att tala om ”exempelvis frikativor”. Vad skiljer akustiskt och artikulatoriskt
mellan olika frikativor?
Relationen är ofta tydlig där exempelvis frikativor har ett relativt högt ”kraft” område, där
luften förhindras och pressas fram på olika sätt. Det verkar även vara möjligt att identifiera de
olika fonemen mha deras frekvens där exempelvis ”s” ”kraft” område i orden kyss och vas
ligger väldigt nära varandra på 7400Hz, samt 7320Hz.
3. Personer med hörselnedsättning har oftast sämst perception i höga frekvenser. Vad
implicerar detta givet era resultat?
För en person med hörselnedsättning till 4000Hz vore det svårt att höra delar av dessa ord.
Exempelvis skulle Fors med stor sannolikhet höras som endast ’o’, även om
frekvensintervallen för resten av ordet finns inom intervallet 0-4000Hz så ligger ”kraft”
området utanför personens hörselkapacitet. Ordet Kyss skulle för en person med
hörselnedsättning till 4000Hz antagligen höras som ’y’ eftersom ”kraft” området för resten av
ordet ligger utanför personens hörselkapacitet. Speciellt svårt skulle det vara att höra ”ss”
eftersom även den del som ligger inom hörselkapaciteten inte är speciellt stor och ej har kraft.
Helena Lewandowska
Lingvistik för Kognitionsvetare – Laboration 2
Pedagoggränd 11D – 101, 90730 UMEÅ
Phone: 070-5889679, E-mail: [email protected]
2007-09-23
Ordet Skär skulle antagligen höras som ”är” för en person med hörselnedsättning enligt ovan.
Ordet Vas skulle troligtvis höras som ”va” av en person med hörselnedsättning enligt ovan.
Detsamma skulle gälla för en telefon som inte spelar upp frekvenser över 3400Hz men det
skulle dessutom märkas ännu mera eftersom en större del av orden ligger utanför
frekvensintervallet som telefonen klarar av att spela upp. Exempelvis skulle ’ss’ i ordet kyss
inte alls ens svagt kunna höras eftersom hela frekvensintervallet för ’ss’ ligger utanför
telefonens kapacitet.
4. Uppgift:
Lyssna till filen regn.wav och inspektera spektrogrammen. Finns det gemensamma drag för
de olika nasaler som förekommer i filen? Om ja, vad skulle kunna vara orsaken?
R
e
g
n
Female
Frekv. Intervall
160-3520 Hz
120-6960 Hz
200-920 Hz
160-520 Hz
Female
”kraft” område
~880 Hz
~2480 Hz
~280 Hz
~
Male
Frekv. Interval
80-7920 Hz
160-7960 Hz
200-5040 Hz
200-5120 Hz
Male
“kraft” område
~2720 Hz
~2540 Hz
~320 Hz
~1640 Hz
M
ä
n
120-680 Hz
200-724 Hz
200-480 Hz
~320 Hz
~880 Hz
~320 Hz
160-4280 Hz
120-7880 Hz
160-6640 Hz
~2360 Hz
~1920 Hz
~2640 Hz
H
a
j
760-6080 Hz
200-6120 Hz
160-400 Hz
~4120 Hz
~1360 Hz
~280 Hz
880-5440 Hz
120-7680 Hz
3280-4040 Hz
~2560 Hz
~1360 Hz
~3440 Hz
L
e
r
160-480 Hz
160-7440 Hz
1760-4120 Hz
~360 Hz
~6320 Hz
~2720 Hz
200-4200 Hz
160-7720 Hz
1440-3000 Hz
~3680 Hz
~2560 Hz
~2480 Hz
I tabellen ovan redovisas de mätvärden jag kommit fram till efter att ha studerat
spectrogram i ljudfilen. Här efterfrågas enbart nasaler, inte samtliga segment i filen.
Och vi frågar inte efter vilka frekvensområden som innehåller mest energi. Den
akustiska egenskapen som nasaler har gemensam är det nasala filtret som visar sig
som s.k. antiformanter (frekvensområden som saknar energi).
Gemensamt för nasaler verkar vara att det har mycket lägre frekvenser än frikativ. Min
teori är att svängningarna saktas ned när de färdas genom näsan istället för munnen.
De borde också vara lättare att höra för människor med hörselnedsättning.