MusikJakten – B. Analys I del A skapade ni en stor mängd musik – ni sparade ca 5400 ljud! Dessa är nu analyserade av oss forskare med avseende på ett antal akustiska och musikaliska egenskaper som är inlagda i MusikJaktens databas, tillsammans med svaren från frågeformulären. Nu är det er uppgift att undersöka om det finns några samband mellan dessa egenskaper (eller variabler) och svaren från frågeformulären. Har de som hållit på mycket med musik gjort annan musik än de som inte gjort det? Skapar trummisar snabbare musik än icke-trummisar? Ni har möjlighet att titta på alla tänkbara samband i data vi har samlat in, med hjälp av ett enkelt visualiseringsverktyg. Ni skapar diagram, som visar om det finns några samband mellan de skapade ljuden och bakgrundsinformationen om ljudskaparna. Ni kan undersöka hela datamängden eller så väljer ni att titta bara på delar av data genom att filtrera fram de som svarat på ett visst sätt på frågorna. Vår ljudanalys har gått till på följande vis: 1. Alla 5400 ljud som ni har skapat har automatiskt sparats ned som tio sekunder långa ljudfiler. 2. Varje ljudfil har analyserats av ett välkänt och ofta använt programpaket för ljudanalys. Resultatet är en massa olika mätvärden, unika för just det ljudet. Hur stark volymen är, hur ljudenergin fördelas sig över olika frekvenser i varje ögonblick, hur dissonant det låter, hur många toner som spelas, var taktslagen ligger, och mycket mer. 3. Vi har tittat på vilka av dessa ljudegenskaper som kan sammanfatta någonting om ljudet i ett enda mätvärde, och som dessutom är någorlunda lätt att förstå och höra skillnad på. Dessutom ville vi att de utvalda ljudegenskaperna skulle komplettera varandra så bra som möjligt. Vi bestämde oss för att använda åtta uppmätta egenskaper för varje ljud. De förklaras lite längre ner. 4. Dessa mätvärden från varje ljud har sedan laddats in i databasen som innehåller alla ljuden och era svar från frågeformuläret. Så varje ljud är alltså redan analyserat, men vi behöver hjälp med att utforska denna datamängd i jakt på intressanta samband, så kallade korrelationer. Mer om det i nästa avsnitt. För den som vill veta mer om hur själva ljudanalysen gick till, så kan man läsa mer på hemsidan för det programpaket vi använt. Det heter Essentia och är utvecklat av ett stort antal forskare över lång tid, framförallt vid Universitat Pompeu Fabra i Barcelona. De har sammanställt forskning från många olika håll till ett verktyg som alla kan använda gratis. Här är deras hemsida: http://essentia.upf.edu/ Analyserade ljudegenskaper Vi har analyserat ljuden med avseende på hundratals egenskaper, men många av dem lämpar sig mer för att beskriva hur ljudet låter i ett visst ögonblick snarare än över längre tid, och många av egenskaperna kräver en del tekniska kunskaper för att förstå. Så efter att ha tittat noga på vilka variabler som varierar, och vilka som har en tydlig koppling till hur det faktiskt låter, har vi valt ut åtta ljud-egenskaper som ni kan använda i analysen. Nedan förklaras de en och en, med ljudexempel. Alla exemplen är tagna från musiken ni har skapat! Dynamisk komplexitet – Hur mycket ljudet varierar i volym över tid. Om det t ex består av starka trumslag med tystnad emellan så varierar volymen väldigt mycket, och den dynamiska komplexiteten blir då hög. Här är ett par exempel: https://clyp.it/iw30auya https://clyp.it/v5r5euru Om det i stället består av jämnstark ljud hela tiden så är den dynamiska komplexiteten väldigt låg: https://clyp.it/nkw0tfaj Klangligt centrum – Var nånstans i det hörbara frekvensområdet som ljudets tyngdpunkt ligger. Om det till exempel är väldigt mycket höga frekvenser (diskant) i ljudet så är detta värde högt: https://clyp.it/aulfk4sg https://clyp.it/f2w43ysh Om musiken i stället mest innehåller basfrekvenser så kommer värdet att vara väldigt lågt: https://clyp.it/vokocobi Om ljudet består av både höga och låga frekvenser hamnar detta värde någonstans i mitten: https://clyp.it/qb1ul4bo Klanglig komplexitet – Hur komplexa de ingående klangerna är, t ex om musiken består av spretiga, vassa eller brusiga ljud. Förklaras kanske bäst med ett exempel: https://clyp.it/dionlupv Värdet blir istället lågt om ljudet är klangligt väldigt simpelt, med renare toner, eller om musiken har mycket tystnad i sig: https://clyp.it/z0bcmxpm https://clyp.it/ktugeqgm Klanglig variation – Hur mycket klangen varierar över tid. Om det är snabba förändringar i klangfärg hela tiden blir detta värde högt: https://clyp.it/3pw1u4hl https://clyp.it/eqv1a3p2 Om klangfärgen är ungefär likadan hela tiden blir detta värde lågt. https://clyp.it/lsccqtap Dissonans – betyder ungefär "missljudande" och är motsats till konsonans, välljudande. Dissonanta ljud låter alltså inte harmoniska, och skär i örat. Ibland vill man ha dissonanser ändå, så det har inget med om ljudet är bra eller dåligt att göra. Växling mellan dissonans och konsonans är till exempel en av de viktigaste estetiska principerna i den klassiska musiken. Uträkning av dissonans-värdet är baserat ungefär på hur vår hörsel fungerar, och blir alltså ett slags allmänt mått på missljud. Ett exempel på ett mycket dissonant ljud: https://clyp.it/04pirxqf Om värdet är lågt, så låter det snällare och mer harmoniskt för örat: https://clyp.it/1xalokkv Tempo – Detta berättar är helt enkelt hur snabbt musiken går, alltså hur fort man stampar takten till musiken, mätt i taktslag per minut. Två exempel på snabb musik: https://clyp.it/nfdnxhxi https://clyp.it/b10luu2m Exempel på långsam musik: https://clyp.it/p2e4v340 https://clyp.it/mtnd4lto Dansbarhet – Hur lätt det är att dansa till musiken, dvs ett slags mått på hur bra rytmerna passar att röra sig till. Det ligger ganska komplicerade uträkningar bakom, men i princip handlar det om hur tydliga rytmerna i olika lager i musiken är, och hur väl de stämmer överens med varandra. Man kanske kan uttrycka det som hur mycket "gung" musiken har. Några exempel på hög dansbarhet: https://clyp.it/zgc35i2v https://clyp.it/gluqbpox https://clyp.it/tnmqicim Annan musik är svårare att följa med kroppen pga oregelbunden eller oklar rytm, eller långsamt tempo, och har då alltså en väldigt låg dansbarhet: https://clyp.it/aedmomls https://clyp.it/ur0vbkye Toner per sekund – Helt enkelt hur många toner eller trumslag per sekund som musiken innehåller. Det blir ett slags mått på intensitet, men är inte samma sak som tempo. Följande exempel har väldigt många toner, men inte alls särskilt högt tempo - prova att stampa takten så får du se: https://clyp.it/uy5fclol Här ett ljud med väldigt få toner eller trumslag per sekund: https://clyp.it/dmeiykki Analysdelen Vi har alltså räknat ut en massa saker för varje ljud, men vi vet lika lite som ni om hur olika ljudegenskaper varierar i förhållande till er musikaliska bakgrund. Och hur såna samband kan se ut i olika delmängder av databasen. Det är det ni ska undersöka. Detta gör ni med hjälp av ett visualiseringsverktyg där ni väljer vilka data ni vill titta på (filtrering) och vilka variabler ni vill undersöka. Det ser ut så här. • Logga in på http://musikjakten.se och klicka på Diagram för att öppna analysverktyget. Punkt-diagram och korrelationer Ett ord vi avänder ofta när vi talar om data är variabler – ett mätvärde eller frågesvar som helt enkelt kan variera, ha olika värde. I vår undersökning är en variabel alla svaren på en viss fråga från frågeformuläret, eller alla resultaten för en egenskap från ljudanalysen. Varje variabel har många olika svar eller mätvärden. Ni spelar inte samma instrument allihop. Ni har spelat olika många år. Ni tycker olika mycket om att lyssna på musik. Och alla era sparade ljud är väldigt olika och har olika egenskaper, som avspeglas i de mätvärden från ljudanalysen som vi har lagt in i databasen. Variabler kan variera enligt vissa mönster i förhållande till varandra. Ibland finns det inget samband, men ibland så sammanfaller ett högt värde på en variabel med ett högt värde på en annan. De varierar på ett tydligt sätt i förhållande till varandra. Man talar då om en så kallad korrelation. Till exempel så har äldre personer ofta fler års utbildning än yngre personer. Det kan tyckas vara ganska naturligt - det har ju hunnit studera mer. Men alla studerar inte så länge, så det gäller inte alla. Men i genomsnitt så har gissningsvis äldre människor mer utbildning. Alltså finns alltså en korrelation mellan ålder och utbildning. När det är varmare ute säljs det mer glass. Det finns alltså antagligen en korrelation mellan temperatur och glassförsäljning. För att hitta korrelationer använder vi ett enda enkelt verktyg - ett punktdiagram (på engelska: scatter plot): Det fungerar så här: • Du väljer vilken variabel som skall användas som X-koordinat (horisontellt), och vilken som ska användas som Y-koordinat (vertikalt). • För varje ljud i mängden du analyserar (se "filtrering" ovan) så ritas en punkt, baserat på de variabler du har valt. • Du kan välja nästan vilka variabler som helst för X och Y. • Om mängden av alla punkter lutar åt vänster eller höger, så finns det en korrelation mellan de variabler du har valt. Om det bara är ett moln av punkter utan struktur, så finns det antagligen ingen korrelation. Här är en tydlig illustration på punktdiagram med mer eller mindre tydliga korrelationer: Illustrationen är lånad från https://www.mathsisfun.com/data/correlation.html I "riktig" statistik kan man inte bara se att det finns en korrelation (genom att titta på om punktmängden lutar åt något håll). Man kan också räkna ut hur stark korrelationen är. Det är det som visas under diagrammen ovan. Vi har dock valt att inte gå in på det i MusikJakten, för matematiken bakom är ganska komplicerad. Vi kan nöja oss med att konstatera att man talar om en positiv korrelation om låga värden på den ena variabeln sammanfaller med låga värden på den andra, och höga med höga. Man talar om negativ korrelation om det är tvärtom, alltså om den ena variabeln sjunker när den andra stiger. Det finns också andra typer av korrelationer där sambandet inte är så enkelt, men vi överlåter detta åt era matematiklärare. Det är ingenting ni behöver för MusikJakten. Det är viktigt att skilja mellan korrelation (att två variabler varierar tillsammans) och kausalitet (att något orsakar något annat). En korrelation säger ingenting om att det skulle finnas ett orsakssamband mellan variablerna. Säg att det finns en positiv korrelation mellan att vara rik och att vara lycklig. Rikare människor är i så fall också lyckligare. Men det är inte säkert att rikedomen orsakar lyckan. Det kan lika gärna vara tvärtom – att man blivit rik för att man är lycklig, eller att någonting annat har orsakat båda två. Till exempel kan det vara så att ens sociala bakgrund orsakar både rikedom och lycka, eller brist på båda två. Kategori-variabler Vissa data som vi samlat in är ju inte kontinuerligt varierande värden, utan kanske består av "ja" eller "nej", vilket instrument man spelat eller ett av tre eller fem svarsalternativ på en fråga. Här handlar det mer om kategorier, men man kan ändå leta efter samband mellan dessa kategori-svar och mätvärden från ljudanalysen. Dessa variabler går också att välja för diagrammen, och kategorierna omvandlas då till koordinater så att man kan se variationer mellan de som svarat si eller de som svarat så. Kanske finns det en koppling mellan hur komplexa ljuden är och om den som gjort det ofta använder dator för att skapa musik, och därmed är ganska van vid komplexa syntetiska klanger? Då ser man en skillnad i var punktmängderna ritas för varje kategori. Eftersom punkter kan ligga på varandra om de har samma värden, vilket är svårt eller omöjligt att se, så sprider vi ut punkterna lite i sidled, så att det i stället visas som ett punkt-moln. Ju fler punkter, desto tätare moln. Detta gör att du lättare kan se hur punkterna fördelar sig. Ett par exempel: Om båda axlarna har kategori-variabler blir det rektangulära punktmoln: Här följer några exempel på tänkbara korrelationer att undersöka: • Antal år av musikalisk träning - Komplexiteten i musiken • Lyssna på musik är mitt största intresse - Hur mycket lyssnar du på musik? • Det kan också vara intressant att titta på korrelationer mellan akustiska egenskaper och försöka säga något om hur de förhåller sig till varandra. Prova till exemepel att lägga dissonans på Xaxeln och klanglig komplexitet på Y-axeln. Varför ser det ut som det gör, tror ni? Eller Dynamisk komplexitet mot toner per sekund. Fundera över varför inte båda kan ha ett högt värde samtidigt? • Lyssningstid - musikintresse • Lyssningstid - musikletningsgrad De två sista exemplen har variabler från frågeformuläret på båda axlar. Kom då ihåg att varje prick motsvarar ett ljud som sparas av en elev som har svarat just så, inte en prick per elev. Så om en elev har sparat många ljud blir det många prickar. Detta kan göra att diagrammen är lite mer svårtolkade. Filtrering Ett sätt att analysera data är att titta på mindre delmängder, genom att till exempel filtrera fram alla ljud skapade av de som spelat något instrument, eller de som aldrig gjort det. Då begränsas analysen (diagrammet) till att bara visa resultet från ett mindre antal ljud. Eftersom hela databasen består av ca 5000 ljud skapade av mer än 500 elever, så kan det vara bra att titta på mindre delar. Det kan vara lättare att hitta samband då. Exempel på filtreringar: • Alla som har spelat ett instrument någon gång i sitt liv. • • • Alla som spelar tuba. Alla ljud som har ett tempo över 120 slag per minut Alla som aldrig har spelat ett instrument, men som ändå tycker mycket om att lyssna på musik Gör så här för att filtrera datamängden: 1. Till vänster, klicka på den variabel du vill filtrera baserat på. 2. Då visas en regel med två spakar, en för det minimum och en för maximum. De bestämmer tillsammans vilka värden på just den variabeln som ska tas med i diagrammet. Alla ljud som har ett värde mellan dessa två värden kommer alltså att tas med. 3. För frågor som inte har numeriska svar, som t ex kön eller ja/nej-frågor så klickar du bara på det svar du vill ska tas med i analysen. Alla ljud gjorda av elever som svarat just så tas då med i diagrammet. 4. För frågor om instrument så kan du klicka på flera instrument i listan. De ljus skapade av någon som svarat något av de instrumenten på den frågan tas med i diagrammet. 5. Klicka på Tillämpa filter för att filtret ska aktiveras. Dessutom: • Du kan ha flera filter samtidigt. Då måste ljudet uppfylla alla filtreringskraven. Ju fler filter, desto färre punkter blir det i diagrammet. • Ta bort ett filter genom att klicka på krysset bredvid det. Ett exempel på filtrering: I denna filtrering inkluderas alla som ofta går på konserter, spelar piano/elpiano och håller på med datormusik. Spara diagram Om du klickar på Ladda ned diagram så sparas det som en bildfil i standardformatet PNG (Portable Network Graphics), som går att använda i de flesta ordbehandlings- och layoutprogram. Det finns två kända buggar relaterade till detta just nu: OBS! Ladda ned-funktionen verkar vara buggig i Firefox just nu. Vi fixar det så snart vi kan! Hittar ni något intressant, skriv upp hur ni gjorde diagrammet (variabelval och filtrering) så kan ni återskapa det när vi fixat buggen. Eller ta en skärmdump och klipp ut diagrammet från den. OBS! När du laddar ner ett diagram så återställts alla filter och variabelval för diagrammet. Det ska inte vara så, och vi fixar det så fort vi kan. Finns det något samband? Undersök datan och försöka hitta korrelationer mellan olika variabler. Vi vet lika lite som ni om sådana finns, och var de i så fall finns. Pröva olika variabler mot varandra tills du hittar något. Detta kan du göra systematiskt, dvs du prövar varje variabel mot varje annan variabel, vilket tar väldigt lång tid. Eller så baserar du ditt letande på något antagande – alltså en kvalificerad gissning om var det skulle kunna finnas korrelationer, baserat på hur du själv tänker kring musik. Flera sådana tänkbara korrelationer är nämnda i texten ovan, men du kan säkert komma på fler. Glöm inte att du kan filtrera data så att du tittar på bara en liten grupp av alla ljud. Det kan göra det lättare att hitta korrelationer. Men om du filtrerar så hårt att bara några få datapunkter återstår så kan du inte dra några starkare slutsatser. Så det är en avvägning. Skriv ner dina resultat, så att du minns vad du gjort: • Skriv ned vad du gjort som inte ledde till att du fann några samband (det är på sätt och vis också ett resultat). • När du finner något intressant, skriv ned exakt hur du gjorde diagrammet och vad du fann, så att du kan skriva om det på postern, och spara diagrammet så att du kan ha med det också på postern. • Uppskatta om det är en stark eller svag korrelation, och åt vilket håll den går. Jämför med exempeldiagrammen i avsnittet om korrelation ovan. De resultat ni hittar och tar med i era postrar kommer vi att titta på och undersöka närmare, så ni hjälper verkligen oss genom att undersöka data på alla möjlig sätt.