Lektor, ph.d.
Laila Kjærbæk
  • Forside
  • Om
  • Forskning
  • Publikationer
  • Foredrag
  • Konsulent
  • I medierne
  • Blog
  • Kontakt

Statistisk læring

5/20/2014

0 Comments

 
For nylig læste jeg en interessant artikel om statistisk læring. Statistisk læring refererer til den proces der finder sted, når man identificerer enheder i inputtet (fx ord eller kategorier), ved at opdage hvilke træk i inputtet, der forudsiger andre træk, samt når man grupperer træk der efter stor sandsynlighed optræder sammen. Definitionen af statistisk læring minder om definitionen af associativ læring, og association er da også en vigtig komponent af statistisk læring, der fordrer evnen til at associere to stimuli der efter stor sandsynlighed optræder sammen – MEN de to typer læring er ikke identiske. Der er mange eksempler på associativ læring, der ikke er statistisk læring (fx frygtbetingning og madaversion). Statistisk læring er en form for implicit læring, fordi indlæreren oftest er ubevidst om hvad hun/han har lært.

Artiklen beskriver to typer af statistisk læring: 1) Betinget statistik, der forudsiger sandsynligheden af begivenhed Y, forudsat information om hvorvidt en anden begivenhed X har fundet sted. 2) Distributionel statistik, der vurderer den centrale tendens og variation af medlemmer af samme population, såsom en distribution af farver rangerende fra en prototypisk blå, til blå-grøn, til prototypisk grøn. Hvor sandsynligt er det at hver af disse farver optræder? Hvilken farve er mest almindelig? Børn identificerer hurtigere statistiske relationer i stimuli der tiltrækker deres opmærksomhed.

Arbejdshukommelse spiller en vigtig rolle i forhold til hvilken statistik indlæreren er i stand til at opfange. Måden hvorpå en indlærer opfatter inputtet, har en signifikant effekt på deres maksimale indlæring. Statistisk læring er fx relevant i forhold til ordindlæring. Eksempel: enhver ny betegnelse kan i princippet referere til enhver genstand, der er tilstede på pågældende tidspunkt, endda også til fraværende genstande. En måde at løse dette problem på er via gentagne referencer til ord. Første gang et barn hører et ord, optræder det måske sammen med fire genstande A, B, C, D – og ordet kan således referere til en hvilken som helst af disse fire genstande. Men hvis barnet hører ordet en anden gang, hvor det optræder sammen med genstande B, E, F og G, så er sandsynligheden for at ordet refererer til genstand B forøget væsentligt. 

Statistisk læring er fx relevant i forhold til ordsegmentering. Børn lærer at segmentere talestrømmen op i mindre sprogligt relevante enheder ved hjælp af fonotaktiske, rytmiske og andre cues – og statistisk læring hjælper indlæreren med at identificere funktionen af disse akustiske cues, fx hvorvidt tryk angiver begyndelsen eller enden på et ord i flydende tale. Begrænsningerne i forbindelse med statistisk læring ændres som en funktion af alder og indlærerens tidligere erfaringer. Dette kan hjælpe til at forklare et af de store spørgsmål inden for sprogtilegnelse: hvorfor har små børn større succes med at tilegne sig sprog end voksne? Det er dette, der også refereres til som en kritisk eller sensitiv periode – altså hvis en indlærer ikke mestrer et sprog fuldt ud før puberteten, så er det ikke sandsynligt at de nogensinde kommer til at opnå fuld lingvistisk kompetence. Selvom nogle voksne opnår et modersmålslignende niveau, så er der en klar konsensus i litteraturen om at voksne finder det sværere at tilegne sig sprog end børn. Entrenchment hypotesen: det voksne har lært om deres førstesprog konflikter med deres andetsprog og gør sprogtilegnelse som voksen sværere.

Thiessen, Erik (2009). ”Statistical Learning”. I Bavin (ed.) The Cambridge Handbook of Child Langue. Cambridge: Cambridge University Press, 35-50.
0 Comments

Min ph.d.-afhandling

5/20/2014

0 Comments

 
Tilegnelse af bøjningsmorfologi
- en undersøgelse af substantivernes pluralisbøjning hos normaltudviklede danske børn i alderen 0-10 år

Min ph.d.-afhandling er baseret på en grundvidenskabelig undersøgelse som er led i projektet Interaktion mellem leksikon og morfologi i modersmålstilegnelsen der ledes af min vejleder Professor Hans Basbøll. Projektet indgår i det internationale tværsproglige forskningsprojekt Noun Development in a Cross-Linguistic Perspective: the Interface of Lexicon and Grammar in First Language Acquisition som ledes af Professor Emeritus Wolfgang U. Dressler, Wiens Universitet og det Østrigske Videnskabsakademi. I det internationale projekt deltager også forskergrupper ledet af Professor Steven Gillis, Universitetet i Antwerpen og af Professor Dorit Ravid, Tel Avivs Universitet. Målet med det internationale projekt er at gennemføre et tværsprogligt studie af udviklingen af nominalpluralis hos børn i alderen 0-10 år. Til dette formål er der udvalgt to beslægtede og typologisk sammenlignelige sprog, (østrigsk) tysk og hollandsk (nederlandsk), samt et mere fjernt sprog nemlig hebraisk. Min afhandling centrerer sig om den danske del af projektet samt et tværlingvistisk studie af dansk og (østrigsk) tysk.

Empiriske data
Afhandlingen udgør et empiriske studie baseret på en blandet forskningsmetode der anvender fem forskellige typer af data: 1) leksikalske data; 2) rapporterede data; 3) naturalistiske spontane talesprogsdata (input og output); 4) semi-naturalistiske/semi-eksperimentelle data; 5) eksperimentelle data.

Målsætninger
Ph.d.-projektets mål er at undersøge udviklingen af substantiv pluralis hos danske børn fra den første forekomst op til 10-årsalderen. Derfor analyserede vi det danske substantiv pluralissystem og beskrev det ud fra et lydligt perspektiv – noget der aldrig er gjort før – eftersom børn tilegner sig sproget baseret på det talte sprog de hører. Vi har valgt en blandet forskningsmetode med både kvantitative og kvalitative data, for at få et mere nuanceret billede af danske børns tilegnelse af substantiv pluralis.

Vi undersøgte distributionen af pluralismarkører i: i) det danske leksikon; ii) sprogligt input til børn; 3) barnetale. Derudover ønskede vi at besvare følgende spørgsmål: Hvornår begynder det typiske danske barn at producere pluralis? Hvordan optræder og udvikler kategorien substantiv pluralis sig hos danske børn? Hvilke faktorer (fx input frekvenser, lydstruktur) påvirker danske børns tilegnelse af substantiv pluralis? Hvordan er danske børns produktion af substantiv pluralis sammenlignet med fx tysktalende børns?

Vi ønskede også at undersøge metodiske aspekter (fx længde- vs. tværsnitsdata; rapporterede vs. naturalistiske spontane talesprogsdata; semi-naturalistiske/semi- eksperimentelle vs. eksperimentelle data).

Resultater og diskussion
Analysen af det danske substantiv pluralissystem resulterede i 23 pluralismarkører som hver kombinerer et pluralissuffiks (inkl. nulsuffiks) med en specifik stammeændring (inkl. ingen stammeændring). Vi præsenterer endvidere en identifikation af fire klasser af stammefinale fonemer der forudsiger forskellige distributioner af pluralissuffikser. Denne beskrivelse lægger grundlaget for analyser af dansk morfologi baseret på tale og ikke, som det hidtil har været tilfældet, på skriftsprog.

Det empiriske studie viser at det typiske danske barn begynder at producere pluralisformer omkring sin 2-års fødselsdag (eller endnu tidligere). Antallet af korrekte pluralisformer stiger med alderen, men pluralissystemet er stadig ikke fuldt ud tilegnet i 10-årsalderen.Distributionen af pluralismarkører i det sproglige input til børn adskiller sig fra distributionen i det danske leksikon. Pluralismarkørerne “er” (fx banan/bananer [ba'næ:ʔn]/[ba'næ:ʔnɐ]) og “er+” (fx baby/babyer ['bɛjbi]/['bɛjbi:ʔɐ]) har en markant lavere inputfrekvens end leksikalsk frekvens, sandsynligvis fordi kategorierne indeholder mange indlånte ord. Det modsatte gør sig gældende for pluralismarkøren “(e)r” (fx bamse/bamser ['bɑmsə]/['bɑmsɐ]) der har en lavere leksikalsk frekvens end inputfrekvens. Pluralismarkøren “Ø” (rene nuller, singularis = pluralis, mål/mål [mɔ:ʔl]/[mɔ:ʔl]), har langt højere inputfrekvens end leksikalsk frekvens, sandsynligvis fordi kategorien indeholder mange børnerelevante ord (fx sko/sko [sgo:ʔ]/[sgo:ʔ], får/får [fɔ:ʔ]/[fɔ:ʔ]). Distributionen af pluralismarkører i børnenes tale svarer stort set til det sproglige input til børnene. Den eneste forskel er den fuldproduktive pluralismarkør “(e)r”, der optræder ekstremt hyppigt i børnenes tale og medfører tilsvarende lave frekvenser for de øvrige pluralismarkører.

Undersøgelsen indikerer at pluralissuffikset a-schwa tilegnes tidligere end både e-schwa og nul-suffiks. Dette kan skyldes at a-schwa-suffikset er langt hyppigere end de to andre suffikser, og at a-schwa aldrig reduceres eller bortfalder sådan som det er tilfældet med e-schwa-suffikset.

Undersøgelsen indikerer endvidere at ’ingen stammeændring’ tilegnes tidligere end ’prosodiske stammeændringer’ (synkope, ændring af a-kvalitet/vokallængde, stødtab, stødtilføjelse), og derefter tilegnes ’segmentelle (fonemiske) stammeændringer’ (omlyd, r-indsættelse).

Fejlanalyser viser at overgeneralisering af pluralismarkøren “Ø” er klart den hyppigste fejlform hos danske børn. Det indikerer at danske børn generaliserer pluralismarkøren ”Ø” og opfatter den som en mulig (produktiv) pluralismarkør, trods dens lave type frekvens. Danske børn regulariserer også pluralismarkøren “er”, men denne regularisering er mindre frekvent. Børnene regulariserer nogle gange ’ingen stammeændring’; overgeneralisering af ’prosodiske stammeændringer’ er meget sjælden, mens ’segmentelle (fonemiske) stammeændringer’ aldrig overgeneraliseres.

Substantiv pluralisformer findes tidligere i naturalistiske spontane børnesprogsdata end i rapporterede data, sandsynligvis fordi forældre ikke opfanger alt hvad deres barn siger. Substantiv pluralis findes tidligere i rapporterede tværsnitlige data end i rapporterede længdesnitsdata. Børn producerer en højere procentdel af korrekte pluralisformer i semi-naturalistiske/semi-eksperimentelle data end i eksperimentelle data, hvilket kan skyldes en primingeffekt (dvs. at et ord påvirker de(t) følgende), samt de mere unaturlige rammer i eksperimentet. Undersøgelsens resultater tyder på at de specifikke items inkluderet i eksperimentet indvirker på resultatet.

I afhandlingen præsenteres en generel typologisk relevant graduering af stammeændringer for at muliggøre tværsproglige studier af stammeændringers relevans for børns produktion af substantiv pluralis. Til dette formål udviklede vi en klassifikation af stammeændringer i tre niveauer med stigende utydelighed: ’ingen ændring’, ’svag ændring’, ’stærk ændring’. I undersøgelsen sammenlignede vi dansktalende børn med tysktalende børn og resultaterne tyder på at ’stærk ændring’ er mere forsinkende for tilegnelsen af begge sprog end ’svag ændring’ og ’ingen ændring’, samt at ’stærk ændring’ er en mere forsinkende faktor i dansk end tysk, sandsynligvis fordi kategorien er mere homogen og mere frekvent på tysk end på dansk. ’svag ændring’ ser derimod ud til at forsinke mere på tysk end på dansk, hvilket sandsynligvis skyldes at den kategori er af ren prosodisk karakter. Vi fandt ikke nogen signifikant forskel i antallet af korrekte pluralisformer mellem de to sprog.

Konklusion
Kategorien substantiv pluralis begynder typisk at dukke op i 2-årsalderen, men hele pluralisbøjningssystemet er stadig ikke fuldt tilegnet i 10-årsalderen. Vi fandt forventede forskelle mellem distributionen af pluralismarkører i det danske leksikon og det sproglige input til børn, hvorimod distributionen af pluralismarkører er meget ens i børnesprogligt input og output. Baseret på rent fonetisk/fonologisk-baserede analyser har vi fundet fælles mønstre på tværs af datatyper såvel som forventede forskelle. Et suffiks der kan bortfalde (e-schwa) og er mindre frekvent i inputtet, tilegnes senere end et suffiks der har en højere inputfrekvens og ikke kan bortfalde.’Segmental (fonemisk) stammeændring’ tilegnes senere end ’ingen stammeændring’ og ’prosodisk stammeændring’. Singularis i stedet for pluralis er en meget hyppig fejlform hos danske børn, faktisk tyder resultaterne på at danske børn bruger singularisformen som en default. Undersøgelsen tyder på at lydstruktur og inputfrekvens påvirker tilegnelsen af substantiv pluralis. Danske børn er ikke senere end tyske børn i deres tilegnelse af substantiv pluralis.

Forsvaret 7. november 2013
0 Comments

    Laila Kjærbæk

    Jeg er lektor, ph.d. og har i mange år forsket, undervist, skrevet og holdt foredrag inden for områderne børn, sprog og læring.

    Her blogger jeg om den nyeste forskning, aktuelle emner og spørgsmål der optager mig i relation til mine forsknings- og undervisningsområder.

    Archives

    December 2018
    March 2018
    March 2017
    December 2015
    September 2015
    August 2015
    September 2014
    May 2014
    February 2014

    Categories

    All
    Afasi
    Dansk Sprog
    Læring
    Morfologi
    Ph.d.
    Sprogtilegnelse
    Statistisk Læring

    RSS Feed

Laila Kjærbæk © 2020