For nylig læste jeg en interessant artikel om statistisk læring. Statistisk læring refererer til den proces der finder sted, når man identificerer enheder i inputtet (fx ord eller kategorier), ved at opdage hvilke træk i inputtet, der forudsiger andre træk, samt når man grupperer træk der efter stor sandsynlighed optræder sammen. Definitionen af statistisk læring minder om definitionen af associativ læring, og association er da også en vigtig komponent af statistisk læring, der fordrer evnen til at associere to stimuli der efter stor sandsynlighed optræder sammen – MEN de to typer læring er ikke identiske. Der er mange eksempler på associativ læring, der ikke er statistisk læring (fx frygtbetingning og madaversion). Statistisk læring er en form for implicit læring, fordi indlæreren oftest er ubevidst om hvad hun/han har lært.
Artiklen beskriver to typer af statistisk læring: 1) Betinget statistik, der forudsiger sandsynligheden af begivenhed Y, forudsat information om hvorvidt en anden begivenhed X har fundet sted. 2) Distributionel statistik, der vurderer den centrale tendens og variation af medlemmer af samme population, såsom en distribution af farver rangerende fra en prototypisk blå, til blå-grøn, til prototypisk grøn. Hvor sandsynligt er det at hver af disse farver optræder? Hvilken farve er mest almindelig? Børn identificerer hurtigere statistiske relationer i stimuli der tiltrækker deres opmærksomhed.
Arbejdshukommelse spiller en vigtig rolle i forhold til hvilken statistik indlæreren er i stand til at opfange. Måden hvorpå en indlærer opfatter inputtet, har en signifikant effekt på deres maksimale indlæring. Statistisk læring er fx relevant i forhold til ordindlæring. Eksempel: enhver ny betegnelse kan i princippet referere til enhver genstand, der er tilstede på pågældende tidspunkt, endda også til fraværende genstande. En måde at løse dette problem på er via gentagne referencer til ord. Første gang et barn hører et ord, optræder det måske sammen med fire genstande A, B, C, D – og ordet kan således referere til en hvilken som helst af disse fire genstande. Men hvis barnet hører ordet en anden gang, hvor det optræder sammen med genstande B, E, F og G, så er sandsynligheden for at ordet refererer til genstand B forøget væsentligt.
Statistisk læring er fx relevant i forhold til ordsegmentering. Børn lærer at segmentere talestrømmen op i mindre sprogligt relevante enheder ved hjælp af fonotaktiske, rytmiske og andre cues – og statistisk læring hjælper indlæreren med at identificere funktionen af disse akustiske cues, fx hvorvidt tryk angiver begyndelsen eller enden på et ord i flydende tale. Begrænsningerne i forbindelse med statistisk læring ændres som en funktion af alder og indlærerens tidligere erfaringer. Dette kan hjælpe til at forklare et af de store spørgsmål inden for sprogtilegnelse: hvorfor har små børn større succes med at tilegne sig sprog end voksne? Det er dette, der også refereres til som en kritisk eller sensitiv periode – altså hvis en indlærer ikke mestrer et sprog fuldt ud før puberteten, så er det ikke sandsynligt at de nogensinde kommer til at opnå fuld lingvistisk kompetence. Selvom nogle voksne opnår et modersmålslignende niveau, så er der en klar konsensus i litteraturen om at voksne finder det sværere at tilegne sig sprog end børn. Entrenchment hypotesen: det voksne har lært om deres førstesprog konflikter med deres andetsprog og gør sprogtilegnelse som voksen sværere.
Thiessen, Erik (2009). ”Statistical Learning”. I Bavin (ed.) The Cambridge Handbook of Child Langue. Cambridge: Cambridge University Press, 35-50.
Artiklen beskriver to typer af statistisk læring: 1) Betinget statistik, der forudsiger sandsynligheden af begivenhed Y, forudsat information om hvorvidt en anden begivenhed X har fundet sted. 2) Distributionel statistik, der vurderer den centrale tendens og variation af medlemmer af samme population, såsom en distribution af farver rangerende fra en prototypisk blå, til blå-grøn, til prototypisk grøn. Hvor sandsynligt er det at hver af disse farver optræder? Hvilken farve er mest almindelig? Børn identificerer hurtigere statistiske relationer i stimuli der tiltrækker deres opmærksomhed.
Arbejdshukommelse spiller en vigtig rolle i forhold til hvilken statistik indlæreren er i stand til at opfange. Måden hvorpå en indlærer opfatter inputtet, har en signifikant effekt på deres maksimale indlæring. Statistisk læring er fx relevant i forhold til ordindlæring. Eksempel: enhver ny betegnelse kan i princippet referere til enhver genstand, der er tilstede på pågældende tidspunkt, endda også til fraværende genstande. En måde at løse dette problem på er via gentagne referencer til ord. Første gang et barn hører et ord, optræder det måske sammen med fire genstande A, B, C, D – og ordet kan således referere til en hvilken som helst af disse fire genstande. Men hvis barnet hører ordet en anden gang, hvor det optræder sammen med genstande B, E, F og G, så er sandsynligheden for at ordet refererer til genstand B forøget væsentligt.
Statistisk læring er fx relevant i forhold til ordsegmentering. Børn lærer at segmentere talestrømmen op i mindre sprogligt relevante enheder ved hjælp af fonotaktiske, rytmiske og andre cues – og statistisk læring hjælper indlæreren med at identificere funktionen af disse akustiske cues, fx hvorvidt tryk angiver begyndelsen eller enden på et ord i flydende tale. Begrænsningerne i forbindelse med statistisk læring ændres som en funktion af alder og indlærerens tidligere erfaringer. Dette kan hjælpe til at forklare et af de store spørgsmål inden for sprogtilegnelse: hvorfor har små børn større succes med at tilegne sig sprog end voksne? Det er dette, der også refereres til som en kritisk eller sensitiv periode – altså hvis en indlærer ikke mestrer et sprog fuldt ud før puberteten, så er det ikke sandsynligt at de nogensinde kommer til at opnå fuld lingvistisk kompetence. Selvom nogle voksne opnår et modersmålslignende niveau, så er der en klar konsensus i litteraturen om at voksne finder det sværere at tilegne sig sprog end børn. Entrenchment hypotesen: det voksne har lært om deres førstesprog konflikter med deres andetsprog og gør sprogtilegnelse som voksen sværere.
Thiessen, Erik (2009). ”Statistical Learning”. I Bavin (ed.) The Cambridge Handbook of Child Langue. Cambridge: Cambridge University Press, 35-50.