Har du noen gang lurt på språket som brukes i sosiale medier? Eller er veiene vi bruker basert på våre personlighetstrekk? Hvis svaret ditt er ja, har du hell.
De Positivt psykologisenter basert på University of Pennsylvania opprettet det som er kjent som World Well-Being Project (WWBP). Dette fantastiske prosjektet smir vitenskapelige teknikker ved å måle psykologisk velvære og fysisk helse basert på analyse av språk i sosiale medier. De lyseste informatikerne, psykologene og statistikerne setter hodet sammen på de psykososiale prosessene som påvirker helse og lykke, og utforsker potensialet for å erstatte dyre undersøkelsesmetoder. I 2013 publiserte WWBP en studere med tittelen Personality, Gender, and Age in the Language of Social Media: The Open-Vocabulary Approach. I en av de største studiene hittil analyserte WWBP over 700 millioner ord, setninger og emneforekomster samlet fra Facebook-meldingene til 75.000 frivillige. For å analysere meldingene brukte de to forskjellige metoder for å finne demografiske og psykologiske attributter:
I denne studien fikk WWBP også frivillige til å ta standard personlighetstester (Big 5 Factor Model) for å bestemme ordene som ble brukt i visse personlighetstrekk. Kombiner alle disse, og de var i stand til å koble det sosiale mediaspråket til personlighet, kjønn og alder med 91,9% nøyaktighet. La oss nå skitne hendene og se på hvordan de samlet Facebook-statusoppdateringene og formulerte visualiseringskartene sine.
Hele datasettet besto av omtrent 19 millioner Facebook-statusoppdateringer skrevet av alle deltakerne. Teamet på WWBP begrenset analysen til de Facebook-brukerne som oppfyller 4 visse kriterier:
Kvinnelige språkfunksjoner vises på toppen med mannlige språkfunksjoner nedenfor. S ize av ordet indikerer styrken på korrelasjonen; de Farge indikerer relativ bruksfrekvens. Understreker (_) koble sammen ord med flerordssetninger.
Som du kan se i figur 3 ovenfor, er det subtile endringer av emner som går fra en aldersgruppe til den neste. Det er også klare skiller i ord som bruk av slang, uttrykksikoner og Internett snakker i 13 til 18 år . I 23 til 29 aldersgruppe , du kan se et par Internett snakker eller arbeidstemaer (f.eks. ‘på jobben’, ‘ny jobb’). Vi ser en skole relatert emne for 13 til 18 åringer (f.eks. 'skole', 'lekser', 'ugh'), mens vi ser a høyskole relatert emne for 19 til 22 åringer (f.eks. 'semester', 'college', 'register'). Når du går videre til Aldersgruppen 30 til 65 år , ord som brukes er mer fokusert på emosjonell stabilitet med familie og venner (f.eks. 'datter', 'min sønn', 'mine barn' og 'mine fb-venner'). Generelt vil du se en progresjon av skole, høyskole, arbeid og familie når du ser på hovedtemaene i alle aldersgrupper.
I Fig. 4A , viser grafen den relative frekvensen av de mest selektive emnene for hver aldersgruppe som en funksjon av alder. Fig. 4B forsterker denne hypotesen ved å presentere et lignende mønster basert på andre sosiale temaer. Fig. 4C viser bruken av ‘vi’ øker etter fylte 22 år, mens ‘jeg’ avtar. Dette antyder definitivt den økende betydningen av vennskap og forhold når folk blir eldre.
Forskerne gravde inn i hvordan vårt språk og vår personlighet falt sammen. De analyserte ordene som ble brukt av deltakerne og organiserte dem basert på personligheten til hver deltaker. Her er en rask oppdatering av de 5 personlighetsfaktorene:
Vi kan se øverst til venstre at sosialt relaterte kategorier liker parti emner dukker opp som et sentralt kjennetegn ved Ekstroverte . I tillegg antyder resultatene det Introverte er interessert i japanske medier (f.eks. 'anime', 'manga', 'internett' og uttrykksikoner i japansk stil: ˆ_ˆ). Nederst til venstre i figur 5 ovenfor viser at folk Høy i nevrotisme ofte nevnte setninger som ‘syk av’, ‘deprimert’ og ‘jeg hater’. Nederst til høyre viser språk relatert til emosjonell stabilitet ( Lav nevrotisme ). Lav nevrotisk enkeltpersoner skrev om hyggelige sosiale aktiviteter som fremmer harmoni eller skaper en større følelsesmessig balanse, for eksempel ‘sport’, ‘ferie’, ‘strand’, ‘kirke’, ‘lag’ og et familie tid emne. I figur 6 nedenfor (nederst til høyre), personer som viser Lav åpenhet bruk forkortede ord i statusoppdateringen (f.eks. '2day', 'ur', 'hver 1'). Folk som er det High Open (nederst til venstre) bruker kreative ord (f.eks. 'kunst', 'univers', 'musikk', 'skriving' og 'sjel'). Du kan ikke resonere med dette, men Lav samvittighetsfullhet mennesker (Midt til venstre) bruker veldig eksplisitte ord i oppdateringene sine mens Høy samvittighetsfullhet mennesker (Midt-venstre) bruker setninger (f.eks. 'å jobbe', 'klar for' og 'flott dag'). Som du kan se, er sosiale medieplattformer som Facebook og Twitter veldig gunstige ressurser for studiet av mennesker; statusoppdateringer og tweets er uttrykksfulle, personlige og har emosjonelt innhold. Husk noen ting:
Figur 1
Som du kan se fra figur 1 ovenfor, opererer DLA av: 1.) Funksjonsekstraksjon: Pakke ut språk etter: (a) ord og uttrykk : en sekvens på 1 til 3 ord funnet i en tekststreng, uttrykksikoner og to eller flere ord som tilsvarer en vanlig måte å si ting på. (b) emner : analyserer automatisk store samlinger av umerket tekst. 2.) Korrelasjonsanalyse: prosessen med å korrelere ord med kjønn, alder og personlighet. Siden de fant tusenvis av signifikant korrelerte ord, var visualiseringskart nøkkelen til å forstå forskningen deres (se figur 2 nedenfor).
Fascinerende ikke sant?