De mest populære ordene som brukes på sosiale medier

Har du noen gang lurt på språket som brukes i sosiale medier? Eller er veiene vi bruker basert på våre personlighetstrekk? Hvis svaret ditt er ja, har du hell.



Bakgrunn

De Positivt psykologisenter basert på University of Pennsylvania opprettet det som er kjent som World Well-Being Project (WWBP). Dette fantastiske prosjektet smir vitenskapelige teknikker ved å måle psykologisk velvære og fysisk helse basert på analyse av språk i sosiale medier. De lyseste informatikerne, psykologene og statistikerne setter hodet sammen på de psykososiale prosessene som påvirker helse og lykke, og utforsker potensialet for å erstatte dyre undersøkelsesmetoder. I 2013 publiserte WWBP en studere med tittelen Personality, Gender, and Age in the Language of Social Media: The Open-Vocabulary Approach. I en av de største studiene hittil analyserte WWBP over 700 millioner ord, setninger og emneforekomster samlet fra Facebook-meldingene til 75.000 frivillige. For å analysere meldingene brukte de to forskjellige metoder for å finne demografiske og psykologiske attributter:

  • Differensial språkanalyse (DLA): en metode designet av WWBP for å identifisere de mest karakteristiske språkfunksjonene fra et gitt attributt.
  • Språklig forespørsel og antall ord (LIWC): et populært verktøy som brukes i psykologi for å finne måter folk bruker ord i hverdagen. Dette kan gi rik informasjon om deres tro, frykt, tenkemønster, sosiale forhold og personligheter.

I denne studien fikk WWBP også frivillige til å ta standard personlighetstester (Big 5 Factor Model) for å bestemme ordene som ble brukt i visse personlighetstrekk. Kombiner alle disse, og de var i stand til å koble det sosiale mediaspråket til personlighet, kjønn og alder med 91,9% nøyaktighet. La oss nå skitne hendene og se på hvordan de samlet Facebook-statusoppdateringene og formulerte visualiseringskartene sine.



Dataen

Hele datasettet besto av omtrent 19 millioner Facebook-statusoppdateringer skrevet av alle deltakerne. Teamet på WWBP begrenset analysen til de Facebook-brukerne som oppfyller 4 visse kriterier:

  • De må angi engelsk som hovedspråk
  • Har skrevet minst 1000 ord i statusoppdateringene
  • Vær under 65 år
  • Angi kjønn (Mann og Kvinne) og alder

Kjønnsspråk:

sosiale mediaspråk

Kvinnelige språkfunksjoner vises på toppen med mannlige språkfunksjoner nedenfor. S ize av ordet indikerer styrken på korrelasjonen; de Farge indikerer relativ bruksfrekvens. Understreker (_) koble sammen ord med flerordssetninger.



  • Kvinner fra denne studien (Topp), brukte flere følelsesord (f.eks. begeistret) og førstepersons-entall, og de nevner mer psykologiske og sosiale prosesser (f.eks. ‘elsker deg’ og ‘<3’ –a heart).
  • Ills brukte flere banneord og objektreferanser (f.eks. 'xbox', 'black ops', 'wish he').

Aldersspråk:

sosiale mediaspråk

Som du kan se i figur 3 ovenfor, er det subtile endringer av emner som går fra en aldersgruppe til den neste. Det er også klare skiller i ord som bruk av slang, uttrykksikoner og Internett snakker i 13 til 18 år . I 23 til 29 aldersgruppe , du kan se et par Internett snakker eller arbeidstemaer (f.eks. ‘på jobben’, ‘ny jobb’). Vi ser en skole relatert emne for 13 til 18 åringer (f.eks. 'skole', 'lekser', 'ugh'), mens vi ser a høyskole relatert emne for 19 til 22 åringer (f.eks. 'semester', 'college', 'register'). Når du går videre til Aldersgruppen 30 til 65 år , ord som brukes er mer fokusert på emosjonell stabilitet med familie og venner (f.eks. 'datter', 'min sønn', 'mine barn' og 'mine fb-venner'). Generelt vil du se en progresjon av skole, høyskole, arbeid og familie når du ser på hovedtemaene i alle aldersgrupper.





Standardfrekvens for emner og ord basert på alder: sosiale mediaspråk

I Fig. 4A , viser grafen den relative frekvensen av de mest selektive emnene for hver aldersgruppe som en funksjon av alder. Fig. 4B forsterker denne hypotesen ved å presentere et lignende mønster basert på andre sosiale temaer. Fig. 4C viser bruken av ‘vi’ øker etter fylte 22 år, mens ‘jeg’ avtar. Dette antyder definitivt den økende betydningen av vennskap og forhold når folk blir eldre.



Personlighetens språk:

Forskerne gravde inn i hvordan vårt språk og vår personlighet falt sammen. De analyserte ordene som ble brukt av deltakerne og organiserte dem basert på personligheten til hver deltaker. Her er en rask oppdatering av de 5 personlighetsfaktorene:

  • Ekstroversjon: beskriver hvordan du samhandler med mennesker.
  • Nevrotisme: er hvordan du takler følelser
  • Behagelighet: er hvordan du føler deg overfor andre
  • Samvittighetsfullhet: beskriver hvor organisert og pålitelig du er
  • Åpenhet: er når noen er nysgjerrige og åpne sinn for nye opplevelser og kunnskap
sosiale mediaspråk sosiale mediaspråk

Vi kan se øverst til venstre at sosialt relaterte kategorier liker parti emner dukker opp som et sentralt kjennetegn ved Ekstroverte . I tillegg antyder resultatene det Introverte er interessert i japanske medier (f.eks. 'anime', 'manga', 'internett' og uttrykksikoner i japansk stil: ˆ_ˆ). Nederst til venstre i figur 5 ovenfor viser at folk Høy i nevrotisme ofte nevnte setninger som ‘syk av’, ‘deprimert’ og ‘jeg hater’. Nederst til høyre viser språk relatert til emosjonell stabilitet ( Lav nevrotisme ). Lav nevrotisk enkeltpersoner skrev om hyggelige sosiale aktiviteter som fremmer harmoni eller skaper en større følelsesmessig balanse, for eksempel ‘sport’, ‘ferie’, ‘strand’, ‘kirke’, ‘lag’ og et familie tid emne. I figur 6 nedenfor (nederst til høyre), personer som viser Lav åpenhet bruk forkortede ord i statusoppdateringen (f.eks. '2day', 'ur', 'hver 1'). Folk som er det High Open (nederst til venstre) bruker kreative ord (f.eks. 'kunst', 'univers', 'musikk', 'skriving' og 'sjel'). Du kan ikke resonere med dette, men Lav samvittighetsfullhet mennesker (Midt til venstre) bruker veldig eksplisitte ord i oppdateringene sine mens Høy samvittighetsfullhet mennesker (Midt-venstre) bruker setninger (f.eks. 'å jobbe', 'klar for' og 'flott dag'). Som du kan se, er sosiale medieplattformer som Facebook og Twitter veldig gunstige ressurser for studiet av mennesker; statusoppdateringer og tweets er uttrykksfulle, personlige og har emosjonelt innhold. Husk noen ting:





  • Dette språket er generelt upartisk og er målbare atferdsdata
  • Facebook-språk lar forskere spesifikt observere enkeltpersoner når de presenterer sitt sanne jeg for den elektroniske verdenen.

FOR Metode

Figur 1



Som du kan se fra figur 1 ovenfor, opererer DLA av: 1.) Funksjonsekstraksjon: Pakke ut språk etter: (a) ord og uttrykk : en sekvens på 1 til 3 ord funnet i en tekststreng, uttrykksikoner og to eller flere ord som tilsvarer en vanlig måte å si ting på. (b) emner : analyserer automatisk store samlinger av umerket tekst. 2.) Korrelasjonsanalyse: prosessen med å korrelere ord med kjønn, alder og personlighet. Siden de fant tusenvis av signifikant korrelerte ord, var visualiseringskart nøkkelen til å forstå forskningen deres (se figur 2 nedenfor).

Fascinerende ikke sant?