Articles

På «Geek» Versus «Nerd»

X

Personvern & Informasjonskapsler

Dette webområdet bruker cookies. Ved å fortsette, er du samtykker til deres bruk. Lære mer, herunder hvor å kontrollere informasjonskapsler.

Fikk Det!

Annonser

For mange mennesker, «geek» og «nerd» er synonymer, men faktum er at de er litt annerledes., Vurdere uttrykket «sport geek» — en sporadisk erstatning for «jock» og kanskje den erkerivalen av en «nerd» i videregående skole, folklore. Hvis «geek» og «nerd» er synonymer, deretter «sport geek» kan være en selvmotsigelse. (Videre, «sport nerd» enten ikke beregne eller betyr det noe annet.)

I mitt sinn, «geek» og «nerd» er i slekt, men fange opp ulike dimensjoner av et intenst engasjement for et emne:

  • geek – En entusiast av et bestemt emne eller feltet. Geeks er «samling» orientert, innsamling av fakta og minner knyttet til deres gjenstand for interesse., De er besatt med den nyeste, kuleste, mest trendy ting som deres emnet har å tilby.
  • nerd – En ivrig intellektuelle, selv igjen av et bestemt emne eller feltet. Nerder er «prestasjon» orientert, og fokusere sin innsats på å tilegne seg kunnskap og ferdigheter over trivia og memorabilia.

Eller, for å si det pictorially à la The Simpsons:

Begge er dedikert til sine fag, og noen ganger sosialt klosset. Skillet er at geeks er fans av sine undersåtter, og nerder er utøvere av dem., En datamaskin geek kan lese Kablet og ta hurtig på Silicon Valley ryktet-mill for fører på neste hot-ny-ting, mens en datanerd kan lese CLRS og holde et øye for smarte nye måter å anvende Dijkstra ‘ s algoritme. Merk at selv ikke synonymer, de er ikke nødvendigvis distinkte enten: mange geeks er også nerder (og vice versa).

Et Eksperiment

Ikke jeg har noen bevis for denne kontrasten? (Forresten, dette synspunktet kan dateres tilbake til en grad-skolen samtale med andre geek/nerd Bryan Barnes, nå en fysiker ved NIST.,) Den Wiktionary oppføringer for «geek» og «nerd» låne noen troverdighet til min posisjon, men jeg ønsker noe litt mer empiriske…

«Du skal vite at et ord av selskapet det holder» ~ J. R. Firth (1957)

for Å beskrive likheter og forskjeller mellom «geek» og «nerd,»kanskje vi kan finne på andre ord som har en tendens til å holde dem med selskap, og se om disse språklige følgesvenner støtte mitt synspunkt?

Data og Metode

(Merk: Hvis du er verken en geek eller en nerd, ikke bli redd av matematikk., Det er ikke så ille… eller kanskje du kan bare hoppe over til «Resultater» ledd nedenfor…)

jeg analysert to kilder til Twitter data, siden den er lett tilgjengelig og ganske nerdete/nerdete å starte opp. Dette inkluderer en bakgrunn korpus av 2,6 millioner tweets via streaming API fra mellom 6. desember 2012 og januar 3, 2013. Jeg har også samplet tweets via søke-API som matcher søkeordene «geek» og «nerd» i samme tidsperiode (38.8 k og 30.6 k totalt, henholdsvis). Ja, ja, ja… jeg samlet alle data for seks måneder siden, men akkurat nå fikk rundt for å knaser tallene. Det har vært en hektisk år!,

En flott liten statistikk for å måle hvor mye selskapet to ord som har en tendens til å holde er pointwise gjensidig informasjon (PMI). Det er vanligvis brukt i information retrieval litteratur for å måle cooccurrence av ord og uttrykk i teksten, og det slår også ut til å være en god indikasjon på hvordan mennesker vurdere semantisk ordet likhet (Recchia & Jones, 2009) og emne modell kvalitet (Newman & al., 2010).,

For to ord w og v, PMI er gitt ved:

,

hvor i dette tilfellet er sannsynligheten for word(r) i spørsmålet vises i tilfeldig tweet, som estimert ut fra data. For eksempel, hvis vi lar v = «geek» vi beregne log-sannsynligheten for at et ord w i «geek» søk corpus, og trekk log-sannsynligheten for w i bakgrunnen corpus.,

Resultater

PMI statistikken måler en slags sammenheng: en positiv PMI score for to ord som betyr at de «beholde gode selskap», et negativt resultat betyr at de har en tendens til å holde avstand, og et resultat nær null betyr at de borti hverandre mer eller mindre tilfeldig.

Med det i tankene, her er et scatterplot av ulike ord i henhold til deres PMI score for både «geek» og «nerd» på ulike akser (ignorerer ord med negative PMI, og behandling #hashtags som distinkte):

Mange har spurt etter en høyoppløselig PDF-fil av denne tomten, så her går.,

du går opp den vertikale aksen, ord bli mer nerdete («#musikk» → «#gadget» → «#cosplay»), og beveger seg fra venstre til høyre, blir de mer «nerdete» («utdanning» → «grammatikk» → «nevrovitenskap»). Ord langs diagonalen er like nerdete og nerdete, inkludert sosiale («#vanskelig», «weirdo»), mainstream-tech («#datamaskiner», «#microsoft»), og sci-fi/fantasy-vilkårene («doctorwho,» «#thehobbit»). Ord i nedre venstre («husarbeid,» «grønnsaker,» «boobies») egentlig ikke er forbundet med enten, mens de i den øvre høyre («#avengers», «#gamer», «#briller») er sterkt knyttet til begge., Oransje ord som er mer nerdete enn nerdete, og blå ord er det motsatte. Noen observasjoner:

  • Samlinger er nerdete. Alle derivater av ordet «samle» («samling» «samleobjekter», osv.) er oransje. Som er «boxset» og «#opprinnelige», som innebærer en smak for fullstendighet og autentisitet.
  • Faglig felt er nerdete: «matematikk», «#historie», «fysikk» «biologi,» «nevrovitenskap,» «biokjemi», osv. Andre akademiske ord («thesis», «#studymode») og institusjoner («harvard», «oxford») er også blå.
  • vitenskap & teknologi ord variere., Generelle vilkårene og betingelsene («#datamaskiner,» «#bigdata») er på diagonalen — på samme måte nerdete og nerdete. Som du splay opp mot mer nerdete, skjønt, du ser produkter, startups, merkevarer, og mer cultish teknologi («#apple», «#linux»). Som du splay ned mot mer nerdete du se flere metoder («kalkulus»).
  • #Hashtags er nerdete. OK, det er sikkert, hashtags er all over the place. Men de har en tendens mot øvre venstre. Og siden hashtags er «#trendy,» jeg tar det til å bety at nerder er i trender. (Jeg ta dette tilbake. Gjennomsnittlig PMI resultat for alle hashtags er 0,74 med «geek» men 0.73 med «nerd.,»Forskjellen er ikke statistisk signifikant med en paret t-test eller Wilcoxon-test, eller praktisk talt betydelig ved hjelp av en common-sense test.)
  • Hobbyer: sammenligne mer nerdete interesser («#leker,» «#manga») med mer nerdete seg («sjakk,» «sudoku»).
  • Hjerner: ordet «intelligens» kan være nerdete, men «education» «intellektuelle» og «#smartypants» er «nerdete».
  • Lesing: «#bøker» er «nerdete», men «e-bøker» og «ibooks» er nerdete.
  • Pop-kultur vs., høy kultur: «#skinnende» og «#trendy» er super-nerdete, men (merkelig) «stjerneskuddet» er nerdiest…

listen går videre. Hvis du ønsker å rote rundt deg selv, laste ned raw-PMI-score (4.2 mb) og gi meg beskjed i kommentarfeltet hva du finner. Siden mange har spurt: jeg regnet ut PMI for alle ordene som vises i søk-tweets med «geek» og «nerd» (millioner), og deretter manuelt skannede omtrent 7500 i ord med positiv PMI score for begge. Den scatterplot inneholder ca 300 ord som jeg håndplukket fordi de gjorde forstand.,

(Oppdatering: jeg lærte at Olivia Culpo — en selv-beskrevet «cellist nerd» — ble kronet til Miss Universe på desember 20, 2012. Arrangementet var tungt twitret smellkyss i midten av min datainnsamling, slik at trolig forklarer sammenhengen mellom «stjerneskuddet» og «nerd» her. Det er også understreker begrensninger av tid-sensitive data.)

Konklusjon

I brede strøk, det virker for meg at nerdete ord er mer om ting (f.eks., «#stuff»), mens nerdete ord er mer om ideer (for eksempel, «hypotesen»)., Geeks er fans og fans samle ting; nerder er utøvere og utøvere spille med ideer. Selvfølgelig, geeks kan samle ideer og nerder leke med ting, også. Pluss, de er ikke to forskjellige personligheter så mye som ulike aspekter av personligheten. Generelt er data synes å bekrefte min tenkning.

jeg lurer på hvordan lignende resultatene ville være hvis du har brukt denne metoden til Google Bøker Ngrams corpus, eller noe mer generell i stedet for en nisje medier som Twitter., Jeg lurer også på hva andre spørsmål kan besvares med denne typen analyser (for eksempel, min kone og jeg har en flerårig uenighet om hvilke ord er våtere: «fuktig» vs. «fuktig.»).

til Slutt, når jeg nevnte til en venn at jeg hadde tenkt å skrive dette innlegget, hun sa: «Vel, jeg antar vi vet hvor du er.»Men trenger vi egentlig? Jeg kan være en vitenskap nerd, men jeg er nok en musikk-geek…

Oppdater (juni 25, 2013): Woah. Dette har fått mer oppmerksomhet enn jeg noensinne forventet. Noen få visninger. (1) Før du skriver dette, jeg hadde ingen anelse om at det var en «geek vs., nerd» hellig krig i visse hjørner av Internett, drivstoff disse flamewars var absolutt ikke min hensikt. Lysere opp! (2) jeg er redd jeg skal bli bedre kjent, for dette avledning enn for noen av mine «ekte» forskning. Å være klart: dette var en morsom måte å drepe et par timer på en lørdag ettermiddag, ikke nødvendigvis min beste science. Jeg tror writeup her er lyd og selvinnlysende, men jeg er den første til å innrømme at det er bedre korpusene, metoder og teknikker for analyse — som kunne bruke en tillatelse, grad student, og/eller mer enn en ettermiddag — for å avdekke denne svært viktige «Sannhet.,»(3) For de som er interessert i etymologies av «geek» og «nerd» jeg fant denne kule writeup.

– >

Annonser