Articles

On” Geek “Versus”Nerd”

Privacy& Cookies

dette .ebsted bruger cookies. Ved at fortsætte accepterer du deres brug. Få flere oplysninger, herunder hvordan du kontrollerer cookies.

fik det!

annoncer

for mange mennesker er “nørd” og “nørd” synonymer, men faktisk er de lidt forskellige., Overvej udtrykket ” sports geek “-en lejlighedsvis erstatning for” jock “og måske erkerivalen til en” nørd ” i folklore i gymnasiet. Hvis “nørd” og “nørd” er synonymer, så “Sport nørd” kan være en O .ymoron. (Desuden beregner” sportsnerd ” heller ikke eller betyder noget andet.)

i mit sind er “geek” og “nerd” relateret, men fanger forskellige dimensioner af en intens dedikation til et emne:

  • geek – en entusiast af et bestemt emne eller felt. Nørder er” samling ” orienteret, indsamling fakta og souvenirs relateret til deres emne af interesse., De er besat af de nyeste, fedeste, mest trendy ting, som deres emne har at byde på.
  • nerd-en studious intellektuel, selvom igen af et bestemt emne eller felt. Nørder er” præstation ” orienteret, og fokusere deres indsats på at erhverve viden og dygtighed over trivia og memorabilia.

eller for at sige det billedligt la la The Simpsons:

begge er dedikeret til deres emner og undertiden socialt akavede. Sondringen er, at nørder er fans af deres fag, og nørder er udøvere af dem., En computer-nørd kan læse Wired, og tryk på Silicon Valley rygte-møllen fører på næste hot-nye-ting, mens en computer nørd kan læse CLR ‘og holde øje med de smarte nye måder at anvende Dijkstra’ s algoritme. Bemærk, at selvom de ikke er synonymer, er de heller ikke nødvendigvis forskellige: mange nørder er også nørder (og omvendt).

et eksperiment

har jeg noget bevis for denne kontrast? (Forresten går dette synspunkt tilbage til en grad-skole samtale med kolleger geek/nerd Bryan Barnes, nu fysiker hos NIST.,) Den Wiktionary bidrag til “nørd” og “nørd” låne nogle tiltro til at min holdning, men jeg vil gerne have noget lidt mere empirisk…

“Du skal vide et ord af det selskab, det holder” ~ J. R. Firth (1957)

til At karakterisere forskelle og ligheder “nørd” og “nørd,”måske kan vi finde andre ord, der har en tendens til at holde dem selskab, og se, hvis disse sproglige kammerater støtte for mit synspunkt?

Data og metode

(Bemærk: Hvis du hverken er en nørd eller en nørd, skal du ikke være bange for matematikken., Det er ikke så dårligt… eller du kan nok bare springe til underafsnittet” resultater ” nedenfor…)

jeg analyserede to kilder til T .itter-data, da det er let tilgængeligt og temmelig nørdigt/nørdet at starte. Dette inkluderer et baggrundskorpus på 2, 6 millioner t .eets via streaming API fra mellem 6.December 2012 og 3. januar 2013. Jeg samplede også T .eets via Søg API, der matcher forespørgselsbetegnelserne “geek” og “nerd” i samme tidsperiode (henholdsvis 38.8 k og 30.6 k). Ja, ja, ja… jeg indsamlede alle data for seks måneder siden, men lige nu kom rundt for at knuse tallene. Det har været et travlt år!,

en stor lille statistik til måling af, hvor meget Firma to ord har tendens til at holde er punktvis gensidig information (PMI). Det er almindeligt anvendt i informationssøgning litteratur til at måle cooccurrence af ord og sætninger i teksten, og det viser sig også, at være en god indikator for, hvordan mennesker vurderer semantiske lighed (Recchia & Jones, 2009) og emne-modellen kvalitet (Newman & al., 2010).,

for to ord w og v er PMI givet ved:

,

hvor i dette tilfælde er sandsynligheden for, at det eller de pågældende ord vises i en tilfældig t .eet, som estimeret ud fra dataene. For eksempel, hvis vi lader v = “geek”, beregner vi log-sandsynligheden for et ord in i “geek”-søgekorpuset og trækker log-sandsynligheden for.i baggrundskorpuset.,

Resultater

PMI statistik foranstaltninger, der er en slags sammenhæng: en positiv PMI-score for de to ord betyder, at de “holder stor virksomhed,” en negativ score betyder, at de har en tendens til at holde deres afstand, og et resultat tæt på nul betyder, at de støder ind i hinanden mere eller mindre tilfældigt.

Med det i tankerne, er her et scatterplot af forskellige ord i henhold til deres PMI score for både “nørd” og “nørd” på forskellige akser (ignorere ord med negative PMI, og behandling af #hashtags som særlige):

Mange mennesker har spurgt til en high-res PDF-fil af denne grund, så her kan du gå.,

Bevæger sig op ad den lodrette akse, ord blevet mere nørdet (“#musik” → “#gadget” → “#cosplay”), og bevæger sig fra venstre til højre bliver de mere nørdede (“uddannelse” → “grammatik” → “neuroscience”). Ord langs diagonalen er ligeledes nørdet og nørdet, herunder sociale (“#akavet”, “weirdo”), mainstream-tech (“#computere”, “#microsoft”), og sci-fi/fantasy vilkår (“doctorwho,” “#thehobbit”). Ord nederst til venstre (“chores”,” vegetables”,” boobies”) er heller ikke rigtig forbundet med, mens de øverst til højre (“#avengers”,” #gamer”,” #glasses”) er stærkt bundet til begge., Orange ord er mere nørdige end nørdede, og blå ord er det modsatte. Nogle observationer:

  • samlinger er nørdige. Alle derivater af ordet “collect” (“collection”, “collectables” osv.) er orange. Som er “Bo .set “og” #original”, hvilket indebærer en smag for fuldstændighed og ægthed.
  • akademiske felter er nørdede: “matematik”, “#historie”, “fysik”, “biologi”, “neurovidenskab”, “biokemi” osv. Andre akademiske ord (“speciale”,” #studymode”) og institutioner (“harvard”,” o .ford”) er også blå.
  • videnskaben & teknologi ord er forskellige., Generelle udtryk (“#computers”,” #bigdata”) er på diagonalen — på samme måde nørdige og nørdede. Som du splay op mod mere nørdige, ser du dog produkter, startups, mærker og mere kultiske teknologier (“#apple”, “#Linu.”). Som du splay ned mod mere nørdet du se flere metoder (“calculus”).
  • #Hashtags er nørdige. Okay, selvfølgelig, hashtags er overalt. Men de har tendens mod øverste venstre. Og da hashtags er “# trendy”, tager jeg det til at betyde, at nørder er i trends. (Jeg tager denne tilbage. Den gennemsnitlige PMI-score for alle hashtags er 0.74 med “geek”, men 0.73 med “nerd.,”Forskellen er ikke statistisk signifikant ved hjælp af en parret t-test eller testilco .on test, eller praktisk talt signifikant ved hjælp af en sund fornuft test.)
  • hobbyer: sammenlign de mere nørdige tidsfordriv (“#toys”, “#manga”) med de mere nørdede (“skak”, “sudoku”).
  • hjerner: ordet ” intelligens “kan være nørdet, men” uddannelse”,” intellektuel “og” #smartypants ” er nørdet.
  • læsning:” #bøger “er nørdet, men” ebøger “og” ibooks ” er nørdige.
  • Pop kultur vs., høj kultur:” #shiny “og” #trendy “er super-nørdede, men (underligt)” cellist ” er den nørdeste…

listen fortsætter. Hvis du vil stikke rundt om dig selv, skal du Do .nloade de rå PMI-scoringer (4, 2 mb) og fortæl mig i kommentarerne, hvad du finder. Da mange mennesker har spurgt: jeg beregnet PMI for alle ord, der vises i søget tweets med “geek” og “nerd” (millioner) og derefter manuelt scannet omtrent 7.500 ord med positive PMI-score for begge. Scatterplot indeholder omkring 300 ord, som jeg håndplukkede, fordi de gav mening.,

(opdatering: Jeg lærte at Olivia Culpo — en selvbeskrevet “cellist nerd”-blev kronet Miss Universe den 20.December 2012. Begivenheden blev stærkt t .eetet smack midt i min dataindsamling, så det forklarer sandsynligvis sammenhængen mellem “cellist” og “nerd” her. Det understreger også begrænsningerne af tidsfølsomme data.)

konklusion

i brede streger forekommer det mig, at nørdige ord handler mere om ting (f. “#stuff”), mens nørdede ord handler mere om ideer (F. “hypotese”)., Nørder er fans, og fans samler ting; nørder er praktikere, og praktikere leger med ideer. Selvfølgelig, nørder kan indsamle ideer og nørder lege med ting, også. Plus, de er ikke to forskellige personligheder så meget som forskellige aspekter af personlighed. Generelt synes dataene at bekræfte min tænkning.

Jeg spekulerer på, hvordan lignende resultaterne ville være, hvis du anvendte denne metode til Google Books Ngrams corpus, eller noget mere generelt i stedet for et nichemedie som T .itter., Jeg spekulerer også på, hvilke andre spørgsmål der kan besvares med denne form for analyse (for eksempel har min kone og jeg en flerårig uenighed om, hvilket ord der er vådere: “fugtig” vs. “fugtig.”).

endelig, da jeg nævnte til en ven, at jeg skulle skrive dette indlæg, sagde hun “Nå, jeg tror vi ved, hvilken du er.”Men gør vi virkelig? Jeg kan være en videnskab nørd, men jeg er nok en musik nørd…

opdatering (juni 25, 2013): Wooah. Dette har fået mere opmærksomhed, end jeg nogensinde havde forventet. Et par indtryk. (1) Før jeg skrev dette, havde jeg ingen ID “om, at der var en” geek vs., nerd ” hellig krig i visse hjørner af internettet; brændstof til disse Flame .ars var bestemt ikke min hensigt. Op med humøret! (2) Jeg frygter, at jeg bliver bedre kendt for denne afledning end for nogen af mine “rigtige” undersøgelser. For at være klar: Dette var en sjov måde at dræbe et par timer på en lørdag eftermiddag, ikke nødvendigvis min bedste videnskab. Jeg tror, writeup her er lyd og selvindlysende, men jeg er den første til at erkende, at der er bedre corpora, – metoder og-analyse teknikker, som kunne bruge et tilskud, grad studerende, og/eller mere end en eftermiddag — for at afdække dette vigtige “Sandhed.,”(3) for dem, der er interesseret i etymologierne for “nørd” og “nørd”, fandt jeg denne seje skrivning.

annoncer