Articles

op “Geek” Versus “Nerd”

X

Privacy & Cookies

deze site maakt gebruik van cookies. Door verder te gaan, gaat u akkoord met het gebruik ervan. Meer informatie, waaronder het beheren van cookies.

heb het!

advertenties

voor veel mensen zijn “geek” en “nerd” Synoniemen, maar in feite zijn ze een beetje anders., Denk aan de uitdrukking “Sport geek “-een occasionele vervanging voor” jock “en misschien wel de aartsrivaal van een” nerd ” in de middelbare school folklore. Als “geek ” en” nerd “Synoniemen zijn, dan is” sport geek ” misschien een oxymoron. (Bovendien,” Sport nerd ” ofwel niet berekenen of betekent iets anders.)

in mijn gedachten zijn” geek “en” nerd ” verwant, maar leggen verschillende dimensies vast van een intense toewijding aan een onderwerp:

  • geek – een liefhebber van een bepaald onderwerp of veld. Geeks zijn” collectie ” georiënteerd, het verzamelen van feiten en aandenkens met betrekking tot hun onderwerp van belang., Ze zijn geobsedeerd door de nieuwste, coolste, trendy dingen die hun onderwerp te bieden heeft.
  • nerd – een leergierige intellectueel, hoewel weer van een bepaald onderwerp of veld. Nerds zijn” prestatie ” georiënteerd, en richten hun inspanningen op het verwerven van kennis en vaardigheid over trivia en memorabilia.

of, om het picturale à la The Simpsons te zeggen:

beide zijn gewijd aan hun onderwerpen, en soms sociaal onhandig. Het onderscheid is dat geeks zijn fans van hun onderwerpen, en nerds zijn beoefenaars van hen., Een computernerd leest misschien Wired en tikt de Silicon Valley-geruchtenmolen op leads over the next hot-new-thing, terwijl een computernerd CLRS leest en op zoek gaat naar slimme nieuwe manieren om Dijkstra ‘ s algoritme toe te passen. Merk op dat, hoewel niet Synoniemen, ze zijn niet per se te onderscheiden ofwel: veel geeks zijn ook nerds (en vice versa).

een Experiment

heb ik enig bewijs voor dit contrast? (By the way, dit standpunt dateert terug naar een grad-school gesprek met collega geek/nerd Bryan Barnes, nu een natuurkundige bij NIST.,) De WikiWoordenboek ingangen voor “geek” en “nerd” lenen wat geloof aan mijn positie, maar ik zou graag iets meer empirisch willen…

“You shall know a word by the company it keeps” ~ J. R. Firth (1957)

om de overeenkomsten en verschillen tussen “geek” en “nerd te karakteriseren,” misschien kunnen we de andere woorden die de neiging hebben om hen gezelschap te houden, en kijken of deze taalkundige metgezellen mijn standpunt ondersteunen?

Data en methode

(Opmerking: Als je geen geek of nerd bent, wees dan niet bang voor de wiskunde., Het is niet al te slecht… of je kunt waarschijnlijk gewoon overslaan naar de “resultaten” subsectie hieronder…)

Ik analyseerde twee bronnen van Twitter-gegevens, omdat het gemakkelijk beschikbaar is en vrij geeky/nerdy om op te starten. Dit omvat een achtergrond corpus van 2,6 miljoen tweets via de streaming API tussen 6 December 2012 en 3 januari 2013. Ik heb ook gesampled tweets via de search API overeenkomen met de query termen “geek ” en” nerd ” in dezelfde periode (38.8 K en 30.6 K totaal, respectievelijk). Ja, ja, ja… Ik heb alle gegevens zes maanden geleden verzameld, maar nu ben ik er net aan toe om de cijfers te kraken. Het is een druk jaar geweest!,

een kleine statistiek om te meten hoeveel bedrijf twee woorden de neiging hebben om te houden is pointwise mutual information (PMI). Het wordt vaak gebruikt in de literatuur voor het ophalen van informatie om de coöccurrence van woorden en zinnen in tekst te meten, en het blijkt ook een goede voorspeller te zijn van hoe mensen semantische woordgelijkwaardigheid evalueren (Recchia & Jones, 2009) en topic model quality (Newman & al., 2010).,

voor twee woorden w en v wordt de PMI gegeven door:

,

, waarbij in dit geval de waarschijnlijkheid is dat de woorden in kwestie in een willekeurige tweet verschijnen, zoals geschat aan de hand van de gegevens. Bijvoorbeeld, als we laten v = ” geek, “we berekenen de log-kans van een woord w in de” geek ” zoeken corpus, en trek de log-kans van w in de achtergrond corpus.,

resultaten

de PMI-statistiek meet een soort correlatie: een positieve PMI-score voor twee woorden betekent dat ze “goed gezelschap houden”, een negatieve score betekent dat ze de neiging hebben afstand te houden, en een score dicht bij nul betekent dat ze elkaar min of meer willekeurig tegenkomen.

met dat in gedachten, hier is een verstrooiing van verschillende woorden volgens hun PMI scores voor zowel ” geek “en” nerd ” op verschillende assen (het negeren van woorden met negatieve PMI, en het behandelen van #hashtags als verschillende):

veel mensen hebben gevraagd om een hoge-res PDF van deze plot, dus hier ga je.,

door de verticale as omhoog te bewegen worden woorden geeky (“#music” → “#gadget” → “#cosplay”), en door van links naar rechts te bewegen worden ze nerdy (“education” → “grammar” → “neuroscience”). Woorden langs de diagonaal zijn ook geeky en nerdy, waaronder sociale (“#awkward”,” weirdo”), mainstream tech (“#computers”,” #microsoft”), en sci-fi/fantasy termen (“doctorwho”,”#thehobbit”). Woorden in de linkerbenedenhoek (“karweitjes”, “groenten”, “boobies”) worden niet echt geassocieerd met een van beide, terwijl die in de rechterbenedenhoek (“#avengers”, “#gamer”, “#glasses”) sterk verbonden zijn met beide., Oranje woorden zijn geeky dan nerdy, en blauwe woorden zijn het tegenovergestelde. Enkele waarnemingen:

  • collecties zijn geeky. Alle afgeleiden van het woord “collect” (“collection, “” collectables”, enz.) zijn oranje. Net als” boxset “en” #original”, die een smaak voor volledigheid en authenticiteit impliceren.
  • academische velden zijn nerdy: “math”, “#history, “”physics, “”biology, “”neuroscience, “”biochemistry,” etc. Andere academische woorden (“thesis”,” #studymode”) en instellingen (“harvard”,” oxford”) zijn ook blauw.
  • The science & technologie woorden verschillen., Algemene termen (“#computers, “”# bigdata”) staan op de diagonaal — net als geeky en nerdy. Als je splay up in de richting van meer geeky, hoewel, zie je producten, startups, merken, en meer cultish technologieën (“#apple”, “#linux”). Als je naar beneden splay naar meer nerdy zie je meer methodologieën (“calculus”).
  • #Hashtags zijn geeky. Oké, zeker, hashtags zijn overal. Maar ze neigen naar linksboven. En omdat hashtags zijn “#trendy, ” ik neem aan dat het betekent dat geeks zijn in trends. (Ik neem deze terug. De gemiddelde PMI score voor alle hashtags is 0.74 met “geek” maar 0.73 met ” nerd.,”Het verschil is niet statistisch significant met behulp van een gepaarde t-test of Wilcoxon test, of praktisch significant met behulp van een gezond verstand test.)
  • hobby ‘ s: vergelijk de meer geeky tijdverdrijf (“#toys,” “#manga”) met de meer nerdy degenen (“chess,” “sudoku”).
  • hersenen: het woord “intelligentie “mag dan geeky zijn, maar” Onderwijs”,” intellectueel “en” #smartypants ” zijn nerdy.
  • lezen: “# books “zijn nerdy, maar” ebooks “en” ibooks ” zijn geeky.
  • popcultuur vs., hoge cultuur: “# shiny ” en “# trendy ” zijn super-geeky, maar (vreemd genoeg)” cellist ” is de nerdiest…

De lijst gaat maar door. Als je jezelf wilt rondneuzen, download dan de raw PMI scores (4.2 mb) en laat me weten in de commentaren wat je vindt. Omdat veel mensen hebben gevraagd: ik berekende PMI voor alle woorden die in de zoek tweets met “geek” en “nerd” (miljoenen) en vervolgens handmatig gescand ongeveer 7.500 woorden met positieve PMI scores voor beide. De scatterplot bevat ongeveer 300 woorden die ik met de hand koos omdat ze zinvol waren.,

(Update: ik leerde dat Olivia Culpo — een zelf beschreven “cellist nerd”-werd gekroond tot Miss Universe op 20 December 2012. Het evenement werd zwaar getweet midden in mijn gegevensverzameling, dus dat verklaart waarschijnlijk de correlatie tussen “cellist” en “nerd” hier. Het onderstreept ook de beperkingen van tijdgevoelige gegevens.)

conclusie

in grote lijnen lijkt het me dat geeky woorden meer over dingen gaan (bijvoorbeeld “#stuff”), terwijl nerdy woorden meer over ideeën gaan (bijvoorbeeld “hypothese”)., Geeks zijn fans, en fans verzamelen spullen; nerds zijn beoefenaars, en beoefenaars spelen met ideeën. Natuurlijk, nerds kunnen ideeën verzamelen en nerds spelen met dingen, ook. Plus, ze zijn niet twee verschillende persoonlijkheden zo veel als verschillende aspecten van de persoonlijkheid. Over het algemeen lijken de gegevens mijn denkwijze te bevestigen.

Ik vraag me af hoe vergelijkbaar de resultaten zouden zijn als je deze methode zou toepassen op de Google Books ngrams corpus, of iets algemener in plaats van een niche media zoals Twitter., Ik vraag me ook af welke andere vragen kunnen worden beantwoord met dit soort analyse (bijvoorbeeld, mijn vrouw en ik hebben een eeuwige onenigheid over welk woord natter is: “vochtig” vs. “vochtig.”).

tot slot, toen ik een vriend vertelde dat ik dit bericht zou gaan schrijven, zei ze: “nou, ik denk dat we weten welke je bent.”Maar doen we dat echt? Ik mag dan een wetenschapsnerd zijn, maar ik ben waarschijnlijk een muzieknerd…

Update (juni 25, 2013): Woah. Dit heeft meer aandacht gekregen dan ik ooit had verwacht. Een paar indrukken. (1) voorafgaand aan het schrijven van dit, Ik had geen idee dat er een ” geek vs., nerd ” heilige oorlog in bepaalde hoeken van het Internet; het aanwakkeren van deze vlammenwerpers was zeker niet mijn bedoeling. Niet zo somber. (2) Ik vrees dat ik beter bekend zal zijn voor deze afleiding dan voor een van mijn “echte” onderzoek. Voor de duidelijkheid: dit was een leuke manier om een paar uur te doden op een zaterdagmiddag, niet per se mijn beste wetenschap. Ik denk dat de writeup hier is geluid en vanzelfsprekend, maar ik ben de eerste om te erkennen dat er betere corpora, methoden, en analysetechnieken — die een subsidie zou kunnen gebruiken, grad student, en/of meer dan een middag — voor het blootleggen van deze belangrijke “waarheid.,”(3) voor degenen die geïnteresseerd zijn in de etymologieën van “geek” en “nerd,” ik vond deze coole writeup.

advertenties