Articles

på” Geek ”mot”Nerd”

X

Sekretess & Cookies

den här webbplatsen använder cookies. Genom att fortsätta godkänner du deras användning. Läs mer, inklusive hur du kontrollerar cookies.

fick det!

annonser

För många människor är ”geek” och ”nerd” synonymer, men de är faktiskt lite annorlunda., Tänk på frasen ” sportnörd ”-en tillfällig ersättning för” jock ”och kanske ärkerivalen till en” nörd ” i gymnasiet folklore. Om ”nörd” och ”nörd” är synonymer, kan ”sportnörd” vara en oxymoron. (Dessutom beräknar” sportnörd ” antingen inte eller betyder något annat.)

i mitt sinne är ”geek” och ”nerd” relaterade, men fånga olika dimensioner av ett intensivt engagemang för ett ämne:

  • geek – en entusiast av ett visst ämne eller fält. Nördar är” samling ” orienterad, samla fakta och minnen relaterade till deras ämne av intresse., De är besatta av de nyaste, coolaste, trendigaste sakerna som deras ämne har att erbjuda.
  • nerd – en studious intellektuell, men igen av ett visst ämne eller fält. Nördar är” prestation ” orienterade och fokuserar sina ansträngningar på att förvärva kunskap och skicklighet över trivia och memorabilia.

eller, för att uttrycka det pictorially à la The Simpsons:

båda är dedikerade till sina ämnen, och ibland socialt besvärliga. Skillnaden är att nördar är fans av sina ämnen, och nördar är utövare av dem., En datornörd kan läsa trådbunden och knacka på Silicon Valley ryktet-mill för leads på nästa hot-new-thing, medan en datornörd kan läsa CLRS och hålla utkik efter smarta nya sätt att tillämpa Dijkstra algoritm. Observera att även om de inte är synonymer, är de inte nödvändigtvis distinkta heller: många nördar är också nördar (och vice versa).

ett Experiment

har jag några bevis för denna kontrast? (Förresten, denna synpunkt går tillbaka till en grad-school konversation med kollega geek/nerd Bryan Barnes, nu en fysiker på NIST.,) Wiktionary-posterna för ”geek” och ”nerd” ger lite trovärdighet till min position, men jag skulle vilja ha något lite mer empiriskt…

”du ska veta ett ord av företaget som det håller” ~ J. R. Firth (1957)

för att karakterisera likheterna och skillnaderna mellan ”geek” och ”nerd” kanske vi kan hitta de andra orden som tenderar att hålla dem sällskap, och se om dessa språkliga följeslagare stöder min synvinkel?

Data och metod

(Obs: Om du varken är en nörd eller en nörd, var inte rädd av matematiken., Det är inte så illa… eller du kan förmodligen bara hoppa till avsnittet ”Resultat” nedan…)

jag analyserade två källor till Twitter-data, eftersom det är lätt tillgängligt och ganska nördigt/nerdy att starta. Detta inkluderar en bakgrund corpus 2,6 miljoner tweets via streaming API från mellan 6 December 2012 och januari 3, 2013. Jag samplade också tweets via sök API som matchar frågetermerna ”geek ” och” nerd ” under samma tidsperiod (38.8 k respektive 30.6 K Totalt). Ja, ja, ja … jag samlade in alla data för sex månader sedan men just nu kom runt för att krossa siffrorna. Det har varit ett hektiskt år!,

en stor liten statistik för att mäta hur mycket företag två ord tenderar att hålla är punktvis ömsesidig information (PMI). Det används ofta i informationssökningslitteraturen för att mäta cooccurrence av ord och fraser i text, och det visar sig också vara en bra prediktor för hur människor utvärderar semantisk ordlikhet (Recchia & Jones, 2009) och ämnesmodellkvalitet (Newman & al., 2010).,

för två ord w och v ges PMI av:

,

där i detta fall är sannolikheten för att ordet eller orden i fråga visas i en slumpmässig tweet, enligt uppskattningen från data. Till exempel, om vi låter v = ”geek”, beräknar vi log-sannolikheten för ett ord w i ”geek” sök corpus, och subtrahera log-sannolikheten för w i bakgrunden corpus.,

resultat

PMI-statistiken mäter ett slags korrelation: en positiv PMI-poäng för två ord betyder att de ”håller bra företag”, en negativ poäng betyder att de tenderar att hålla sitt avstånd, och en poäng nära noll betyder att de stöter på varandra mer eller mindre slumpmässigt.

med det i åtanke är här en scatterplot av olika ord enligt deras PMI-poäng för både ”geek” och ”nerd” på olika axlar (ignorerar ord med negativ PMI och behandlar #hashtags som distinkt):

många har bett om en hög-res PDF av denna plot, så här går du.,

flytta upp den vertikala axeln, ord blir mer nörd (”#musik” → ”#gadget” → ”#cosplay”), och flytta vänster till höger blir de mer nördiga (”utbildning” → ”grammatik” → ”neurovetenskap”). Ord längs diagonalen är lika nördiga och nördiga, inklusive sociala (”#awkward”,” weirdo”), mainstream tech (”#computers”,” #microsoft”) och sci-fi/fantasy termer (”doctorwho”,”#thehobbit”). Ord i nedre vänstra (”sysslor”, ”grönsaker”, ”boobies”) är inte riktigt associerade med heller, medan de i övre högra (”#avengers”, ”#gamer”, ”#glasses”) är starkt knutna till båda., Orange ord är mer nördiga än nördiga, och blåa ord är motsatsen. Några observationer:

  • samlingar är nördiga. Alla derivat av ordet ”samla” (”samling”, ”samlarobjekt” etc.) är orange. Liksom ”boxset ” och” #original”, vilket innebär en smak för fullständighet och äkthet.
  • akademiska fält är nördiga: ”matematik”, ”#historia”, ”fysik”, ”biologi”, ”neurovetenskap”, ”biokemi” etc. Andra akademiska ord (”avhandling”, ”#studymode”) och institutioner (”harvard”, ”oxford”) är också blåa.
  • vetenskapen& tekniska ord skiljer sig åt., Allmänna termer (”#datorer”, ”# bigdata”) är på diagonalen — på samma sätt nördiga och nördiga. När du stänker upp mot mer nörd ser du dock produkter, startups, varumärken och mer kultisk teknik (”#apple”, ”#linux”). När du stänker ner mot mer nördig ser du fler metoder (”kalkyl”).
  • #Hashtags är nördiga. Okej, visst, hashtags är överallt. Men de tenderar mot det övre vänstra. Och eftersom hashtags är ”# trendig”, tar jag det för att betyda att nördar är i trender. (Jag tar tillbaka den här. Den genomsnittliga PMI-poängen för alla hashtags är 0.74 med ” geek ”men 0.73 med” nerd.,”Skillnaden är inte statistiskt signifikant med hjälp av ett parat t-test eller Wilcoxon-test, eller praktiskt taget signifikant med hjälp av ett sunt förnuftstest.)
  • Hobbies: jämför de mer nördiga pastimes (”#leksaker, ”” #manga”) med de mer nördiga (”Schack”,”sudoku”).
  • hjärnor: ordet ”intelligens” kan vara nördigt, men ”utbildning”, ”intellektuell” och ”#smartypants” är nördiga.
  • Reading: ”#böcker” är nördiga, men ”e-böcker” och ”ibooks” är nördiga.
  • popkultur vs., high culture: ”# shiny ” och ” # trendy ”är super-geeky, men (nyfiket)” cellist ” är den nerdiest…

listan fortsätter. Om du vill peta runt dig själv, ladda ner raw PMI poäng (4.2 mb) och låt mig veta i kommentarerna vad du hittar. Eftersom många har frågat: jag beräknade PMI för alla ord som visas i Sök tweets med ”geek” och ”nerd” (miljoner) och sedan manuellt skannas ungefär 7.500 ord med positiva PMI poäng för båda. Scatterplot innehåller cirka 300 ord som jag handplockade eftersom de var meningsfulla.,

(uppdatering: Jag lärde mig att Olivia Culpo — en självbeskrivet ”cellistnörd”-kröntes Miss Universe den 20 December 2012. Händelsen var kraftigt tweeted smack i mitten av min datainsamling, så det förklarar förmodligen sambandet mellan” cellist ”och” nerd ” här. Det understryker också begränsningarna av tidskänsliga uppgifter.)

slutsats

i breda drag verkar det för mig att nördiga ord handlar mer om saker (t.ex. ”#stuff”), medan nördiga ord handlar mer om idéer (t. ex. ”hypotesen”)., Nördar är fans, och fans samlar saker; nördar är utövare och utövare spelar med idéer. Naturligtvis kan nördar samla idéer och nördar leka med saker också. Dessutom är de inte två olika personligheter lika mycket som olika aspekter av personlighet. Generellt verkar data bekräfta mitt tänkande.

Jag undrar hur liknande resultaten skulle vara om du tillämpade den här metoden på Google Books ngrams corpus, eller något mer allmänt istället för ett nischmedium som Twitter., Jag undrar också vilka andra frågor som kan besvaras med denna typ av analys (till exempel min fru och jag har en ständig oenighet om vilket ord som är våtare: ”fuktig” vs. ”fuktig.”).

slutligen, när jag nämnde en vän att jag skulle skriva upp det här inlägget, sa hon ” Ja, jag antar att vi vet vilken du är.”Men gör vi verkligen? Jag kan vara en vetenskapsnörd, men jag är förmodligen en musiknörd…

Uppdatering (25 juni 2013): Woah. Detta har fått mer uppmärksamhet än jag någonsin förväntat mig. Några intryck. (1) Innan jag skrev detta hade jag ingen aning om att det fanns en ”nörd vs., nörd ” heligt krig i vissa hörn av Internet; bränslepåfyllning dessa flamewars var verkligen inte min avsikt. Slappna av! (2) Jag är rädd att jag kommer att vara mer känd för denna avledning än för någon av mina ”riktiga” forskning. För att vara tydlig: detta var ett roligt sätt att döda några timmar på en lördagseftermiddag, inte nödvändigtvis min bästa vetenskap. Jag tror att skriften här är sund och självklar, men jag är den första som erkänner att det finns bättre korpral, metoder och analystekniker — som kan använda ett bidrag, doktorand och/eller mer än en eftermiddag — för att avslöja denna viktiga ”sanning.,”(3) för dem som är intresserade av etymologierna av ”geek” och ”nerd” hittade jag den här coola skriften.

annonser