Articles

Na „Geek“ A „Nerd“

X

Soukromí & soubory Cookie

Tento web používá soubory cookie. Pokračováním souhlasíte s jejich použitím. Další informace, včetně toho, jak ovládat soubory cookie.

Mám to!

Inzeráty

Pro mnoho lidí, „geek“ a „nerd“ jsou synonyma, ale ve skutečnosti jsou trochu odlišné., Zvažte frázi “ sportovní geek „-příležitostná náhrada za“ jocka „a možná úhlavního soupeře“ blbce “ ve středoškolském folklóru. Pokud jsou“ geek „a“ nerd „synonyma, pak“ sportovní geek “ může být oxymoron. (Dále, „sportovní blbeček“ buď nepočítá, nebo znamená něco jiného.)

v mé mysli jsou“ geek „a“ nerd “ příbuzné, ale zachycují různé rozměry intenzivního odhodlání subjektu:

  • geek – nadšenec určitého tématu nebo pole. Geekové jsou orientováni na „sbírku“, shromažďování faktů a poznámek souvisejících s jejich předmětem zájmu., Jsou posedlí nejnovějšími, nejchladnějšími a nejmódnějšími věcmi, které jejich předmět nabízí.
  • nerd-pilný intelektuál, i když opět určitého tématu nebo oboru. Pitomci jsou“ úspěch “ orientované, a zaměřit své úsilí na získání znalostí a dovedností nad trivia a memorabilia.

nebo, abych to řekl obrazně à la Simpsonovi:

oba jsou věnováni svým subjektům a někdy společensky trapní. Rozdíl je v tom, že geeks jsou fanoušci svých předmětů, a pitomci jsou praktici z nich., Počítačový geek může číst Kabelové a klepněte na Silicon Valley rumor mill pro vede na další hot-new-věc, zatímco počítačový nerd může číst CLRS a držet oko ven pro chytré nové způsoby použití dijkstrův algoritmus. Všimněte si, že i když nejsou synonyma, nemusí být nutně odlišné: mnoho geeků jsou také pitomci (a naopak).

Experiment

mám pro tento kontrast nějaké důkazy? (Mimochodem, toto hledisko sahá až do grad – školní rozhovor s kolegy geek / nerd Bryan Barnes, nyní fyzik na NIST.,) Wikislovník záznamů pro „geek“ a „nerd“ půjčovat důvěře k mojí pozici, ale chtěl bych něco trochu více empirických…

„Vy se znáte slovo, které společnost udržuje“ ~ J. R. Firth (1957)

charakterizovat podobnosti a rozdíly mezi „geek“ a „nerd,“možná bychom mohli najít další slova, která mají tendenci držet jim společnost, a uvidíme, jestli tyto jazykové společníky podporu mého pohledu?

Data a Metoda

(Poznámka: Pokud nejste ani geek, ani blbeček, nebojte se matematikou., Není to tak špatné… nebo můžete prostě přeskočit na „Výsledky“ pododdíl níže…)

jsem analyzoval dva zdroje dat Twitter, protože je snadno dostupné a docela geeky/nerdy na startu. To zahrnuje korpus pozadí 2.6 milionu tweetů prostřednictvím streamingového API od 6. Prosince 2012 do 3.ledna 2013. Také jsem do vzorku tweety přes search API, které odpovídají dotazu pojmy „geek“ a „nerd“ během stejného časového období (38.8 k a k 30.6 celkem, respektive). Ano, ano, ano… shromáždil jsem všechna data před šesti měsíci, ale právě teď jsem se dostal k drcení čísel. Byl to rušný rok!,

skvělá malá statistika pro měření toho, kolik společnost dvě slova mají tendenci udržovat, je pointwise mutual information (PMI). To je běžně používané v získávání informací literatura pro měření cooccurrence slov a frází v textu, a to také ukáže být dobrým ukazatelem toho, jak lidé hodnotit sémantickou slovní podobnosti (Recchia & Jones, 2009) a téma model kvality (Newman & al., 2010).,

pro dvě slova w A V je PMI dána:

,

, kde je v tomto případě pravděpodobnost, že se dané slovo objeví v náhodném tweetu, jak se odhaduje z dat. Například, pokud necháme v = „geek“, vypočítáme log-pravděpodobnost slova w ve vyhledávacím korpusu „geek“ a odečteme log-pravděpodobnost w v korpusu pozadí.,

Výsledky

PMI statistika opatření druh korelace: pozitivní PMI skóre po dvou slov znamená, že „udržet skvělé společnosti,“ negativní skóre znamená, že mají tendenci udržet odstup, a skóre blízko k nule znamená, že narazit na sebe více či méně náhodně.

S tím na mysli, zde je scatterplot různých slov podle jejich PMI skóre pro oba „geek“ a „nerd“ na různých os (ignoruje slova s negativní PMI, a zacházet s #hashtags jako odlišné):

Mnoho lidí se zeptal na high-res formátu PDF o tomto spiknutí, tak tady to máte.,

pohybující se po svislé ose se slova stávají podivínskými („#music“ → „#gadget“ → „#cosplay“) a pohybem zleva doprava se stávají nerdy („vzdělávání“ → „gramatika“ → „neurovědy“). Slova po diagonále jsou podobně geeky a nerdy, včetně sociálních („#trapné“, „podivín“), tradiční tech („#počítače“, „#microsoft“), a sci-fi/fantasy podmínky („doctorwho,“ „#thehobbit“). Slova v dolní-levé („domácí práce“ a „zeleninu“, „kozy“) opravdu nejsou spojena buď s, zatímco v pravé horní části („#avengers“, „#gamer“, „#brýle“) jsou silně vázána na oba., Oranžová slova jsou více Podivínská než nerdy a modrá slova jsou opakem. Některé postřehy:

  • sbírky jsou geeky. Všechny deriváty slova „sbírat“ („sbírka“, „sběratelské předměty“ atd.) jsou oranžové. Stejně jako „boxset“ a „#original“, což znamená chuť na úplnost a pravost.
  • akademické obory jsou nerdy: „Matematika“, „#Historie“, „fyzika“, „biologie“, „neurovědy“, „biochemie“ atd. Další akademická slova („práce“, „#studymode“) a instituce („harvard“, „oxford“) jsou také modré.
  • věda & technologická slova se liší., Obecné pojmy („#computers“,“ # bigdata“) jsou na diagonále — podobně geeky a nerdy. Jak se však rozrůstáte směrem k více podivínům, vidíte produkty, startupy, značky a další kultovní technologie („#apple“, „#linux“). Jak jste splay dolů k více nerdy vidíte více metodik („kalkul“).
  • #Hashtags jsou geeky. OK, jasně, Hashtagy jsou všude. Ale mají sklon k levici. A protože Hashtagy jsou „# trendy“, beru to tak, že geekové jsou v trendech. (Beru to zpět. Průměrné skóre PMI pro všechny hashtagy je 0.74 s „geek“, ale 0.73 s “ nerd.,“Rozdíl není statisticky významný pomocí párového t-testu nebo Wilcoxonova testu, nebo prakticky významný pomocí testu zdravého rozumu.)
  • koníčky: porovnejte více podivínských zábav („#toys“, „# manga“) s nerdy („šachy“,“sudoku“).
  • mozky: slovo “ inteligence „může být geeky, ale“ vzdělání“,“ intelektuální „a“ #smartypants “ jsou nerdy.
  • čtení: „# books „jsou nerdy, ale“ ebooks „a“ ibooks “ jsou geeky.
  • popkultura vs., vysoká kultura: „# shiny“ a „# trendy“ jsou super-geeky, ale (zvědavě) „violoncellista“ je nerdiest…

seznam pokračuje. Pokud chcete hrabat kolem sebe, stáhnout raw PMI skóre (4.2 mb) a dejte mi vědět v komentářích, co jste našli. Vzhledem k tomu, mnoho lidí se zeptal: jsem počítačová PMI pro všechny slova se objevují v hledání tweety s „geek“ a „nerd“ (miliony) a pak ručně naskenované zhruba na 7 500 slov s pozitivní PMI skóre pro oba. Scatterplot obsahuje asi 300 slov, která jsem ručně vybral, protože dávaly smysl.,

(aktualizace: dozvěděl jsem se, že Olivia Culpo — self-popsal „violoncellista nerd“ — byl korunován Miss Universe 20.Prosince 2012. Tato událost byla silně tweeted plácnutí uprostřed mého sběru dat, takže pravděpodobně vysvětluje korelaci mezi „violoncellista“ a „blbeček“ zde. Podtrhuje také omezení dat citlivých na čas.)

závěr

v širokých úderech se mi zdá, že Podivínská slova jsou více o věcech (např. „#stuff“), zatímco nerdy slova jsou více o myšlenkách (např. „hypotéza“)., Geeks jsou fanoušci, a fanoušci sbírat věci; pitomci jsou praktici, a praktici hrát s nápady. Samozřejmě, geeks může sbírat nápady a pitomci hrát s věcmi, také. Plus, nejsou to dvě odlišné osobnosti, stejně jako různé aspekty osobnosti. Obecně se zdá, že data potvrzují mé myšlení.

Zajímalo by mě, jak podobné by byly výsledky, kdybyste použili tuto metodu na korpus Google Books ngrams nebo něco obecnějšího místo specializovaných médií, jako je Twitter., Také by mě zajímalo, jaké další otázky mohou být zodpovězeny s tímto druhem analýzy (například, moje žena a já jsem vytrvalá nesouhlas nad slovo, které je vlhčí: „vlhký“ vs. „vlhko.”).

nakonec, když jsem se zmínil příteli, že se chystám napsat tento příspěvek, řekla: „No, myslím, že víme, který z nich jste.“Ale opravdu? Možná jsem vědecký blbeček, ale pravděpodobně jsem hudební geek …

aktualizace (25. Června 2013): Woah. To dostalo více pozornosti, než jsem kdy očekával. Pár dojmů. (1) Než jsem to napsal, netušil jsem, že existuje “ geek vs., nerd “ Svatá válka v určitých koutech internetu; pohánění těchto plamenometů rozhodně nebylo mým záměrem. Uklidni se! (2) obávám se, že pro toto rozptýlení budu známější než pro jakýkoli můj „skutečný“ výzkum. Aby bylo jasno: byl to zábavný způsob, jak zabít pár hodin v sobotu odpoledne, ne nutně moje nejlepší věda. Myslím, že writeup tady je zvuk a evidentní, ale já jsem první na vědomí, že tam jsou lepší korpusy, metody a techniky analýzy — které by mohly použít grant, student, a/nebo více než odpoledne — pro odkrytí tento all-důležité „Pravdy.,“(3) pro zájemce o etymologii „geek“ a „nerd“ jsem našel tento cool writeup.

reklamy