A” Geek “Versus”Nerd”
Adatvédelem& Cookies
Ez az oldal cookie-kat használ. A folytatással elfogadja a használatukat. Tudjon meg többet, beleértve a cookie-k vezérlését is.
sok ember számára a” geek “és a” nerd ” szinonimák, de valójában egy kicsit más., Tekintsük a “sport geek” kifejezést — a “jock” alkalmi helyettesítője, talán egy “majom” fő riválisa a középiskolai folklórban. Ha a” geek “és a” nerd “szinonimák, akkor a” sport geek ” lehet egy oximoron. (Továbbá, a “sport majom” vagy nem számít, vagy valami mást jelent.)
az elmémben a “geek” és a “nerd” rokonságban állnak egymással, de a téma intenzív elkötelezettségének különböző dimenzióit rögzítik:
- geek – egy adott téma vagy mező rajongója. A geekekek “gyűjtésorientáltak”, összegyűjtik az érdeklődésük tárgyához kapcsolódó tényeket és emlékeket., Ők megszállottja a legújabb, legmenőbb, legdivatosabb dolog,hogy a téma kínál.
- nerd-egy szorgalmas szellemi, bár ismét egy adott téma vagy mező. A kockák “eredményorientáltak”, és erőfeszítéseiket a tudás és készség elsajátítására összpontosítják a trivia és az emléktárgyak felett.
vagy, hogy pictorially à la The Simpsons:
mindkettő alanyainak szentelt, néha társadalmilag kínos. A különbség az, hogy a geekek rajongói az alanyaiknak,a kockák pedig gyakorlók., Egy számítógépes geek lehet olvasni Vezetékes, majd érintse meg a Szilícium-Völgy pletyka-malom az érdeklődők a következő forró új dolog, míg egy kocka lehet olvasni CLRS pedig szemmel tartani okos, új módszerek alkalmazása Dijkstra algoritmus. Ne feledje, hogy bár nem szinonimák, ezek sem feltétlenül különböznek egymástól: sok Geek is nerds (és fordítva).
kísérlet
van-e bizonyíték erre a kontrasztra? (By the way, ez a Nézőpont nyúlik vissza, egy grad-iskola beszélgetés fickó geek / majom Bryan Barnes, most egy fizikus NIST.,) A Wikiszótár bejegyzések a “geek”, valamint a “kocka” kölcsön egy kis hitelt, hogy a pozíció, de szeretnék egy kicsit több empirikus…
“Azt kell tudni, hogy egy szó a környezetét” ~ J. R. Firth (1957)
jellemzik a hasonlóságokat, illetve különbségeket a “geek”, illetve a “kocka,”talán találunk a más szavakkal, hogy hajlamosak tartani őket a cég, hátha ezek a nyelvi társak támogatása a szempontból?
Data and Method
(Megjegyzés: Ha nem vagy geek vagy majom, ne félj a matematikától., Nem túl rossz … vagy valószínűleg csak ugorhat az alábbi” eredmények ” alszakaszra…)
elemeztem a Twitter adatok két forrását, mivel könnyen elérhető és elég geeky/nerdy a indításhoz. Ez magában foglalja a streaming API-n keresztül 2, 6 millió tweet háttér-korpuszt 2012.December 6. és 2013. január 3. között. A keresési API-n keresztül tweeteket is mintavételeztem, amelyek megfelelnek a “geek” és a “nerd” lekérdezési kifejezéseknek ugyanabban az időszakban (38,8 k, illetve 30,6 K Összesen). Igen, igen, igen … összegyűjtöttem az összes adatot hat hónappal ezelőtt, de most csak a számok összeroppanására került sor. Mozgalmas év volt!,
egy nagyszerű kis statisztika annak mérésére, hogy a két szó mennyire tartja meg a társaságot, pontosan kölcsönös információ (PMI). Gyakran használják az információ-visszakeresési irodalomban a szavak és kifejezések összefüggésének mérésére a szövegben, és kiderül, hogy jó előrejelzője annak, hogy az emberek hogyan értékelik a szemantikai szó hasonlóságát (Recchia & Jones, 2009)és a téma modellminőségét (Newman & al., 2010).,
két szó w és v, A PMI által megadott:
,
ahol ebben az esetben a valószínűsége a szóban forgó szó(ok) megjelenő véletlenszerű tweet, a becslések szerint az adatok. Például, ha hagyjuk v = “geek”, akkor kiszámítjuk a” geek ” Keresési korpuszban a W szó log-valószínűségét, és kivonjuk a W naplófolyamatát a háttér corpusból.,
eredmények
A PMI statisztika egyfajta korrelációt mér: a pozitív PMI pontszám két szóval azt jelenti, hogy” nagyszerű társaságot tartanak”, a negatív pontszám azt jelenti, hogy hajlamosak távolságot tartani, és a nullához közeli pontszám azt jelenti, hogy véletlenszerűen többé-kevésbé egymásba ütköznek.
ezt szem előtt tartva, itt van egy szórólap a különböző szavak szerint a PMI pontszámok mind a “geek” és a “nerd” a különböző tengelyek (figyelmen kívül hagyva a szavakat negatív PMI, és kezelésére #hashtags különálló):
sokan kértek egy magas res PDF a telek, így itt megy.,
a függőleges tengelyen felfelé haladva a szavak geekyebbé válnak (“#zene ” → “# gadget ” → “# cosplay”), és balról jobbra haladva egyre furcsábbá válnak (“Oktatás” → “nyelvtan” → “idegtudomány”). Az átlós szavak hasonlóan geeky és stréberek, beleértve a szociális (“#awkward”, “weirdo”), a mainstream tech (“#computers”, “#microsoft”) és a sci-fi/fantasy kifejezéseket (“doctorwho,” #thehobbit”). A bal alsó sarokban lévő szavak (“házimunkák”,” zöldségek”,” boobies”) sem igazán kapcsolódnak egymáshoz, míg a jobb felső sarokban (“#avengers”,” #gamer”,” #szemüveg”) erősen kötődnek mindkettőhöz., A narancssárga szavak inkább geeky, mint nerdy, a kék szavak pedig ellentétesek. Néhány megfigyelés:
- gyűjtemények geeky. A “gyűjtés” szó minden származéka (“gyűjtemény”, “gyűjthető tárgyak” stb.) narancssárga. Ahogy a “boxset” és a “#original ” is, ami a teljesség és a hitelesség ízére utal.
- az akadémiai mezők rendetlenek: “matematika”, “#történelem”, “fizika”, “biológia”, “idegtudomány”, “biokémia” stb. Más tudományos szavak (“tézis”, “#studymode”) és intézmények (“harvard”, “oxford”) szintén kék színűek.
- a tudomány & technológiai szavak különböznek., Az általános kifejezések (“#computers,” “#bigdata”) az átlón vannak — hasonlóan geeky és nerdy. Ahogy egyre több geeky felé sodródsz, olyan termékeket, startupokat, márkákat és kulturált technológiákat látsz (“#apple”, “# linux”). Ahogy fröcsköl le felé több kocka látsz több módszertanok (“calculus”).
- # a hashtagek geeky. Oké, persze, a hashtagek mindenhol ott vannak. De általában a bal felső felé fordulnak. És mivel a hashtagek “# trendi”, úgy gondolom, hogy azt jelenti, hogy a geekekek trendekbe kerülnek. (Ezt visszaveszem. Az átlagos PMI pontszám az összes hashtag esetében 0.74 a “geek”, de 0.73 a “nerd.,”A különbség nem statisztikailag szignifikáns a párosított T-teszt vagy Wilcoxon teszt használatával, vagy gyakorlatilag szignifikáns a józan ész tesztjével.)
- hobbi: hasonlítsa össze a több geeky kedvtelés (“#játékok, “”# manga”) a több stréber is (“sakk, “”sudoku”).
- Brains: az “intelligencia” szó lehet geeky, de az “oktatás”, az “intellektuális” és a “#smartypants” is stréber.
- Reading: “# books “are nerdy, but” e-books “and” ibooks ” are geeky.
- popkultúra vs., magas kultúra:” #shiny “és” # trendy “szuper-geeky, de (érdekes) “csellista” a nerdiest…
a lista folytatódik. Ha azt szeretnénk, hogy piszkálni magad körül, töltse le a nyers PMI pontszámok (4,2 mb), majd tudassa velem a megjegyzéseket, hogy mit talál. Mivel sokan kérdezték: kiszámítottam a PMI-t a keresési tweetekben megjelenő összes szóra “geek” és “nerd” (milliók) segítségével, majd manuálisan beolvastam nagyjából 7500 szót pozitív PMI pontszámokkal mindkettőre. A scatterplot tartalmaz mintegy 300 szó, hogy én kézzel szedett, mert volt értelme.,
(frissítés: megtudtam, hogy Olivia Culpo-egy önálló leírt “csellista majom” – 2012.December 20-án koronázták meg a Miss Universe-t. Az eseményt erősen tweetelték az adatgyűjtés közepén, így valószínűleg ez magyarázza a “csellista” és a “majom” közötti összefüggést. Hangsúlyozza az időérzékeny adatok korlátozásait is.)
következtetés
széles vonásokban számomra úgy tűnik, hogy a geeky szavak inkább a dolgokról szólnak (például “#cucc”), míg a nerdy szavak inkább az ötletekről szólnak (például “hipotézis”)., A geekekek rajongók, a rajongók gyűjtenek dolgokat; a kockák gyakorlók, a gyakorlók pedig ötletekkel játszanak. Persze a geekek is gyűjthetnek ötleteket, és a kockák is játszanak a dolgokkal. Plusz, nem két különálló személyiség, mint a személyiség különböző aspektusai. Általában úgy tűnik, hogy az adatok megerősítik a gondolkodásomat.
kíváncsi vagyok, milyen hasonló lenne az eredmény, ha ezt a módszert alkalmazta a Google Books Ngrams corpus-ra, vagy valami általánosabb a niche média helyett, mint a Twitter., Arra is kíváncsi vagyok, hogy milyen más kérdésekre lehet válaszolni ezzel a fajta elemzéssel (például a feleségemmel van egy évelő nézeteltérésünk, amely felett a szó nedvesebb: “nedves” vs. ” nedves.”).
végül, amikor megemlítettem egy barátomnak, hogy fel fogom írni ezt a bejegyzést, azt mondta: “Nos, azt hiszem, tudjuk, melyik vagy.”De tényleg? Lehet, hogy tudományos majom vagyok, de valószínűleg zenei geek vagyok…
frissítés (2013. június 25.): Woah. Ez több figyelmet kapott, mint amire valaha számítottam. Néhány benyomás. (1) mielőtt ezt megírtam, fogalmam sem volt, hogy van egy ” geek vs., nerd ” szent háború az Internet bizonyos sarkaiban; ezeknek a flamewaroknak a tanítása természetesen nem volt szándékom. Fel a fejjel! (2) Attól tartok, jobban ismert leszek erről az elterelésről, mint bármelyik “igazi” kutatásomról. Hogy világos legyen: ez egy szórakoztató módja annak, hogy megöljön néhány órát szombat délután, nem feltétlenül a legjobb tudományom. Azt hiszem, az írás itt hang és magától értetődő, de én vagyok az első, aki elismeri, hogy vannak jobb korpuszok, módszerek és elemzési technikák — amelyek egy grant, grad hallgató, és/vagy több, mint egy délután-felfedezésére ez az összes fontos ” igazság.,”(3) a “geek” és a “nerd” etimológiák iránt érdeklődők számára találtam ezt a hűvös írást.