Articles

Pe „Geek” Versus „Tocilar”

X

Confidențialitate & Cookie-uri

Acest site foloseste cookie-uri. Continuând, sunteți de acord cu utilizarea lor. Aflați mai multe, inclusiv cum să controlați modulele cookie.

am înțeles!pentru mulți oameni, ” geek „și” nerd ” sunt sinonime, dar de fapt sunt puțin diferite., Luați în considerare expresia „tocilar sportiv” — un substitut ocazional pentru „jock” și poate rivalul arc al unui „tocilar” în folclorul liceului. Dacă ” geek „și” tocilar „sunt sinonime, atunci” sport geek ” ar putea fi un oximoron. (În plus,” Tocilarul sportiv ” nu calculează sau înseamnă altceva.)

în mintea mea, „Tocilarul” și „Tocilarul” sunt înrudite, dar surprind diferite dimensiuni ale unei dedicări intense unui subiect:

  • geek – un entuziast al unui anumit subiect sau domeniu. Geek-urile sunt orientate spre” colecție”, adunând fapte și amintiri legate de subiectul lor de interes., Sunt obsedați de cele mai noi, mai cool și mai trendy lucruri pe care subiectul lor le poate oferi.
  • nerd-un intelectual Studios, deși din nou de un anumit subiect sau domeniu. Tocilari sunt orientate spre” realizare”, și să se concentreze eforturile lor pe dobândirea de cunoștințe și de calificare peste trivia și memorabilia.

sau, pentru a pune-l pictorial à la The Simpsons:

ambele sunt dedicate subiecților lor, și, uneori, social incomode. Distincția este că geekii sunt fani ai subiecților lor, iar tocilarii sunt practicanți ai acestora., Un tocilar de calculator ar putea citi cu fir și atingeți Silicon Valley zvon-moara pentru conduce pe următorul hot-Nou-lucru, în timp ce un tocilar de calculator ar putea citi CLRS și să păstreze un ochi pentru noi modalități inteligente de aplicare a algoritmului Dijkstra lui. Rețineți că, deși nu sunt sinonime, ele nu sunt neapărat distincte: mulți geeks sunt, de asemenea, tocilari (și invers).

un Experiment

am vreo dovadă pentru acest contrast? (Apropo, acest punct de vedere datează dintr-o conversație grad-școală cu colegii geek/tocilar Bryan Barnes, acum un fizician la NIST.,) Wikționar intrări pentru „geek” și „tocilar” împrumuta unele crezare la poziția mea, dar as vrea ceva un pic mai mult empirice…

„să știți un cuvânt de companie se păstrează” ~ J. R. Firth (1957)

Pentru a caracteriza asemănările și diferențele dintre „geek” și „tocilar,”poate vom găsi alte cuvinte care tind să-i țină companie, și a vedea dacă aceste lingvistice tovarăși-mi susține punctul de vedere?

date și metode

(Notă: Dacă nu sunteți nici tocilar, nici tocilar, nu vă speriați de matematică., Nu este prea rău… sau probabil puteți sări doar la subsecțiunea „rezultate” de mai jos…)

am analizat două surse de date Twitter, deoarece sunt ușor disponibile și destul de geeky/nerdy pentru a porni. Aceasta include un corpus de fundal de 2, 6 milioane de tweet-uri prin API-ul de streaming între 6 decembrie 2012 și 3 ianuarie 2013. De asemenea, am eșantionat tweet-uri prin API-ul de căutare care se potrivește termenilor de interogare „geek” și „nerd” în aceeași perioadă de timp (38.8 k și, respectiv, 30.6 k total). Da, da, da… am colectat toate datele în urmă cu șase luni, dar abia acum am ajuns în jurul valorii de ronțăit numerele. A fost un an aglomerat!,

o statistică mare pentru măsurarea cât de mult compania două cuvinte tind să păstreze este pointwise mutual information (PMI). Este frecvent utilizat în extragerea de informații literatura de specialitate pentru a măsura cooccurrence de cuvinte și expresii din text, și, de asemenea, se dovedește a fi un bun predictor de modul în care oamenii evaluează semantic cuvântul similitudine (Recchia & Jones, 2009) și subiect model de calitate (Newman & al., 2010).,pentru două cuvinte w și v, PMI este dat de:

,

unde în acest caz este probabilitatea ca cuvântul(cuvintele) în cauză să apară într-un tweet aleatoriu, așa cum se estimează din date. De exemplu, dacă lăsăm v = „geek”, calculăm probabilitatea log a unui cuvânt w în corpul de căutare” geek ” și scădem probabilitatea log a lui w în corpul de fundal.,statistica PMI măsoară un fel de corelație: un scor PMI pozitiv pentru două cuvinte înseamnă că „păstrează o companie excelentă”, un scor negativ înseamnă că tind să păstreze distanța, iar un scor aproape de zero înseamnă că se ciocnesc mai mult sau mai puțin la întâmplare.având în vedere acest lucru, aici este o scatterplot de diferite cuvinte în funcție de scorurile lor PMI atât pentru „geek”, cât și pentru „tocilar” pe axe diferite (ignorând cuvintele cu PMI negativ și tratând #hashtag-urile ca distincte):

mulți oameni au cerut un PDF de înaltă rezoluție al acestui complot, așa că aici te duci.,deplasându-se în sus pe axa verticală, cuvintele devin mai geeky („#music” → „#gadget” → „#cosplay”), iar deplasându-se de la stânga la dreapta devin mai tocilari („educație” → „gramatică” → „neuroștiință”). Cuvintele de-a lungul diagonalei sunt în mod similar geeky și nerdy, inclusiv social („#incomode”, „weirdo”), mainstream tech („#computers”, „#microsoft”) și termeni sci-fi/fantezie („doctorwho”, „#thehobbit”). Cuvintele din stânga jos („treburi”, „legume”, „țâțe”) nu sunt asociate cu niciunul, în timp ce cele din dreapta sus („#răzbunători”, „#gamer”, „#ochelari”) sunt puternic legate de ambele., Cuvintele portocalii sunt mai geeky decât nerdy, iar cuvintele albastre sunt opusul. Unele observații:

  • colecțiile sunt geeky. Toate derivatele cuvântului „collect” („Collectables”, „collectables” etc.) sunt portocalii. La fel ca și” boxset „și” #original”, care implică un gust pentru completitudine și autenticitate.
  • domeniile academice sunt nerdy: „matematică”, „# istorie”, „fizică”, „biologie”, „neuroștiințe”, „biochimie” etc. Alte cuvinte academice („teză”, „#studymode”) și instituții („harvard”, „oxford”) sunt, de asemenea, albastre.
  • știința & cuvintele tehnologice diferă., Termenii generali („#computers”, „#bigdata”) sunt pe diagonală — în mod similar geeky și nerdy. Pe măsură ce vă îndreptați spre mai multe geeky, veți vedea produse, startup-uri, mărci și tehnologii mai cultive („#apple”, „#linux”). Pe măsură ce splay în jos spre mai tocilar veți vedea mai multe metodologii („calcul”).
  • #hashtag-urile sunt geeky. OK, sigur, hashtag-urile sunt peste tot. Dar au tendința spre stânga sus. Și din moment ce hashtag-urile sunt „#trendy”, cred că înseamnă că geek-urile sunt în tendințe. (Eu iau asta înapoi. Scorul mediu PMI pentru toate hashtag-urile este 0.74 cu „geek”, dar 0.73 cu „nerd.,”Diferența nu este semnificativă statistic folosind un test t asociat sau un test Wilcoxon sau practic semnificativ folosind un test de bun simț.)
  • Hobby – uri: comparați distracțiile mai geeky („#toys”, „#manga”) cu cele mai nerdy („șah”, „sudoku”).
  • Brains: cuvântul „inteligență” poate fi geeky, dar „educație”, „intelectual” și „#smartypants ” sunt tocilari.
  • Reading: „# books „sunt nerdy, dar” ebooks „și” ibooks ” sunt geeky.
  • cultura Pop vs., high culture: „# shiny ” și ” # trendy „sunt super-geeky, dar (curios)” violoncelistul ” este cel mai nerdiest…

lista poate continua. Dacă doriți să vă plimbați în jurul dvs., descărcați scorurile PMI brute (4.2 mb) și anunțați-mă în comentarii ce găsiți. Deoarece mulți oameni au întrebat: am calculat PMI pentru toate cuvintele care apar în tweet-urile de căutare cu „geek” și „nerd” (milioane) și apoi am scanat manual aproximativ 7,500 de cuvinte cu scoruri PMI pozitive pentru ambele. Scatterplot conține aproximativ 300 de cuvinte pe care le-am ales manual pentru că aveau sens.,

(actualizare: am aflat că Olivia Culpo — o „tocilară violoncelistă” auto-descrisă-a fost încoronată Miss Univers pe 20 decembrie 2012. Evenimentul a fost puternic tweeted jart în mijlocul colectării mele de date, astfel încât, probabil, explică corelația dintre „violoncelist” și „tocilar” aici. De asemenea, subliniază limitările datelor sensibile la timp.în linii mari, mi se pare că cuvintele geeky sunt mai mult despre lucruri (de exemplu, „#stuff”), în timp ce cuvintele nerdy sunt mai mult despre idei (de exemplu, „ipoteză”)., Tocilarii sunt fani, iar fanii colectează lucruri; tocilarii sunt practicanți, iar practicanții se joacă cu idei. Desigur, tocilari pot colecta idei și tocilari se joace cu lucruri, de asemenea. În plus, ele nu sunt două personalități distincte la fel de mult ca diferite aspecte ale personalității. În general, datele par să afirme gândirea mea.

mă întreb cât de similare ar fi rezultatele dacă ați aplica această metodă la Google Books ngrams corpus, sau ceva mai general în loc de un media de nișă precum Twitter., De asemenea, mă întreb ce alte întrebări ar putea fi răspuns cu acest tip de analiză (de exemplu, soția mea și cu mine avem un dezacord peren asupra cuvântului care este mai umed: „umed” vs. „umed.”).

în cele din urmă, când am menționat la un prieten pe care am fost de gând să scrie acest post, ea a spus „Ei bine, cred că știm care unul ești.”Dar noi într-adevăr? Poate că sunt un tocilar științific, dar probabil sunt un tocilar muzical…

actualizare (Iunie 25, 2013): Woah. Acest lucru a primit mai multă atenție decât am anticipat vreodată. Câteva impresii. (1) Înainte de a scrie acest lucru, am avut nici o idee a existat un „geek vs., nerd ” războiul sfânt în anumite colțuri ale Internetului; alimentarea acestor flamewars nu a fost cu siguranță intenția mea. Înveselește-te! (2) Mă tem că voi fi mai bine cunoscut pentru această diversiune decât pentru oricare dintre cercetările mele „reale”. Pentru a fi clar: acesta a fost un mod distractiv de a ucide câteva ore într-o sâmbătă după-amiază, nu neapărat cea mai bună știință a mea. Cred că writeup aici este sunet și de la sine înțeles, dar eu sunt primul care să recunoască faptul că există mai bine corpusuri, metode și tehnici de analiză — care ar putea folosi un grant, student, și/sau mai mult de o după-amiază — pentru descoperirea important „Adevărul.,”(3) pentru cei interesați de Etimologiile „geek” și „nerd”, am găsit acest writeup cool.

reclame