Articles

Na” Geek „kontra”Nerd”

X

Privacy & Cookies

Ta strona używa plików cookie. Kontynuując, zgadzasz się na ich użycie. Dowiedz się więcej, w tym jak kontrolować pliki cookie.

mam!

reklamy

dla wielu ludzi „geek” i „nerd” są synonimami, ale w rzeczywistości są trochę inne., Zastanów się nad zwrotem „maniak sportowy” — okazjonalnym substytutem „jock” i być może głównym rywalem „nerda” w folklorze licealnym. Jeśli” geek „i” nerd „są synonimami, to” geek sportowy ” może być oksymoronem. (Co więcej, „sportowy kujon” albo nie oblicza, albo znaczy coś innego.)

w moim mniemaniu „geek” i „nerd” są ze sobą powiązane, ale ujmują różne wymiary intensywnego poświęcenia się tematowi:

  • geek – entuzjasta określonego tematu lub dziedziny. Maniacy są zorientowani na „gromadzenie”, gromadzenie faktów i pamiątek związanych z ich przedmiotem zainteresowania., Mają obsesję na punkcie najnowszych, najfajniejszych, najmodniejszych rzeczy, które ich temat ma do zaoferowania.
  • nerd – wytrawny intelektualista, choć znowu z określonego tematu lub dziedziny. Nerdowie są zorientowani na „osiągnięcia” i koncentrują swoje wysiłki na zdobywaniu wiedzy i umiejętności nad ciekawostkami i pamiątkami.

lub, mówiąc Obrazkowo à la The Simpsons:

oba są poświęcone swoim tematom, a czasami społecznie niewygodne. Różnica polega na tym, że maniacy są fanami swoich przedmiotów, a nerdowie są ich praktykami., Komputerowy maniak może czytać Wired i stukać plotkę z Doliny Krzemowej w poszukiwaniu tropów na temat następnej gorącej nowej rzeczy, podczas gdy komputerowy nerd może czytać CLRS i mieć oko na sprytne nowe sposoby stosowania algorytmu Dijkstry. Zauważ, że choć nie synonimy, niekoniecznie są one różne: wielu maniaków to również frajerzy (i vice versa).

eksperyment

Czy mam jakieś dowody na ten kontrast? (Nawiasem mówiąc, ten punkt widzenia sięga do rozmowy z kolegą geek / nerd Bryan Barnes, teraz fizyk w NIST.,) Wpisy w Wikisłowniku dla „geek” i „nerd” potwierdzają moją pozycję, ale chciałbym coś bardziej empirycznego…

„poznasz słowo firmy, którą utrzymuje” ~ J. R. Firth (1957)

aby scharakteryzować podobieństwa i różnice między „geek” a „geek”. „kujon”, może znajdziemy inne słowa, które mają tendencję do dotrzymywania im towarzystwa i zobaczymy, czy ci językowi towarzysze popierają mój punkt widzenia?

Dane i metody

(Uwaga: Jeśli nie jesteś ani geekiem, ani nerdem, nie bój się matematyki., Nie jest tak źle … albo możesz po prostu przejść do sekcji” wyniki ” poniżej…)

przeanalizowałem dwa źródła danych z Twittera, ponieważ są łatwo dostępne i dość geeky/nerdy do uruchomienia. Obejmuje to korpus tła 2,6 miliona tweetów za pośrednictwem interfejsu API strumieniowego od 6 grudnia 2012 do 3 stycznia 2013. Samplowałem również tweety za pośrednictwem interfejsu API wyszukiwania pasujące do zapytań „geek” i „nerd” w tym samym okresie czasu (odpowiednio 38.8 k i 30.6 K ogółem). Tak, tak, tak … zebrałem wszystkie dane pół roku temu, ale dopiero teraz zacząłem porządkować liczby. To był pracowity rok!,

świetna mała statystyka do pomiaru, ile firma dwa słowa mają tendencję do utrzymania jest pointwise mutual information (PMI). Jest on powszechnie używany w literaturze wyszukiwania informacji do pomiaru cooccurrence słów i zwrotów w tekście, a także okazuje się być dobrym predyktorem jak ludzie oceniają semantyczne podobieństwo słów (Recchia & Jones, 2009) i jakości modelu tematu (Newman & al., 2010).,

dla dwóch słów w I v, PMI jest podane przez:

,

gdzie w tym przypadku jest prawdopodobieństwo wystąpienia danego słowa(słów) w losowym tweecie, oszacowane na podstawie danych. Na przykład, jeśli pozwolimy v = „geek”, obliczamy prawdopodobieństwo logowania słowa w w korpusie wyszukiwania „geek” i odejmujemy prawdopodobieństwo logowania w w korpusie tła.,

wyniki

statystyka PMI mierzy rodzaj korelacji: pozytywny wynik PMI dla dwóch słów oznacza, że „trzymają świetne towarzystwo”, wynik negatywny oznacza, że mają tendencję do utrzymywania dystansu, a wynik bliski zeru oznacza, że wpadają na siebie mniej lub bardziej losowo.

Mając to na uwadze, oto rozrzut różnych słów zgodnie z ich wynikami PMI zarówno dla „geek”, jak i „nerd” na różnych osiach (ignorując słowa z ujemnym PMI i traktując #hashtagi jako odrębne):

Wiele osób poprosiło o plik PDF o wysokiej rozdzielczości, więc proszę bardzo.,

poruszając się w górę osi pionowej, słowa stają się bardziej geeky („#muzyka” → „#Gadżet” → „#cosplay”), a poruszając się od lewej do prawej stają się bardziej nerdy („Edukacja” → „gramatyka” → „neuroscience”). Słowa wzdłuż przekątnej są podobnie geeky i nerdy, w tym social („#awkward”, „weirdo”), mainstream tech („#computers”, „#microsoft”) i sci-fi/fantasy („doctorwho”, „#thehobbit”). Słowa w lewym dolnym rogu („obowiązki”, „warzywa”, „cycuszki”) nie są tak naprawdę związane z żadnym z nich, podczas gdy te w prawym górnym rogu („#avengers”, „#gamer”, „#glasses”) są silnie związane z obydwoma., Pomarańczowe słowa są bardziej geeky niż nerdy, a niebieskie słowa są przeciwieństwem. Niektóre obserwacje:

  • Kolekcje są geeky. Wszystkie pochodne słowa „collect” („kolekcja”,” kolekcje ” itp.) są pomarańczowe. Podobnie jak „boxset” i „#original”, które sugerują smak kompletności i autentyczności.
  • Kierunki akademickie to: „matematyka”, „#historia”, „Fizyka”, „Biologia”, „neuronauka”, „biochemia” itp. Inne wyrazy naukowe („thesis”, „#studymode”) i instytucje („harvard”, „oxford”) również są niebieskie.
  • nauka & technologia słowa różnią się., Ogólne terminy („#computers”,” #bigdata”) są po przekątnej-podobnie geeky i nerdy. W miarę jak zbliżasz się do bardziej maniakalnych, widzisz produkty, startupy, marki i bardziej kultowe technologie („#apple”,”#linux”). Jak splasy w kierunku bardziej nerdy widać więcej metodologii („calculus”).
  • # Hashtags are geeky. Ok, jasne, hashtagi są wszędzie. Ale skłaniają się w kierunku lewego górnego rogu. A ponieważ hashtagi są „# trendy”, rozumiem, że maniacy lubią trendy. (Cofam to. Średni wynik PMI dla wszystkich hashtagów wynosi 0.74 z „geek”, ale 0.73 z ” nerd.,”Różnica nie jest istotna statystycznie przy użyciu sparowanego testu T lub testu Wilcoxona, lub praktycznie istotna przy użyciu testu zdrowego rozsądku.)
  • Hobby: porównaj bardziej maniakalne rozrywki („#zabawki”, „#manga”) z bardziej nerdowymi („szachy”, „sudoku”).
  • mózgi: słowo „inteligencja” może być maniakalne, ale „edukacja”, „intelektualny” i „# mądrzy ” są kujońskie.
  • czytanie: „# książki „są kujońskie, ale „ebooki” i „ibooki” są kujońskie.
  • popkultura vs., high culture:” #shiny „i” # trendy ” są super-geeky, ale (co ciekawe) „wiolonczelista” jest najbardziej nerdiest…

lista jest długa. Jeśli chcesz poszperać wokół siebie, Pobierz surowe wyniki PMI (4,2 mb) i daj mi znać w komentarzach, co znajdziesz. Ponieważ wiele osób zapytało: obliczyłem PMI dla wszystkich słów pojawiających się w tweetach wyszukiwania z „geek” i „nerd” (miliony), a następnie ręcznie zeskanowałem około 7500 słów z dodatnimi wynikami PMI dla obu. Scatterplot zawiera około 300 słów, które wybrałem ręcznie, ponieważ miały sens.,

(aktualizacja: dowiedziałem się, że Olivia Culpo — opisywana przez siebie „wiolonczelistka nerd”-została Miss Universe 20 grudnia 2012 roku. Wydarzenie było mocno tweetowane w środku mojej kolekcji danych, więc prawdopodobnie wyjaśnia to korelację między „wiolonczelistą” a „nerdem” tutaj. Podkreśla również ograniczenia danych wrażliwych na czas.)

wniosek

w szerokim ujęciu wydaje mi się, że geeky słowa są bardziej o rzeczy (np. „#rzeczy”), podczas gdy nerdy słowa są bardziej o ideach (np. „hipoteza”)., Maniacy są fanami, a fani zbierają rzeczy; nerdowie są praktykami, a praktycy bawią się pomysłami. Oczywiście maniacy mogą zbierać pomysły, a frajerzy bawić się rzeczami. Poza tym nie są to dwie różne osobowości, tak samo jak różne aspekty osobowości. Ogólnie rzecz biorąc, dane wydają się potwierdzać moje myślenie.

zastanawiam się, jak podobne byłyby wyniki, gdybyś zastosował tę metodę do Google Books ngrams corpus, lub czegoś bardziej ogólnego zamiast niszowych mediów, takich jak Twitter., Zastanawiam się również, na jakie inne pytania można odpowiedzieć za pomocą tego rodzaju analizy (na przykład, moja żona i ja mamy wieloletnią sprzeczkę co do tego, które słowo jest bardziej mokre: „wilgotne” vs. „wilgotne.”).

W końcu, kiedy wspomniałam znajomej, że zamierzam napisać ten post, powiedziała: „cóż, chyba wiemy, którym z nich jesteś.”Ale czy naprawdę? Może i jestem kujonem naukowym, ale prawdopodobnie jestem maniakiem muzyki…

Update (25 czerwca 2013): Woah. To przyciągnęło więcej uwagi niż się spodziewałem. Kilka wrażeń. (1) przed napisaniem tego nie miałem pojęcia, że jest ” geek vs., nerd ” święta wojna w niektórych zakątkach Internetu; podsycanie tych flamewarów z pewnością nie było moim zamiarem. Rozchmurz się! (2) obawiam się, że będę lepiej znany z tej dywersji niż z moich „prawdziwych” badań. Żeby było jasne: to był fajny sposób na zabicie kilku godzin w sobotnie popołudnie, niekoniecznie moja najlepsza nauka. Myślę, że pisanie tutaj jest rozsądne i oczywiste, ale jestem pierwszym, który przyznaje, że istnieją lepsze korpusy, metody i techniki analizy-które mogłyby użyć stypendium, studenta i/lub więcej niż popołudnie – do odkrycia tej najważniejszej ” prawdy.,”(3) dla zainteresowanych etymologiami „geek” i „nerd”, znalazłem ten fajny writeup.

reklamy