Articles

On”Geek”대”Nerd”

X

Privacy&Cookies

본 사이트는 쿠키를 사용합니다. 계속함으로써,당신은 그들의 사용에 동의합니다. 쿠키를 제어하는 방법을 포함하여 자세히 알아보십시오.

그것을 얻었다!
광고

로 많은 사람들이”괴짜”그리고”괴상한”동의어 있지만,사실 그들은 조금 다릅니다., 을 고려한 구문의”스포츠 geek”—가끔 대신”운동”아마도 아치 경쟁자의”괴상한”에서 고등학교 민속 있습니다. “괴짜”와”괴상한”이 동의어라면”스포츠 괴짜”는 모순 어법 일 수 있습니다. (또한”스포츠 괴상한 사람”은 계산하지 않거나 다른 것을 의미합니다.)

In my mind,”괴짜”그리고”대단하”관련이지만,캡처 다른 차원의 강렬한 헌신을 주제:

  • 긱–는 호텔의 특정한 주제 또는 분야이다. 괴짜는”수집”지향적이며,관심 주제와 관련된 사실과 유품을 수집합니다., 그들은 그들의 주제가 제공해야하는 가장 새롭고,가장 시원하고,가장 트렌디 한 것들에 사로 잡혀 있습니다.<리>괴상한–학구적 인 지적,다시 특정 주제 나 분야의 있지만. 멍청이는”성취”지향적이며 퀴즈와 기념품을 통해 지식과 기술을 습득하는 데 노력을 집중합니다.

또는 심슨 가족이 회화 적으로 표현하기 위해:

둘 다 주제에 전념하고 때로는 사회적으로 어색합니다. 구별은 괴짜가 그들의 과목의 팬이며,멍청이는 그들의 실무자라는 것입니다., 컴퓨터 괴짜를 읽을 수 있 유선 눌러 실리콘 밸리에 소위 지도에서는 다음을 뜨겁 새로운 일을하는 동안,컴퓨터 괴상한 읽을 수 있습니다 clr 의 및에 대한 눈을 밖으로 유지한 영리는 새로운 방법을 적용하 dijkstra 알고리즘. 동의어는 아니지만 반드시 구별되는 것은 아닙니다:많은 괴짜들도 멍청이입니다(그리고 그 반대도 마찬가지입니다).

실험

이 대조에 대한 증거가 있습니까? (그런데,이 관점은 현재 NIST 의 물리학 자인 동료 괴짜/괴상한 Bryan Barnes 와의 대학원-학교 대화로 거슬러 올라갑니다.,)위키에 대한 항목이”괴짜”그리고”대단을 빌려”어떤 신빙성을 내 위치지만,나는 뭔가를 조금 더 실험…

“너희는 알고 있어 회사가 그것을 유지하”~J.R.Firth(1957)

특성을의 유사점과 차이점에 대해 설명합”괴짜”그리고”대단하다,”어쩌면 우리를 찾을 수 있습 다른 말로하는 경향이 있을 유지하는 회사,그리고 이러한 언어적 동반자 지원 내 건가요?

데이터 및 방법

(참고:괴짜 나 괴상한 사람이 아니라면 수학에 겁 먹지 마십시오., 그것은 너무 나쁜…할 수 있습니다 또는 아마 그냥”결과를”하위 섹션은 아래…)

I 분석의 두 소스터 데이터,기 때문에 쉽게 사용할 수 있고 예쁜 엽기/살아남을 부팅할 수 있습니다. 여기에는 2012 년 12 월 6 일부터 2013 년 1 월 3 일 사이에 스트리밍 API 를 통해 260 만 개의 트윗의 배경 코퍼스가 포함됩니다. 또한 같은 기간(각각 38.8k 및 30.6k 총)동안”geek”및”nerd”쿼리 용어와 일치하는 검색 API 를 통해 트윗을 샘플링했습니다. 예,예,예…6 개월 전에 모든 데이터를 수집했지만 지금은 숫자를 재정하기 위해 돌아 다녔습니다. 바쁜 한 해였습니다!,

좋은 작은 통계를 측정하는 방법을 많이 회사는 두 개의 단어을 유지하는 경향이가 pointwise 상호 정보(PMI). 그것은 일반적으로 사용되는 정보를 검색 문학을 측정하 cooccurrence 의 단어와 문장에서 텍스트,그리고 그것은 또한 밝혀 예측을 위한 좋은 인간이 어떻게 평가를 의미의 단어 유사성(Recchia&존스,2009)와 항목 모델질(Newman&al., 2010).,

두 단어를 w v,PMI 에 의해 제공됩니다.

는 이 경우에는 확률의 말씀(s)에서 질문에 나오는 임의의 트윗,으로 예상된 데이터에서. 예를 들어,v=”geek”을 허용하면”geek”검색 코퍼스에서 단어 w 의 로그 확률을 계산하고 배경 코퍼스에서 w 의 로그 확률을 뺍니다.,

결과

PMI 통계 조치의 종류의 상관관계가 있다는 긍정적인 PMI 에 대한 점수를 두 단어 뜻은 그들이”보유한 회사는,”부정적인 점수를 의미들의 거리를 유지하고 제로에 가까운 점수를 의미들이 서로 충돌이 더 많거나 적은 랜덤입니다.

그 마음에,여기에는 산점의 다양한 단어에 따라 자신의 PMI 에 대한 점수를 모두”괴짜”그리고”괴상한”다른 축에(을 무시하고 단어 부정적인 PMI 며,치료하는#해시태그로 뚜렷한)

많은 사람들이 질문에 대한 고해상도의 PDF 파일이 줄거리,그래서 당신은 여기 이동합니다.,

이동,수직 축 단어가 더 괴상(“#”음악→”#”가젯→”#cosplay”),그리고 왼쪽으로 이동하여 오른쪽 그들은 더 살아남(“교육”→”문법”→”신경과학”). 말씀을 따라 대각선은 마찬가지로 괴상하고 살아남을 포함하여 사회적(“#어색”,”이상한 사람”),주류 기술(“#컴퓨터의”,”#”microsoft),공상과학/판타지 조(“인,””#어”). 단어에서 왼쪽(“사,””야채,””얼간”)지 않은 정말 연결되거나,그 상단에서 오른쪽으로(“#복수”,”#gamer”,”#경”)을 강하게 묶여 있습니다., 주황색 단어는 살아남는 것보다 더 괴상하고 파란색 단어는 반대입니다. 일부 관찰:

  • 컬렉션은 괴짜입니다. “수집”이라는 단어의 모든 파생어(“수집품”,”수집품”등)는 주황색입니다. 완성도와 진정성에 대한 취향을 암시하는’박스셋’과’#오리지널’도 마찬가지다.
  • 학문 분야는 살아남:”수학”,”#역사,””물리학,””생물학,””신경과학,””생화학,”etc. 다른 학문 말씀(“논문”,”#studymode”)및 기관(“하버드”,”옥스퍼드”)또한 파란색이다.
  • 과학&기술 단어가 다릅니다., 일반 용어(“#computers,””#bigdata”)는 대각선에 있습니다—비슷하게 괴상하고 살아남을 수 있습니다. 당신이 벌을 향해 더 많은 괴상하게,하지만,당신이 볼 제품,창업,상표 및 더 많은 컬트 기술(“#apple”,”#linux”). 당신이 더 많은 방법론(“미적분”)을 볼 수 있습니다.
  • #해시 태그는 괴짜입니다. 좋아,물론 해시 태그가 온통 있습니다. 그러나 그들은 왼쪽 상단을 향한 경향이 있습니다. 이 해시는”#트렌디한”나는 그것을 의미하는 괴짜으로 트렌드. (나는 이것을 다시 가져 간다. 모든 해시 태그의 평균 PMI 점수는”geek”의 경우 0.74 이지만”nerd”의 경우 0.73 입니다.,”차이점은 쌍 t-테스트 또는 Wilcoxon 테스트를 사용하여 통계적으로 유의하지 않거나 상식 테스트를 사용하여 실질적으로 유의하지 않습니다.)
  • 취미:더 괴짜 오락(“#장난감,””#만화”)을 더 살아남을 것(“체스,””스도쿠”)과 비교하십시오.
  • 두뇌:word”정보”될 수 있습 엽기만,”교육,””지적,”와”똑똑한”은 살아남.
  • 읽기:”#books”는 살아남 았지만”ebooks”와”ibooks”는 괴짜입니다.<리>대중 문화 대, 높은 문화:”#shiny”와”#trendy”는 슈퍼 괴짜이지만(호기심)”첼리스트”는 nerdiest…

목록은 계속됩니다. 하려는 경우 찌 주위에 자신이 다운로드 원 PMI 점수(4.2mb)고 알려 의견에 당신은 무엇을 찾을 수 있습니다. 때문에 많은 사람들이 질문:내가 계산한 PMI 에 대한 모든 나오는 단어에서 검색으로 트윗”괴짜”그리고”대단하다”(수백만)와 그때는 수동으로 스캔한 약 7,500 말씀으로 긍정적인 PMI 에 대한 점수를 모두. 산점도에는 의미가 있었기 때문에 내가 손으로 고른 약 300 단어가 포함되어 있습니다.,

(업데이트:는 것을 배웠 올리비아 Culpo—a self-described”첼로 괴상한”—목요일에 우주 December20,2012. 이벤트가 많 트윗이 헤로인 중에 내 데이터 수집,그래서 아마 설명 사이의 상관 관계”첼로”및”대단하다”여기에. 또한 시간에 민감한 데이터의 한계를 강조합니다.)

결론

에서 넓은 스트로크,그것은 엽기 단어에 대한 자세한 물건(예를 들어,”#”물건),면서 살아남는 단어에 대한 자세한 아이디어를(예를 들어,”가설”)., 괴짜는 팬이고,팬은 물건을 모은다;멍청이는 실무자이며 실무자는 아이디어를 가지고 노는 것입니다. 물론 괴짜들은 아이디어를 수집 할 수 있고 멍청이도 물건을 가지고 놀 수 있습니다. 게다가,그들은 성격의 다른 측면만큼 두 개의 별개의 성격이 아닙니다. 일반적으로 데이터는 내 생각을 확증하는 것처럼 보입니다.

I 궁금하는 방법과 유사 결과는 경우는 이 방법을 적용하는 Google 도서 Ngrams 코퍼스,또는 더 일반 대신 미디어 틈새 다음과 같다., 한 다른 질문이 될 수 있는 대답으로 이러한 종류의 분석(예를 들어,내 아내와 나는 다년생에 불일치하는 단어입니다 습:”촉”vs”습기가 있습니다.”).

때,마지막으로 언급하는 친구를 작성까지 이후,그녀는 말했다”음,우리가 알고있는 중 하나는 당신이 있습니다.”그러나 우리는 정말로? 나는 과학 괴상한 사람일지도 모르지만 나는 아마도 음악 괴짜 일 것입니다…

업데이트(2013 년 6 월 25 일):Woah. 이것은 내가 예상했던 것보다 더 많은 관심을 얻었습니다. 몇 가지 노출. (1)이 글을 쓰기 전에”괴짜 대”가 있다는 것을 전혀 몰랐습니다., 괴상한”인터넷의 특정 구석에있는 거룩한 전쟁;이 flamewars 에 연료를 공급하는 것은 확실히 내 의도가 아니 었습니다. 밝게! (2)나는 나의”진짜”연구 중 어떤 것보다이 기분 전환에 대해 더 잘 알려질 까봐 두렵다. 분명:이 재미있는 방법이었습니다 몇 시간을 죽이는 토요일에 오후에,반드시 내 최고의 과학이 아니다. 나는 생각한 보고서 나 여기에서는 소리와 자명하지만 나는 먼저 인정하는 것이 더 나은 모음,방법,그리고 분석 기술을 사용할 수있는 권한을 부여,대학원생,및/또는 더 오-—폭로를 위해 이 중요한 것은”진리입니다.,”(3)”괴짜”와”괴상한”의 어원에 관심이있는 사람들을 위해,나는이 멋진 글쓰기를 발견했다.

광고