Articles

On”Geek”Versus”Nerd”

X

Privacy&Cookies

このサイトではcookieを使用しています。 継続しています。 クッキーの制御方法など、詳細をご覧ください。

それを得ました!
広告

多くの人にとって、”オタク”と”オタク”は同義語ですが、実際には少し異なります。, “スポーツオタク”というフレーズを考えてみましょう—”ジョック”の時折代替物であり、おそらく高校の民間伝承における”オタク”のアーチライバルです。 “オタク”と”オタク”が同義語である場合、”スポーツオタク”は矛盾する可能性があります。 (さらに、”スポーツオタク”は計算しないか、何か他のものを意味しません。)

私の心の中では、”オタク”と”オタク”は関連していますが、主題への強烈な献身の異なる次元をキャプチャします:

  • オタク–特定のトピックまたは オタクは”コレクション”指向であり、関心のある主題に関連する事実や記念品を集めています。, 彼らは彼らの主題が提供しなければならない最も新しく、最も涼しく、流行の事と取りつかれている。
  • オタク-研究知的な、再び特定のトピックやフィールドのが。 オタクは”達成”指向であり、トリビアや記念品よりも知識とスキルを習得することに努力を集中しています。

または、アラカルトシンプソンズアラカルトそれを置くために:

両方が彼らの主題に捧げられており、時には社会的に厄介です。 違いは、オタクは彼らの主題のファンであり、オタクはそれらの実践者であるということです。, コンピュータオタクはClrsを読み、Dijkstraのアルゴリズムを適用する巧妙で新しい方法のために目を離さないかもしれないが、コンピュータオタクはワイヤードを読み、次の熱新しい事の鉛のためのシリコンバレーのうわさ製造所を叩くかもしれない。 同義語ではありませんが、必ずしも明確ではないことに注意してください:多くのオタクもオタクです(そしてその逆もあります)。

実験

私はこのコントラストのための任意の証拠を持っていますか? (ところで、この視点は、nistの物理学者である仲間のオタク/オタクBryan Barnesとの大学院の会話にさかのぼります。,

“You shall know a word by the company it keeping”~J.R.Firth(1957)

“geek”と”nerd”の類似点と相違点を特徴付けるために、他のものを見つけることができるかもしれません。それらを会社保ち、これらの言語仲間が私の視点を支えるかどうか見がちである単語か。

データとメソッド

(注:あなたがオタクでもオタクでもないなら、数学に怖がらないでください。, それはあまりにも悪いことではありません…または、おそらく以下の”結果”サブセクションにスキップすることができます…)

私はTwitterのデータの二つのソース これには、2.6December6、2012、January3、2013の間のストリーミングAPIを介したバックグラウンドコーパスが含まれています。 また、同じ期間(それぞれ合計38.8kと30.6k)にクエリ用語”geek”と”nerd”と一致する検索APIを介してツイートをサンプリングしました。 はい、はい、はい…私は半年前にすべてのデータを収集しましたが、ちょうど今、数字をクランチに周りになりました。 それは忙しい年でした!,

二つの単語が維持する傾向があるどのくらいの会社を測定するための素晴らしい小さな統計は、ポイントワイズ相互情報(PMI)です。 これは、テキスト内の単語やフレーズの共起を測定するために情報検索の文献で一般的に使用されており、人間が意味的単語の類似性(Recchia&Jones,2009)およびトピックモデルの品質(Newman&al)をどのように評価するかの良い予測因子であることも判明している。, 2010).,

二つの単語wとvについて、PMIは次のように与えられます:

ここで、この場合、データから推定されるランダムなツイートに問題の単語が現れる確率です。 たとえば、v=”geek”とすると、”geek”検索コーパスで単語wの対数確率を計算し、バックグラウンドコーパスでwの対数確率を減算します。,

Results

PMI統計は、一種の相関を測定します。

それを念頭に置いて、ここでは、異なる軸上の”geek”と”nerd”の両方のPMIスコアに応じたさまざまな単語の散布図があります(負のPMIを持つ単語を無視し、#hashtagsを異なるものとして扱います):

多くの人々がこのプロットの高解像度PDFを求めているので、ここに行きます。,

縦軸を上に移動すると、単語はよりオタクになり(”#音楽”→”#ガジェット”→”#コスプレ”)、左から右に移動すると、よりオタクになります(”教育”→”文法”→”神経科学”)。 対角線に沿った言葉は、社会的(”#厄介な”、”変人”)、主流の技術(”#コンピュータ”、”#マイクロソフト”)、およびsf/ファンタジー用語(”doctorwho”、”#thehobbit”)を含む、同様にオタクとオタクです。 左下の単語(”雑用”、”野菜”、”おっぱい”)は実際にはどちらにも関連付けられていませんが、右上の単語(”#avengers”、”#gamer”、”#glasses”)は両方に強く結びついています。, オレンジ色の言葉はオタクよりもオタクであり、青い言葉は反対です。 いくつかの観察:

  • コレクションはオタクです。 “収集”という言葉のすべての派生物(”コレクション”、”収集品”など)。)はオレンジ色。 “Boxset”と”#original”と同様に、完全性と真正性の味を意味します。
  • 学問分野はオタクです:”数学”、”#歴史”、”物理学”、”生物学”、”神経科学”、”生化学”など。 その他の学術用語(”論文”、”#studymode”)と機関(”ハーバード”、”オックスフォード”)も青です。
  • 科学&技術の言葉が異なります。, 一般的な用語(”#computers”、”#bigdata”)は対角線上にあります-同様にオタクでオタクです。 しかし、よりオタクに向かって広がるにつれて、製品、スタートアップ、ブランド、そしてよりカルト的な技術(”#apple”、”#linux”)が見えます。 あなたがよりオタクに向かって広がるにつれて、より多くの方法論(”微積分”)が見えます。
  • #ハッシュタグはオタクです。 わかりました、確かに、ハッシュタグはあちこちにあります。 しかし、彼らは左上に向かって傾向があります。 そして、ハッシュタグは”#トレンディ”なので、私はオタクがトレンドにあることを意味するためにそれを取 (私はこれを取り戻す。 すべてのハッシュタグの平均PMIスコアは、”オタク”では0.74ですが、”オタク”では0.73です。,”この違いは、ペアのt検定またはWilcoxon検定を使用して統計的に有意ではなく、常識的検定を使用して実質的に有意ではありません。
  • 趣味:よりオタクな娯楽(”#おもちゃ”、”#漫画”)とよりオタクなもの(”チェス”、”数独”)を比較してください。
  • 脳:”知性”という言葉はオタクかもしれませんが、”教育”、”知的”、および”#smartypants”はオタクです。
  • 読書:”#books”はオタクですが、”ebooks”と”ibooks”はオタクです。
  • ポップカルチャー対, ハイカルチャー:”#shiny”と”#trendy”は超オタクですが、(不思議なことに)”チェリスト”は最もオタクです…

リストは続きます。 あなた自身の周りを突くしたい場合は、生のPMIスコア(4.2mb)をダウンロードして、あなたが見つけたものをコメントで知らせてください。 多くの人々が尋ねているので:私は”オタク”と”オタク”(何百万人)で検索ツイートに表示されるすべての単語のPMIを計算し、手動で両方の正のPMIスコアで約7,500 散布図には、彼らが理にかなっていたので、私が手で選んだ約300の単語が含まれています。,

(更新:私はオリビアCulpoことを学びました—自称”チェリストオタク”-December20,2012にミス—ユニバースを戴冠しました. このイベントは、私のデータ収集の途中で激しくツイートされたので、おそらくここで”チェリスト”と”オタク”の間の相関を説明しています。 また、時間に敏感なデータの制限も強調しています。広いストロークでは、オタクの言葉はもの(例えば、”#stuff”)についてのものであり、オタクの言葉はアイデア(例えば、”仮説”)についてのものであるように私には思えます。, オタクはファンであり、ファンはものを収集し、オタクは実践者であり、実践者はアイデアで遊ぶ。 もちろん、オタクはアイデアを収集し、オタクももので遊ぶことができます。 さらに、彼らは人格の異なる側面と同じくらい二つの異なる人格ではありません。 一般的に、データは私の考えを肯定するようです。

この方法をGoogle Books Ngramsコーパス、またはTwitterのようなニッチなメディアの代わりにより一般的なものに適用した場合、結果はどれほど似ているのだろう, 私はまた、この種の分析で他の質問に答えられるかもしれないのだろうか(例えば、私の妻と私は、”湿った”対”湿った”という言葉が濡れていることについて”).

最後に、私はこの記事を書くつもりだった友人に言及したとき、彼女は言った”まあ、私たちはあなたがどちらであるかを知っていると思います。”しかし、私たちは本当にですか? 私は科学オタクかもしれませんが、私はおそらく音楽オタクです…

Update(June25,2013):Woah. これは私が予想していたよりも注目を集めています。 いくつかの印象。 (1)これを書く前に、私は”オタク対”があるとは思っていませんでした, これらのflamewarsに燃料を供給することは確かに私の意図ではありませんでした。 ライトアップ! (2)私は私の”実質の”研究の何れかのためのよりこの転換のためによりよく知られている恐れている。 明確にするために:これは土曜日の午後に数時間を殺すための楽しい方法でしたが、必ずしも私の最高の科学ではありませんでした。 私はここでの書き込みは健全で自明だと思いますが、私はこのすべての重要な”真実”を明らかにするために、助成金、大学院生、および/または午後よりも,”(3)”オタク”と”オタク”の語源に興味のある人のために、私はこのクールなライトアップを見つけました。

広告