Wenn Sie aufs college gehen, werden Sie wahrscheinlich an mindestens ein paar studentische Organisationen. Ich beginne mein 1. Semester als Doktorand an der Rochester Tech, und es gibt mehr als 350 Organisationen hier. Sie werden nach den Interessen des Schülers in verschiedene Kategorien eingeteilt. Was definiert diese Kategorien, und wer sagt, welche org geht in welche Kategorie? Ich bin sicher, wenn Sie die Leute fragen, die diese Organisationen leiten, würden sie nicht sagen, dass ihre Organisation genau wie die einer anderen Organisation ist, aber in gewisser Weise wissen Sie, dass sie ähnlich sind., Bruderschaften und sororities haben das gleiche Interesse am griechischen Leben. Intramuraler Fußball und Clubtennis haben das gleiche Interesse am Sport. Die Latino-Gruppe und die asiatisch-amerikanische Gruppe haben das gleiche Interesse an kultureller Vielfalt. Wenn Sie die Ereignisse und Besprechungen dieser Organisationen messen, können Sie möglicherweise automatisch herausfinden, zu welcher Kategorie eine Organisation gehört. Ich werde Studentenorganisationen verwenden, um einige der Konzepte von k-Nearest Neighbors zu erklären, wohl der einfachste Algorithmus für maschinelles Lernen. Das Erstellen des Modells besteht nur aus dem Speichern des Trainingsdatensatzes., Um eine Vorhersage für einen neuen Datenpunkt zu treffen, findet der Algorithmus die nächstgelegenen Datenpunkte im Trainingsdatensatz — seine “ nächsten Nachbarn.“
Wie es funktioniert
In seiner einfachsten Version berücksichtigt der k-NN-Algorithmus nur genau einen nächsten Nachbarn, der dem Punkt am nächsten ist, für den wir eine Vorhersage treffen möchten. Die Vorhersage ist dann einfach die bekannte Ausgabe für diesen Trainingspunkt., Abbildung unten zeigt dies für den Fall der Klassifizierung im Forge-Datensatz: