ha egyetemre jár, valószínűleg legalább néhány hallgatói szervezetben vett részt. Kezdem az 1. félévet, mint egy végzős hallgató Rochester Tech, és több mint 350 szervezetek itt. Különböző kategóriákba vannak rendezve a hallgató érdekei alapján. Mi határozza meg ezeket a kategóriákat, és ki mondja, hogy melyik org melyik kategóriába tartozik? Biztos vagyok benne, hogy ha megkérdeznéd az ilyen szervezeteket működtető embereket, nem mondanák, hogy az org-juk olyan, mint valaki más org-je, de valamilyen módon tudod, hogy hasonlóak., A testvériségeknek és a diákszövetségeknek ugyanaz az érdekük a görög élet iránt. A futball és a klubtenisz egyaránt érdeklődik a sport iránt. A Latino csoport és az ázsiai-amerikai csoport egyaránt érdeklődik a kulturális sokszínűség iránt. Lehet, hogy ha megméri az ilyen orgok által vezetett eseményeket és találkozókat, akkor automatikusan kitalálhatja, hogy melyik kategóriába tartozik egy szervezet. A hallgatói szervezetek segítségével elmagyarázom a K-legközelebbi szomszédok néhány fogalmát, vitathatatlanul a legegyszerűbb gépi tanulási algoritmus. A modell felépítése csak a képzési adatkészlet tárolásából áll., Egy új adatpont előrejelzéséhez az algoritmus megtalálja a legközelebbi adatpontokat a képzési adatkészletben-a “legközelebbi szomszédai”.”
hogyan működik
legegyszerűbb verziójában a k – NN algoritmus csak egy legközelebbi szomszédot vesz figyelembe, amely a legközelebbi képzési adatpont arra a pontra, amelyre előrejelzést akarunk készíteni. Az előrejelzés ezután egyszerűen a képzési pont ismert kimenete., Alábbi ábra szemlélteti ezt az esetben, ha a besorolás a forge adatbázis:
Itt adtunk három új adatokat, látható, mint a csillagok. Mindegyikük esetében megjelöltük a képzési készlet legközelebbi pontját. Az egy legközelebbi szomszéd algoritmus előrejelzése az adott pont címkéje (a kereszt színe mutatja).
ahelyett, hogy csak a legközelebbi szomszédot vesszük figyelembe, a szomszédok tetszőleges számát, k-t is figyelembe vehetjük., Ez az, ahol a neve a K-legközelebbi szomszédok algoritmus származik. Ha egynél több szomszédot veszünk figyelembe, akkor a szavazással címkét rendelünk hozzá. Ez azt jelenti, hogy minden egyes tesztpontnál számoljuk, hogy hány szomszéd tartozik a 0. osztályba, és hány szomszéd tartozik az 1. osztályba. Ezután hozzárendeljük a gyakoribb osztályt: más szóval a többségi osztályt a K-legközelebbi szomszédok között., A következő példa az öt legközelebbi szomszédot használja: