587 Shares 4707 views

Nächster-Nachbar-Methode: Beispiel für Arbeit

die nächste Nachbar-Methode ist der einfachste Metrik Klassifizierer, die auf der Bewertung der Ähnlichkeit von verschiedenen Objekten basieren.

Analysiert Objekt gehört zu der Klasse, zu der sie Themen der Trainingsprobe gehören. Lassen Sie uns herausfinden, welche der nächste Nachbar ist. Versuchen Sie, die komplizierte Angelegenheit, Beispiele verschiedener Techniken zu verstehen.

Verfahren Hypothese

Nächster-Nachbar-Methode kann als häufigster Algorithmus zur Klassifizierung verwendet betrachtet werden. Objektklassifizierung unterzogen gehört zur Klasse y_i, zu dem das nächste Objekt zu lernen x_i Probe.

Die Spezifität der Methoden nächste Nachbarn

k nächsten Nachbarn Methode kann die Genauigkeit der Klassifizierung verbessern. Analysiert Objekt gehört zu der gleichen Klasse wie der Großteil seiner Nachbarn, das heißt, k nahe daran der analysierten Probe x_i Objekte. In Probleme mit zwei Klassen von der Anzahl der Nachbarn zu lösen sein wird ungerade eine Situation von Unklarheiten zu vermeiden, wenn die gleiche Anzahl von Nachbarn zu verschiedenen Klassen gehören wird.

Die Technik der suspendierten Nachbarn

Postgresql-analysierte Methode tsvector nächsten Nachbarn verwendet wird, wenn die Anzahl der Klassen mindestens drei, und Sie nicht eine ungerade Zahl verwenden können. Aber Unklarheit, die sich auch in diesen Fällen. Dann wird der i-te Nachbar bekommt w_i Gewicht, das ich mit dem Nachbarn Rang ab. Es bezieht sich auf die Klasse des Objekts, das ein maximales Gesamtgewicht unter nahen Nachbarn haben wird.

Die Hypothese der Kompaktheit

Im Mittelpunkt der alle oben genannten Methoden ist die Hypothese der Kompaktheit. Er schlägt vor, eine Verbindung zwischen dem Maß der Ähnlichkeit der Objekte und ihrer zu derselben Klasse gehören. In dieser Situation ist die Grenze zwischen den verschiedenen Typen eine einfache Form, und erstellen Klassen von Objekten im Raum kompakten mobilen Bereich. Unter diesen Bereichen in der mathematischen Analyse eine geschlossene beschränkte Menge zu verstehen. Diese Hypothese wird zur alltäglichen Wahrnehmung des Wortes nicht verwendet.

Die Grundformel

Lassen Sie uns mehr nächsten Nachbarn untersuchen. Wenn das vorgeschlagene Ausbildung Probenart „Objekt-response» X ^ m = {(x_1, y_1), dots, (x_m, Y_M) }; wenn eine Vielzahl von Objekten, die Abstandsfunktion rho (x, x ‚) zu definieren, die in Form einer geeigneten Modell Ähnlichkeit von Objekten durch die Erhöhung des Wertes der Funktion abnimmt Ähnlichkeit zwischen Objekten x, x repräsentiert wird‘.

Für jedes Objekt wird u eine Trainingsprobe Objekte x_i mit zunehmender Entfernung zu u aufzubauen:

Rho (u, x_ {1; u}) Leq rho (u, x_ {2; u}) Leq cdots Leq rho (u, x_ {m; u}),

wo x_ {i; u} kennzeichnet das Objekt Lernstichprobe, die u i-ten Nachbarquellobjekt ist. Eine solche Schreibweise und Verwendung antworten i-ten Nachbarn: y_ {i; u}. Als Ergebnis finden wir, dass jedes Objekt u provoziert eigene Probe Umnummerierung.

Die Bestimmung der Anzahl k von Nachbarn

Nächster-Nachbar-Methode, wenn k = 1 ist in der Lage, eine fehlerhafte Einstufung des Gebens, nicht nur auf Objekte-Emissionen, sondern auch für andere Klassen, die in der Nähe sind.

Wenn wir = m nehmen k, wird der Algorithmus so stabil sein und in einen konstanten Wert ausartet. Deshalb ist die Zuverlässigkeit wichtig ist extremer Indizes k zu vermeiden.

In der Praxis, wie der optimale Index k verwendetes Kriterium Gleitsteuerelement.

Vorführungen Emissionen

Die Objekte der Studie sind weitgehend ungleich, aber unter ihnen gibt es diejenigen, die die Merkmale einer Klasse haben und werden als Standards bezeichnet. Bei der Nähe des Subjekts zu dem idealen Modell der hohen Wahrscheinlichkeit, zu dieser Klasse gehört.

Wie rezultativen Methode der nächsten Nachbarn? Ein Beispiel kann auf der Basis von peripheren und nicht-informativen Kategorien von Objekten zu sehen. Es ist dicht Umgebung des Objekts anderen Vertreter dieser Klasse übernommen. Wenn man sie aus der Klassifizierung des Abtastens die Qualität entfernen wird nicht leiden.

Holen Sie sich in eine bestimmte Anzahl von Proben kann Rauschbursts, die „auf dem Boden“ einer Klasse sind. Entfernen im wesentlichen positiven Einfluss auf die Qualität der Klassifikation.

Wenn die Rauschen Objekte aus dem uninformativ und beseitigen entnommenen Probe, können Sie sich auf ein paar positiven Ergebnisse zur gleichen Zeit zählen.

Die ersten Interpolationsverfahren der nächsten Nachbar Klassifizierung ermöglicht die Qualität, reduziert die Menge der gespeicherten Daten, reduziert die Zeit der Klassifizierung zu verbessern, die auf der Wahl der nächsten Standards ausgegeben wird.

Die Verwendung von ultra-großen Proben

Nächster-Nachbar-Methode basiert auf der realen Speicherung von Lernobjekten basiert. So erstellen Sie sehr große Proben ein technisches Problem mit. Das Ziel ist nicht nur eine erhebliche Menge an Informationen zu speichern, sondern auch in der Mindestzeit, Zeit zu haben, ein beliebiges Objekt u unter den nächsten Nachbarn k zu finden.

Um dieser Aufgabe gerecht zu werden, werden zwei Methoden angewendet:

  • dünnten Probe über eine Austragsleitung Nicht-Datenobjekten;
  • effektive Nutzung spezielle Datenstruktur und Codes für die sofortige Suche der nächsten Nachbarn.

Regeln der Auswahlmethoden

Die obige Klassifizierung berücksichtigt. Nächste-Nachbar-Verfahren ist in der Lösung praktischer Probleme verwendet, die vorher bekannt ist, die Abstandsfunktion rho (x, x ‚). Bei der Beschreibung von Objekten numerische Vektoren verwenden, um eine euklidische Metrik. Diese Wahl hat keine besondere Rechtfertigung, sondern beinhaltet die Messung aller Zeichen „in der gleichen Größenordnung.“ Wenn dieser Faktor nicht berücksichtigt wird, dann wird die Metrik vorherrschen Merkmal höchste numerische Werte.

Wenn es eine erhebliche Menge an Features ist, um den Abstand als die Summe der Abweichungen auf spezifische Symptome erscheinen ernstes Problem Dimension zu berechnen.

In hochdimensionalen Raum von einander entfernt werden alle Objekte. Letztlich wird jede Probe auf das Objekt als nächstes k Nachbarn untersucht. eine kleine Anzahl von informativen Features ausgewählt, dieses Problem zu beseitigen. Algorithmen für die Schätzungen basieren auf der Grundlage unterschiedlicher Sätze von Zeichen und für jede einzelne bauen ihre Nähe Funktion zu berechnen.

Abschluss

Mathematische Berechnungen beinhalten häufig die Verwendung einer Vielzahl von Techniken, die ihre eigenen charakteristischen Merkmale, Vorteile und Nachteile haben. Gesehen nächste Nachbar-Methode kann durchaus ein ernstes Problem, aufgrund der Eigenschaften von mathematischen Objekten lösen. Das experimentelle Konzept, basierend auf dem analysierten Verfahren wird in der künstlichen Intelligenz aktiv genutzt.

In den Expertensystemen ist es notwendig, nicht nur Objekte zu klassifizieren, sondern auch den Anwender eine Erklärung für die Einstufung in Frage zeigen. In diesem Verfahren wird eine Erklärung dieses Phänomens ist in Bezug auf das Objekt einer bestimmten Klasse sowie seine Lage in Bezug auf die verwendeten Probe ausgedrückt. Legal Branchenspezialisten, Geologen, Ärzte, nehmen Sie diese „Präzedenzfall“ Logik verwenden sie aktiv in ihrer Forschung.

Um Verfahren zu analysierende war die zuverlässig, effizient, um die gewünschten Ergebnisse zu geben Sie eine minimale Zahl k nehmen müssen, während auch die Emissionen unter den analysierten Objekte zu vermeiden. Deshalb ist die Verwendung von Standards und die Auswahlmethode, sowie die Optimierung Metriken.