385 Shares 6337 views

Die logistische Regression: Modelle und Methoden

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. Die logistische Regression und Diskriminanzanalyse werden verwendet , wenn es notwendig ist , eindeutig Befragten gezielt Kategorien zu unterscheiden. Darüber hinaus sind diese Gruppen eine einzige univariate Parameterebenen. а также выясним, для чего она нужна. Betrachten wir näher logistischen Regressionsmodells sowie herauszufinden , was es war.

Überblick

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Ein Beispiel für das Problem, in der Lösung , die logistische Regression verwendet wird, kann eine Klassifizierung der Befragten durch Gruppenkauf und den Senf nicht zu kaufen. Die Unterscheidung erfolgt nach sozio demographischen Charakteristika. Dazu gehören vor allem sind Alter, Geschlecht, Anzahl der Familienmitglieder, Einkommen und so weiter. Es gibt Kriterien zu differenzieren und die Variable im Betrieb. Die letztere codiert für die Zielkategorie, für die in der Tat Befragten zu unterteilen müssen.

Nuancen

, значительно уже, чем для дискриминантного анализа. Es muss gesagt werden , dass der Bereich von Fällen , in denen die angewandten Regressions Logistik, viel schmaler als die Diskriminanzanalyse. In dieser Hinsicht ist die Verwendung der letzteren als eine universelle Methode zur Differenzierung mehr bevorzugt wird, in Betracht gezogen. Darüber hinaus, empfehlen Experten mit einer Klassifizierung Studie unterscheidenden Analyse. Und für den Fall der Unsicherheit für die Ergebnisse können logistische Regression verwendet werden. Diese Notwendigkeit wird durch mehrere Faktoren verursacht werden. используется при наличии четкого представления о типе независимых и зависимых переменных. Die logistische Regression wird verwendet, wenn es eine klare Vorstellung über die Art der unabhängigen und abhängigen Variablen ist. Dementsprechend ist die eine der 3 möglichen Verfahren ausgewählt. Wenn die Diskriminanzanalyse wird der Forscher immer mit einem statischen Betrieb zu tun. Dabei handelte es sich eine abhängige und mehrere unabhängige kategorische Variablen mit dem Maßstab jeglicher Art.

Arten

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. Ziel statistische Untersuchungen, die eine logistische Regression verwendet, ist die Wahrscheinlichkeit zu bestimmen , dass eine bestimmte Befragte zu einer bestimmten Gruppe zugeordnet werden. Differenzierung erfolgt nach bestimmten Parametern. In der Praxis gemäß den Werten von einem oder mehreren unabhängigen Faktoren können in zwei Gruppen von Befragten eingestuft werden. . In diesem Fall ist es eine binäre logistische Regression. Auch angegebene Parameter können in der Zuordnung zu der Gruppe verwendet werden, ist größer als zwei. In einer solchen Situation gibt es eine multinomial logistische Regression. Die sich ergebende Gruppe ausgedrückt Ebenen beliebigen Variable.

Beispiel

Angenommen, es gibt Antworten der Befragten auf die Frage, ob sie daran interessiert sind, ein Angebot zum Erwerb Land in den Vororten von Moskau. In diesem Fall sind die Optionen „Nein“ und „Ja“. Wir müssen herausfinden, was auf die Entscheidung der potenziellen Käufer einen vorherrschenden Einfluss Faktoren haben. Für diese Befragten Fragen über die Infrastruktur des Gebiets aufgefordert werden, die Entfernung zur Hauptstadt, Fläche, An- / Abwesenheit von Wohngebäuden und so weiter. Binäre Regression, können in zwei Gruppen von Befragten verteilt werden. potenzielle Käufer, und die zweite, bzw. diejenigen, die nicht daran interessiert sind, ein solches Angebot – Das erste werden diejenigen, die daran interessiert sind im Einkauf sind. Für jeden Befragten, darüber hinaus wird es die Wahrscheinlichkeit einer Zuordnung zu einer Kategorie oder einem anderen berechnet werden.

vergleichende Merkmale

Im Unterschied zu den beiden Ausführungsformen besteht oben in einer unterschiedlichen Anzahl und Art von Gruppen abhängigen und unabhängigen Variablen. In einem binären Regression zum Beispiel untersucht die Abhängigkeit dichotomous Faktor von einem oder mehreren unabhängigen Bedingungen. In diesem Fall kann die letztere kann von jeder Art von Skala. Multinomiale Regression ist eine Art Version der Klassifizierung berücksichtigt. Sie bezieht sich auf die abhängige Variable für mehr als 2 Gruppen. Unabhängige Faktoren müssen entweder eine Ordnungs oder Nominalskala haben.

Logistische Regression in spss

Das Statistikpaket 11-12, eine neue Version der Analyse – Sequenz. Diese Methode wird verwendet, wenn abhängigen Faktor bezieht sich auf die gleichen Namen (ordinal) Skala. In diesem Fall wird die ausgewählten unabhängigen Variablen einen bestimmten Typ. Sie müssen entweder ordinal oder nominal sein. Klassifizierung in mehreren Kategorien ist das vielseitigste betrachtet. Dieses Verfahren kann in allen Studien verwendet werden , die logistische Regression verwendet. , однако, можно только с помощью всех трех приемов. Verbesserung der Qualität des Modells ist jedoch nur möglich , indem sie alle drei Methoden.

Ordnungs Klassifizierung

Es wird gesagt, dass früher in dem Statistik-Paket wurde nicht die Möglichkeit bietet eine typische Fachanalyse für abhängige Faktoren, die mit einer Ordinalskala auszuführen. Für alle Variablen, mit der Anzahl der Gruppen von mehr als 2 verwendet multinomial Option. Eingeführt vor relativ kurzer Zeit hat Sequenzanalyse eine Reihe von Funktionen. Sie berücksichtigen die Besonderheiten der Skala es. часто не рассматривается как отдельный прием. Unterdessen wird in den methodischen Leitfäden Ordnungs logistische Regression oft nicht als separate Rezeption behandelt. Der Grund hierfür ist wie folgt: Serien Analyse keine signifikanten Vorteile gegenüber multinomial hat. Der Forscher und so kann diese in Anwesenheit und ordinal verwenden und nominal abhängigen Variable. so ist der Klassifizierungsprozess kaum zu unterscheiden von ihnen zu tun. Dies bedeutet, dass die Halteordnungsanalyse keine Probleme verursachen.

Analyse der Optionen

Betrachten wir den einfachen Fall – eine binäre Regression. Zum Beispiel in dem Prozess der Marktforschung geschätzte Nachfrage nach Absolvent bestimmt Metropolitan University. Im Fragebogen wurden die Befragten gebeten, Fragen, darunter:

  1. Arbeitest du? (Ql).
  2. Geben Sie Jahr Abschluss (q 21).
  3. Wie hoch ist die durchschnittliche Punktzahl der Auslass (aver).
  4. Gender (q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. Die logistische Regression wird prüfen , die Auswirkungen der unabhängigen Faktoren aver, q 21 und q 22 mit variablen ql. Einfach ausgedrückt, ist der Zweck der Analyse der wahrscheinliche Beschäftigung der Absolventen auf der Grundlage von Informationen auf dem Feld, um zu bestimmen, das Ende des Jahres, und die durchschnittlichen Punktzahl.

logistische Regression

Um die Parameter binäre Regression verwendet Analyze►Regression►Binary Logistik-Menü. In der logistischen Regression in der linken Liste der verfügbaren Variablen abhängiger Faktor zu wählen. Sie ist ql. Diese Variable muss im Dependent Feld platziert werden. Danach müssen Sie die Website Kovariaten unabhängige Faktoren eingeben – q 21, q 22, aver. Dann müssen Sie einen Weg wählen, der sie in der Analyse. Wenn die Anzahl der unabhängigen Faktoren von mehr als 2, verwenden Sie nicht die Methode der gleichzeitigen Verabreichung aller Variablen, die standardmäßig installiert ist, und Schritt für Schritt. Die beliebteste Art und Weise wird als Rückwärts: LR. Mit Hilfe der Select-Taste, können Sie nicht in der Studie aller Befragten sind, und nur eine bestimmte Zielkategorie.

Definieren kategoriale Variablen

Kategorische Taste in dem Fall zu verwenden, wenn eine der Variablen auf die Anzahl der Gruppen von mehr als 2 bewertet wird. In dieser Situation definieren Fenster kategoriale Variablen in der Station Kategoriale Kovariaten platziert gerade eine solche Option. In diesem Beispiel ist eine solche Variable fehlt. Danach wird die Dropdown-Liste, wählen Sie den Punkt Kontrast Abweichung und klicken Sie auf die Schaltfläche Ändern. Als Ergebnis werden einige der abhängigen Variablen von jedem des Bemessungsfaktor erzeugt werden. Ihre Zahl entspricht der Anzahl der ursprünglichen Bedingungen der Kategorien.

Neue Variablen speichern

Verwenden Sie die Schaltfläche Speichern in der Hauptstudie wird die neuen Einstellungen Dialogfeld zu erstellen. Sie werden Zahlen in dem Prozess der Regression berechnet enthalten. Insbesondere ist es möglich, Variablen zu erstellen, die bestimmen:

  1. Die Zugehörigkeit zu einer bestimmten Kategorie von Klassifikation (GroupMembership).
  2. Die Wahrscheinlichkeit der Teilnehmer in jeder Studiengruppe (Wahrscheinlichkeiten) zu klassifizieren.

Wenn die Schaltfläche Optionen Forscher mit keine wesentlichen Chancen erhalten. Dementsprechend kann es ignoriert. Nach Drücken der Taste „OK“ im Hauptfenster angezeigt Analyseergebnisse werden.

Qualitätskontrolle der logistischen Regression Angemessenheit

Betrachten Sie die Tabelle Omnibus Testsof Modellkoeffizienten. Es zeigt die Ergebnisse der Analyse der Qualität des Näherungsmodells. Aufgrund der Tatsache, dass die inkrementellen Option, müssen Sie die Ergebnisse der letzten Stufe beobachten (Schritt 2) festgelegt wurde. Würde ein positives Ergebnis in Betracht gezogen werden, bei dem der detektierte Zunahme Chi-square-Index in dem Übergang zu dem nächsten Schritt zu einem hohen Maße an Signifikanz (Sig. <0,05). Die Qualität des Modells wird in Modelllinie geschätzt. Wenn Sie einen negativen Wert, aber ist es nicht als signifikant angesehen, wenn die insgesamt hohe Wesentlichkeit Modell kann die letzte praktisch verwendbar betrachtet werden.

Tabellen

Zusammenfassung Modell liefert eine Schätzung der Gesamtdispersion Index, der das konstruierte Modell (Abbildung R-Platz) beschreibt. Es wird empfohlen, den Wert Nagelker anzuwenden. Positiver Indikator kann als Parameter Nagelkerke R-Platz in Betracht gezogen werden, wenn sie höher als 0,50 sind. Danach bewertet die Ergebnisse der Klassifizierung in dem die eigentliche Indikatoren mit den durch das Regressionsmodell vorhergesagt, verglichen mit der einen oder anderen Kategorie der Studie gehören, sind. Zu diesem Zweck Tabelle der Tabelle Klassifizierung. Sie können damit auch für jede der Gruppe in Frage Rückschlüsse auf die Richtigkeit der Differenzierung ziehen. . Die folgende Tabelle ermöglicht es , statistisch signifikante unabhängige Faktoren in die Analyse sowie eine nicht-standardisierten Faktor logistische Regression eingegeben zu finden. Auf der Grundlage dieser Indikatoren können in der Probe zu einer bestimmten Gruppenzugehörigkeit jedes Befragten prognostizieren. Neue Variablen können mit der Schaltfläche Speichern eingegeben werden. Sie werden Informationen über die Zugehörigkeit zu einer bestimmten Klassifizierungskategorie (Predictedcategory) und die Wahrscheinlichkeit der Aufnahme in diesen Gruppen (Predicted Wahrscheinlichkeiten Mitgliedschaft) enthalten. Nach Drücken der Taste „OK“ im Hauptfenster angezeigt Multinomiale logistische Regression Berechnungsergebnisse.

Die erste Tabelle, die wichtige Indikatoren für den Forscher enthält, – Modell Fitting Informationen. Ein hohes Maß an statistischer Signifikanz wird auf die hohe Qualität und Eignung der Verwendung von Modellen zeigen auf praktische Probleme zu lösen. Eine weitere wichtige Tabelle ist der Pseudo-R-Platz. Es ermöglicht Ihnen, den Anteil der Gesamtvarianz in den abhängigen Faktor zu schätzen, die für die Analyse ausgewählt durch die unabhängigen Variablen verursacht wird. Tabelle Likelihood Ratio Tests zufolge können Rückschlüsse auf die statistische Signifikanz der letzteren ziehen. Die Parameter Schätzungen spiegeln nicht-standardisierte Koeffizienten. Sie sind in der Konstruktion der Gleichung verwendet. Darüber hinaus ist für jede Kombination von Variablen ist die statistische Signifikanz ihrer Auswirkungen auf die abhängigen Faktor bestimmt. Inzwischen ist die Marktforschung oft notwendig, die Kategorien der Befragten nicht separat zu unterscheiden, sondern als Teil der Zielgruppe. Dazu wird die Tabelle Observedand Prognostizierte Frequenzen.

praktische Anwendung

Betrachten Analysemethode ist in der Arbeit von Händlern weit verbreitet. Im Jahr 1991 wurde der S-förmige logistische Regression Indikator entwickelt. Er ist ein einfach zu bedienendes und leistungsfähiges Werkzeug, das verwendet werden kann, um die wahrscheinlichen Preise auf ihre „Überhitzung“ vorherzusagen. Indikator ist in der Form eines durch zwei Linien parallel verlaufenden Kanal gebildet ist in einem Diagramm dargestellt. Sie entfernten einen gleichen Abstand von dem Trend. Die Breite des Korridors wird ausschließlich auf den Zeitraum ab. Der Indikator verwendet wird, wenn sie mit fast allen Asset arbeiten – von Währungspaaren zu Edelmetallen.

In der Praxis erzeugt es zwei wichtige Strategien für den Einsatz des Gerätes: Zusammenbruch und eine Umkehr. Im letzteren Fall wird sich der Händler auf der Dynamik der Preisänderungen innerhalb des Kanals. On ist die Wahrscheinlichkeit, dass die Bewegung in der entgegengesetzten Richtung beginnt, da sie die Kosten für eine Unterstützung oder Widerstand Zeilenrate annähert. Wenn der Preis eng Anpassung an die obere Grenze ist, dann kann der Vermögenswert beseitigt werden. Wenn es an der unteren Grenze ist, sollten Sie über den Kauf nachdenken. Strategie Abbau beinhaltet die Verwendung von Optionsscheinen. Sie werden außerhalb der Grenzen der relativ kurzen Strecke installiert. Unter Berücksichtigung, dass der Preis in einigen Fällen sie für eine kurze Zeit verletzt, sollten Sie es sicher spielen und den Stop-Loss gesetzt. Zur gleichen Zeit, natürlich, unabhängig von der gewählten Strategie erfordert die Händler kühl zu maximieren wahrnehmen und beurteilen die Situation, die auf dem Markt entstanden ist.

Abschluss

Somit ermöglicht die Verwendung der logistischen Regression für Sie schnell und einfach die Befragten in Kategorien in Übereinstimmung mit den angegebenen Parametern kategorisieren. Bei der Analyse der möglichen Verwendung einer bestimmten Art und Weise. Insbesondere die Vielseitigkeit verschiedener multinomial Regression. Allerdings empfehlen Experten den Einsatz aller oben in der Anlage beschriebenen Verfahren. Dies ist aufgrund der Tatsache, dass in diesem Fall die Qualität des Modells deutlich höher sein wird. Dies wiederum, erweitert das Spektrum ihrer Anwendung.