594 Shares 4030 views

de regressão logística: modelos e métodos

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. regressão logística e análise discriminante são usados quando é necessário diferenciar claramente entrevistados categorias-alvo. Além disso, estes grupos são um único nível de parâmetro univariada. а также выясним, для чего она нужна. Considere mais detalhes modelo de regressão logística, bem como descobrir o que era.

visão global

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Um exemplo do problema, na solução que é utilizada regressão logística, pode ser uma classificação dos inquiridos por compra do grupo e não comprar o mostarda. A diferenciação é realizada de acordo com características sócio-demográficas. Estes incluem, em particular, incluem idade, sexo, número de membros da família, renda e assim por diante. Existem critérios para diferenciar e a variável na operação. O último codifica a categoria alvo para o qual, de fato, precisa dividir entrevistados.

nuances

, значительно уже, чем для дискриминантного анализа. Deve ser dito que a gama de casos em que a logística de regressão aplicadas, muito mais estreito do que a análise discriminante. A este respeito, o uso de este último como um método universal para a diferenciação é considerada mais preferida. Além disso, especialistas recomendo começar com uma análise discriminativa estudo classificação. E no caso de incerteza para os resultados podem ser usados de regressão logística. Esta necessidade é causada por vários fatores. используется при наличии четкого представления о типе независимых и зависимых переменных. A regressão logística é usado quando há uma ideia clara sobre o tipo de variáveis independentes e dependentes. Por conseguinte, o selecionado uma das 3 procedimentos possíveis. Quando a análise discriminante, o pesquisador está sempre lidando com uma operação estática. Tratava-se de um variáveis categóricas independentes dependentes e várias com a escala de qualquer tipo.

tipos

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. pesquisa estatística objectiva, que usa uma regressão logística, é determinar a probabilidade de que um entrevistado especial será atribuído a um grupo particular. A diferenciação é efectuada de acordo com certos parâmetros. Na prática, de acordo com os valores de um ou mais factores independentes podem ser classificados em dois grupos de respondentes. . Neste caso, há uma regressão logística binária. Também os parâmetros especificados podem ser utilizados na atribuição ao grupo é maior do que dois. Em tal situação, há uma regressão logística multinomial. O grupo resultante expressou níveis de qualquer uma variável.

exemplo

Suponha que há respostas dos entrevistados à questão de saber se eles estão interessados em uma oferta para adquirir terras nos subúrbios de Moscou. Neste caso, as opções são "não" e "sim". Precisamos descobrir que factores têm uma influência predominante sobre a decisão de potenciais compradores. Para este entrevistado perguntas são feitas sobre a infra-estrutura do território, a distância para a capital, área de terra, presença / ausência de edifícios residenciais e outros. Usando regressão binária, podem ser distribuídos em dois grupos de respondentes. O primeiro irá incluir aqueles que estão interessados em comprar – os potenciais compradores, eo segundo, respectivamente, aqueles que não estão interessados em tal oferta. Para cada entrevistado, além disso, será calculada a probabilidade de atribuição para uma categoria ou outra.

características comparativas

Ao contrário das duas formas de realização acima consiste num número e tipo de grupos dependentes e independentes variáveis diferentes. Em uma regressão binária, por exemplo, estudaram o factor dicotómica dependência de uma ou mais condições independentes. Neste caso, o último pode ser de qualquer tipo de escala. regressão multinomial é considerado uma espécie de versão da classificação. Ele refere-se a variável dependente, para mais do que 2 grupos. factores independentes deve ter tanto um ordinal ou escala nominal.

Regressão logística no SPSS

O 11-12 pacote estatístico, introduziu uma nova versão da análise – seqüência. Este método é utilizado quando o factor dependente relaciona-se com a mesma escala de nome (ordinal). Nas mesmas variáveis independentes seleccionado um determinado tipo. Eles devem ser ordinal ou nominal. Classificação em várias categorias é considerado o mais versátil. Este método pode ser usado em todos os estudos que utilizaram regressão logística. , однако, можно только с помощью всех трех приемов. Melhorar a qualidade do modelo, no entanto, só é possível usando todos os três métodos.

classificação ordinal

Diz-se que no início do pacote estatístico não foi fornecido a oportunidade de realizar uma análise especializada típico de fatores dependentes com uma escala ordinal. Para todas as variáveis, com o número de grupos de mais de 2 utilizadas opção multinomial. A análise da sequência introduzida relativamente recentemente tem um número de características. Eles levam em conta as especificidades de escala-lo. часто не рассматривается как отдельный прием. Enquanto isso, nos manuais metodológicos de regressão logística ordinal muitas vezes não é tratada como uma recepção separada. A razão é a seguinte: análise de série não tem nenhum vantagens significativas sobre multinomial. O investigador pode também usar este último na presença e ordinal e variável dependente nominal. Ao fazer isso, o processo de classificação são quase indistinguíveis uns dos outros. Isto significa que a análise de ordem exploração não irá causar quaisquer problemas.

análise das opções

Considere o caso simples – uma regressão binária. Por exemplo, no processo de pesquisa estimado de marketing demanda por graduados de certa universidade metropolitana. No questionário, os entrevistados foram feitas perguntas, incluindo:

  1. Você está trabalhando? (Ql).
  2. Ela especifica ano da graduação (q 21).
  3. Qual é a pontuação média da saída (aver).
  4. Sexo (Q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. regressão logística irá avaliar o impacto de fatores independentes aver, q 21 e q 22 em ql variável. Simplificando, o objetivo da análise é determinar o emprego susceptíveis de licenciados, com base em informações sobre o campo, no final do ano, e a pontuação média.

Regressão logística

Para definir parâmetros usando regressão binária, utilize o menu Analyze►Regression►Binary logística. Na regressão logística para escolher na lista deixou de variáveis disponíveis fator que depende. Eles é ql. Esta variável deve ser colocado no campo Dependente. Depois disso, você deve digitar as covariáveis do site fatores independentes – q 21, q 22, aver. Em seguida, você precisa escolher um modo de incluí-los na análise. Se o número de fatores independentes de mais de 2, não use o método de administração simultânea de todas as variáveis, que é instalado por padrão, e passo a passo. A mais popular é considerado Backward: LR. Usando o botão Select, você não pode incluir no estudo de todos os entrevistados, e apenas uma categoria alvo específico.

Definir variáveis categóricas

botão categórica para usar no caso quando uma das variáveis está classificado para o número de categorias de mais de 2. Nesta situação, janela Define variáveis categóricas na estação categóricas covariáveis colocado apenas como uma opção. Neste exemplo, uma tal variável está em falta. Depois que a lista drop-down, selecione o contraste Desvio item e clique no botão Alterar. Como um resultado, algumas das variáveis dependentes vai ser gerado a partir de cada um do factor classificado. O seu número corresponde ao número dos prazos originais das categorias.

Salve novas variáveis

Use o botão Salvar no estudo principal está definido para criar a caixa de diálogo novas configurações. Eles irão conter números calculados no processo de regressão. Em particular, é possível criar variáveis que determinam:

  1. Pertencendo a uma determinada categoria de classificação (Groupmembership).
  2. A probabilidade de classificar respondentes em cada grupo de estudo (Probabilidades).

Ao usar o botão Opções pesquisador não recebe quaisquer oportunidades significativas. Assim, ele pode ser ignorado. Após pressionar o botão "OK" na janela principal será exibida resultados da análise.

Controle de qualidade de adequação de regressão logística

Considere a tabela Coeficientes Omnibus Testsof modelo. Ele exibe os resultados da análise da qualidade do modelo de aproximação. Devido ao fato de que a opção incremental, você precisa para assistir os resultados da última etapa (Passo 2) foi definido. Seria considerada um resultado positivo, em que o aumento detectado índice de Qui-quadrado na transição para o passo seguinte em um alto grau de significância (Sig. <0,05). A qualidade do modelo é estimado em linha Modelo. Se você receber um valor negativo, mas não é considerado significativo se o modelo global de alta relevância, o último pode ser considerado praticamente utilizável.

tabelas

Modelo Resumo fornece uma estimativa do índice de dispersão total, que descreve a modelo construído (figura R quadrado). Recomenda-se aplicar o valor Nagelker. indicador positivo pode ser considerada como um parâmetro Nagelkerke R Square, se for maior do que 0,50. Depois que avaliou os resultados da classificação no qual os indicadores reais de pertencer a uma ou outra categoria do estudo são comparados com os valores previstos pelo modelo de regressão. Para este efeito, a Tabela tabela de classificação. Ele também permite tirar conclusões sobre a correção de diferenciação para cada um do grupo em questão. . A tabela a seguir faz com que seja possível encontrar fatores independentes estatisticamente significativas introduzidas na análise, bem como uma regressão logística fator não-padronizado. Com base nestes indicadores pode prever filiação de cada entrevistado na amostra a um grupo específico. Novas variáveis podem ser inseridos usando o botão Salvar. Eles contêm informações sobre os membros de uma determinada categoria de classificação (Predictedcategory) ea probabilidade de inclusão nesses grupos (Previsto associação probabilidades). Após pressionar o botão "OK" na janela principal aparecerá resultados de cálculos de regressão logística multinomial.

A primeira tabela, que contém indicadores importantes para o pesquisador, – Modelo Informações da conexão. Um elevado nível de significância estatística irá apontar para a alta qualidade e adequação do uso de modelos para resolver problemas práticos. Outra mesa importante é o Pseudo R-Square. Ele permite que você estimar a proporção da variância total no fator dependente, que é causada pelas variáveis independentes selecionadas para análise. De acordo com testes de razão de verossimilhança Tabela pode tirar conclusões sobre a significância estatística do último. As estimativas dos parâmetros refletir coeficientes não padronizados. Eles são usados na construção da equação. Além disso, para cada combinação de variáveis é determinada a significância estatística do seu impacto sobre o factor dependente. Enquanto isso, a pesquisa de mercado é muitas vezes necessário para diferenciar as categorias de respondentes não separadamente, mas como parte do grupo-alvo. Para este efeito, a mesa Observedand Frequencies previsto.

aplicação prática

método considerado de análise é amplamente utilizado na obra de comerciantes. Em 1991, o indicador de regressão logística sigmóide foi desenvolvido. Ele é uma ferramenta fácil de usar e eficiente que pode ser usado para prever os preços susceptíveis de seu "superaquecimento". Indicador é apresentada num gráfico sob a forma de um canal formado por duas linhas que se estendem em paralelo. Eles removeram uma distância igual a tendência. A largura do corredor irá depender apenas do período de tempo. O indicador é usado quando se trabalha com quase todo o ativo – de pares de moedas para metais preciosos.

Na prática, produziu 2 principais estratégias o uso de ferramentas: pronto-socorro e uma reversão. Neste último caso, o comerciante irá focar a dinâmica de mudanças de preços dentro do canal. Em é a probabilidade de que o movimento é iniciado no sentido oposto medida que se aproxima o custo de uma taxa de linha de suporte ou resistência. Se o preço é intimamente apto para o limite superior, em seguida, o ativo pode ser eliminado. Se for no limite inferior, você deve pensar em comprar. colapso estratégia envolve o uso de warrants. Eles são instalados fora dos limites da distância relativamente curta. Tendo em conta que o preço em alguns casos violá-los por um curto período de tempo, você deve jogar pelo seguro e definir o stop-loss. Ao mesmo tempo, é claro, independentemente da estratégia escolhida requer o comerciante para maximizar friamente perceber e avaliar a situação que surgiu no mercado.

conclusão

Assim, o uso de regressão logística permite categorizar rapidamente e facilmente entrevistados em categorias de acordo com os parâmetros especificados. Ao analisar o possível uso de uma determinada maneira. Em especial, a versatilidade de regressão multinomial diferente. No entanto, os especialistas recomendam o uso de todos os métodos descritos acima no complexo. Isto é devido ao fato de que, neste caso, a qualidade do modelo será significativamente maior. Esta, por sua vez, expandir a gama de sua aplicação.