Manual spss em portugues


















Histograma das frequncias absolutas Ritmo cardaco 14 12 10 8 6 4 Std. So considerados outliers as observaes que fiquem abaixo do limite definido pela expresso q1 1.

Para criar o diagrama de extremos-e-quartis, executar o seguinte procedimento vamos usar a varivel ritmoa do ficheiro pulso. Na caixa de dilogo seguinte seleccionar a opo Simple, j que se trata de uma nica varivel, e a opo para criar um diagrama de extremos-equartis da varivel ritmoa para cada categoria de uma outra varivel vamos usar a varivel sexo para definir as categorias.

Seleccionar a opo se se. Fazer para continuar. Na seguinte caixa de dilogo, seleccionar a varivel numrica a representar no grfico ritmoa , e a varivel para definir as categorias sexo :. Repare-se que no caso dos homens, h duas observaes outliers, que so assinaladas fora dos bigodes do diagrama; o bigode chega, neste caso, at observao mais alta, mas que no seja outlier valor O intervalo de confiana definido por uma das seguintes expresses entre parentesis so indicadas as respectivas opes a seleccionar durante a definio do grfico ver frente : , em que t a , N 1 o quantil da distribuio t-Student N Confidence interval for mean ;.

Vamos ilustrar a criao deste tipo de grfico usando a varivel ritmoa do ficheiro pulso. Graphs Error Bar Na caixa de dilogo seguinte seleccionar a opo Simple, j que se trata de uma nica varivel, e a opo para um grfico da varivel ritmoa para. Seleccionar a opo se se pretender criar o grfico com todos os dados da varivel ritmoa, sem separar pelas categorias da varivel sexo:.

Na caixa Bars Represent deve seleccionar-se o tipo de intervalo de confiana que se pretende definidos anteriormente. Para pequenas amostras, o mais usual o intervalo de confiana para a mdia Confidence interval for mean.

Este tipo de grficos representa no eixo dos xx as frequncias relativas acumuladas observadas na amostra observed cummulative probability e no eixo dos yy a funo de distribuio de probabilidades esperada expected cummulative probability.

Quanto mais os pontos se afastam da diagonal, ou se se distribuem segundo um determinado padro, menor o ajustamento da amostra distribuio terica.

Vamos ilustrar ajustando a varivel ritmoa distribuio de probabilidades normal, com mdia x parmetro de localizao e varincia s 2 parmetro de escala , estimados a partir da amostra: Graphs P-P As O campo frequncias acumuladas tericas ou esperadas so calculadas por expresses matematicamente definidas, e todas relacionadas com o ranking das observaes isto , com a ordem desde 0 correspondente a xmin - a n correspondente a xmax , sendo o mtodo Blom o mais usual.

Quando h observaes repetidas ties , a sua ordem pode ser definida pela ordem da observao mdia , ou pela ordem mais elevada High ou da observao mais baixa Low da observao repetida. O resultado o seguinte:. Blom's Expected Normal quantiles calculated using proportional estimation formula and assigning the mean to ties. O output inclui, alm do grfico de ajustamento normal onde se observa um afastamento com comportamento cclico em relao diagonal , um grfico do ajustamento dos resduos yobs-yest ; se a amostra perfeitamente normal, os resduos distribuir-se-o segundo uma faixa horizontal em torno do zero, sem denotar qualquer padro de distribuio; no exemplo, ntido um comportamento cclico em torno do zero, denotando algum afastamento em relao normal.

Permite igualmente detectar observaes outliers bi-variadas, isto , observaes que se afastam do contexto das restantes observaes, mesmo que, analisadas isoladamente em relao a cada varivel, no se suspeite desses outliers. No eixo dos xx representa-se a varivel independente ou causal, e no eixo dos yy a varivel dependente, resposta ou efeito. A fim de ilustrar, vamos usar as variveis ritmoa x e ritmod y , pensando a priori que o ritmo cardaco aps exerccio fsico est relacionado com o ritmo cardaco em repouso do mesmo indivduo.

Graphs Scatter Nesta janela, deve seleccionar-se o tipo de grfico de disperso a executar: Simple quando se pretende representar num plano xy uma srie de observaes bivariadas x,y ; se nessa srie existem diferentes categorias, definidas por uma terceira varivel categrica, podem identificar-se os pontos correspondentes a cada categoria com marcas diferentes; quando se pretende representar num mesmo plano x,y duas ou mais sries de observaes bi-variadas x,y da mesma natureza; quando se pretendem representar os grficos xy de todas as combinaes possveis de duas ou mais variveis; isto , dispondo de 3 variveis genericamente identificadas por x,y,z, esta opo representa os seguintes grficos: x,y , x,z , y,z , bem como a imagem simtrica destes grficos; este grfico til para uma anlise exploratria das associaes entre diversas variveis; representa o grfico espacial a 3 dimenses definido pelos eixos x,y,z.

O tipo de grfico mais usual o Simple. Tendo seleccionado a opo pretendida, fazer para prosseguir. Na janela seguinte, definir as variveis a usar em cada um dos. Definir os ttulos como previamente descrito. O grfico resultante tem o seguinte aspecto: Ritmo aps exerccio versus ritmo cardaco em repouso Os casos so identificados por sexo Nota-se que, aparte da observao no canto superior direito do grfico, que um outlier bivariado, todas as outras observaes tm uma tendncia mais ou menos linear ligeiramente crescente.

Para ilustrar a matriz de grficos, com as variveis idade, ritmoa, ritmod, executar o procedimento:. Para editar o grfico, a fim de fazer estes pequenos ajustamentos, seleccionar o grfico click sobre o grfico na janela Viewer do SPSS e abri-lo com um dos seguintes procedimentos: i Edit SPSS Chart Object Open ii Click com o boto direito do rato Aparece o seguinte menu:.

Qualquer dos anteriores procedimentos abre o grfico numa nova janela, com a designao SPSS Chart Editor, sobreposta ao Viewer, tal como se ilustra; o grfico est sombreado na janela Viewer durante a edio; as alteraes efectuadas so reflectidas automaticamente neste grfico:. Para alterar um pormenor, por exemplo o padro de preenchimento das barras, fazer click sobre uma barra no Chart Editor ; repare-se que automaticamente todas as barras ficaram seleccionadas muito embora as marcas sejam colocadas em apenas algumas barras, todas elas esto seleccionadas :.

Neste menu, seleccionar uma das seguintes opes, conforme o objectivo; cada opo abre uma caixa de dilogo onde o utilizador selecciona a alterao a efectuar; para tomar efeito, fazer : Nota: A barra de ferramentas do SPSS Chart Editor tem os botes de atalho para as respectivas entradas no menu Format, tal como de seguida se apresentam:. Alterar a cor; Alterar o tipo de marca ou ponto no scatterplot ; Alterar o tipo contnua, pontuada e espessura de linhas; Alterar o tipo de barras:. Alterar as caractersticas fonte e tamanho do texto s activo se se se Text Para alterar os ttulos ou notas de rodap ou defini-los, se no o foram durante o procedimento do elaborao do grfico , faz-se o seguinte procedimento: Chart Title Abre-se a seguinte janela de dilogo, onde o utilizador poder alterar os ttulos se no foram previamente definidos os ttulos, os respectivos campos aparecem vazios , e o respectivo alinhamento:.

Aps ter efectuado as alteraes pretendidas, fechar o Chart Editor para regressar ao Viewer; para tal, fazer File Close, ou click no boto. Como referido no incio do captulo, o SPSS dispe de uma rotina interactiva de definio de grficos, em que a seleco e alterao do tipo de grficos, variveis a incluir, e pormenores, so mais facilmente editados. Para criar um grfico interactivo, seleccionar: Graphs Interactive No menu seguinte, selecciona-se o tipo de grfico a criar:.

Vamos ilustrar a criao de um grfico de barras e de um grfico de disperso; para os restantes tipos, os procedimentos so anlogos.

O grfico pode ser bi-dimensional, ou tri-dimensional; a seleco faz-se com os botes:. No caso de um grfico bi-dimensional, pode ser representado na vertical horizontal. Se a varivel precedida pelo con , trata-se de uma varivel categrica; se , trata-se de uma. Se se pretende visualizar a distribuio, dentro de cada um dos sexos, pela varivel fuma, deve especificar-se esta diviso por categorias, no separador Assign Variables da janela Create Bar Chart, incluindo a varivel para definir as categorias no campo Legend Variables Color; o que se est a fazeer, instruir o programa para usar cores diferentes para cada uma das categorias da varivel fuma:.

Para tal: Graphs Interactive Scatterplot Na janela de dilogo seguinte, definir as variveis para os eixos dos xx e dos yy; para identificar os casos por sexo, seleccionar a varivel sexo para o campo Legend Variable Style os casos de cada um dos sexos so identificados com uma marca distinta; se se incluir a varivel em Color, para cada um dos sexos usada uma cor distinta :. O grfico de disperso interactivo tem a particularidade de poder ajustar uma equao de regresso linear aos pontos, na totalidade, sem diferenciao por categorias, ou ento para os pontos de cada uma das categorias definidas por uma varivel categrica.

Para tal, na janela de dilogo Create Scatterplot, aps identificar as variveis x e y e a varivel categrica se se pretender uma equao para cada categoria , seleccionar o separador Fit:. No campo Method, seleccionar a opo Regression; no campo Fit lines for, seleccionar a se se pretende uma equao para cada um dos casos da varivel sexo a opo opo Total, que pode ser seleccionada isolada ou em conjunto com a opo Subgroups, destina-se a ajustar uma equao a toda a amostra.

Para cada uma das sub-amostras definidas pela varivel sexo, foi ajustada a equao de regresso linear, cujas equaes, e o respectivo coeficiente de determinao R2, so apresentadas na figura. Uma outra possibilidade apresentar os grficos por categorias isolados. Para tal, na janela Create Scatterplot, a varivel categrica seleccionada para o campo Panel Variables e no para o campo Legend Variables :.

A rea do grfico em edio, assinalada na margem esquerda por uma seta, est no interior de uma bordadura tracejada. No permitido efectuar modificaes em qualquer zona fora desta bordadura.

Os cons na borda do grfico so botes de atalho para as tarefas de edio. Para editar um elemento do grfico, deve seleccionar-se previamente, fazendo click sobre esse elemento.

Permite inserir elementos no grfico os elementos que se podem inserir dependem do tipo de grfico, e natureza das variveis em uso :. Boto que permite desfazer a ltima modificao efectuada no grfico; Selecciona a orientao horizontal ou vertical do grfico; Dispe automaticamente na rea os elementos do grfico; Definio da fonte e tamanho do texto, bold ou negrito, itlico s est activo se previamente se tiver seleccionado um elemento de texto do grfico.

Alm destes botes, que permitem efectuar a maior parte das modificaes que o utilizador normal pretende efectuar no grfico, os menus Edit, View, Format possibilitam executar. No final, para terminar a sesso de edio do grfico, basta fazer click sobre uma rea do ecran no pertencente janela do grfico. As metodologias estatsticas que envolvem testes de hipteses acerca de mdias de hiptese designam-se genericamente por testes t. O SPSS dispe de trs tipos de testes t: Teste t para a mdia de uma amostra: compara a mdia de uma amostra com a mdia hipottica conhecida de uma populao.

So apresentados os parmetros estatsticos da amostra em anlise; igualmente estabelecido um intervalo de confiana para x. Teste t para duas amostras independentes: Compara as mdias de uma mesma varivel ou caracterstica observada sobre duas amostras independentes de indivduos, com a condio de que os indivduos sejam aleatoriamente atribudos aos dois conjuntos em comparao por exemplo, produo obtida sob um tratamento versus produo obtida sob outro tratamento diferente, ou de um modo genrico, controlo versus tratamento.

So apresentados os parmetros estatsticos das amostras em anlise; efectuado o teste de LEVENE para a homogeneidade das varincias das duas amostras; so apresentadas as estatsticas de teste para as situaes de varincias homogneas e no homogneas; estabelecido um intervalo de confiana para x1 x 2. Teste t para duas amostras emparelhadas: Compara as mdias de duas variveis ou caractersticas para uma mesma amostra de indivduos do gnero peso antes versus peso depois de um determinado tratamento.

So apresentados os parmetros estatsticos para as duas amostras em anlise; calculada a correlao entre as duas amostras; So apresentados os parmetros estatsticos para as diferenas entre as duas amostras emparelhadas; estabelecido um intervalo de confiana para x1 x 2. SAV que foi criado por importao de um ficheiro dBase.

Em anexo fornecida uma impresso do ficheiro. Os dados consistem em 40 casos de pacientes seleccionados aleatoriamente entre os alunos de uma universidade , homens e mulheres, alguns dos quais fumam e outros no fumam. Para cada um dos indivduos foi medido o ritmo cardaco antes ritmoa e aps uma corrida de m ritmod. Pretende-se, entre outros objectivos, verificar se h diferenas entre os ritmos cardacos antes e aps o exerccio fsico; se h diferenas de ritmo cardaco entre homens e mulheres, entre fumadores e no fumadores.

Pretende-se igualmente saber qual o valor indicativo do ritmo cardaco mdio da populao dessa universidade. Antes de prosseguir para os testes t aconselhado fazer uma anlise exploratria dos dados, tal como foi ilustrado no captulo 3. A seguir apresentam-se dois estratos desta anlise, nomeadamente o diagrama de extremos-e-quartis e os valores extremos:. Por esta anlise pode concluir-se que o caso n 6 constitui uma observao outlier no referente observao ritmod: provavelmente, o observador queria registar o valor e, por erro, introduziu , valor virtualmente impossvel para o ritmo cardaco de qualquer humano, mesmo que sujeito a condies in extremis.

Contudo, como na realidade o estatstico no sabe ou que se passou, a melhor estratgia ser ignorar este caso indivduo n 6 sempre que tiver de utilizar a varivel ritmod. Aparece a seguinte caixa de dilogo, onde se selecciona a varivel a analisar ritmoa , e o valor hipottico da mdia da populao :. Fazer e depois OK:.

O intervalo de confiana para x [ 7. Na caixa de dilogo seguinte, seleccionar a varivel resposta a analisar ritmoa ; as duas amostras a comparar so dois sub-grupos desta varivel, definidos pela varivel fuma; para tal, seleccionar esta varivel para o campo :.

Deviation Error Mean 3. No primeiro quadro so apresentados alguns parmetros estatsticos de cada uma das amostras. No segundo quadro apresentam-se os testes de homogeneidade de varincias Levene e o teste t-Student de comparao das mdias das duas amostras. O teste de Levene uma anova. Como anteriormente se fez notar, este teste dever ser efectuando, sem incluir o indivduo n 6, por se suspeitar que o respectivo registo do ritmo cardaco aps exerccio est errado.

Para tal, na caixa de dilogo seleccionar definir que se seleccionam para anlise todos os cados diferenntes do caso n 6: ,e. Note-se que este procedimento de seleccionar casos no exclusivo nem obrigatrio do procedimento da comparao de mdias de duas amostras emparelhadas. De seguida, passa-se ento comparao das mdias das duas amostras emparelhadas. Tal como o nome indica, deve haver pares de observaes, de modo que ambas as amostras tm o mesmo nmero de observaes.

Na caixa de dilogo seguinte, seleccionar as duas variveis emparelhadas cujas mdias se pretendem comparar:. Os resultados so os seguintes: Paired Samples Statistics Mean Deviation 9.

Error Mean 1. Repare-se que foram s levados em conta 39 observaes em cada amostra. Esta metodologia uma extenso do teste t-Student para duas amostras independentes. Estas variabilidades so estimativas de varincia entre tratamentos, e residual, respectivamente. Se a estatstica F demasiado grande, ento porque a varincia entre tratamentos preponderante em relao varincia residual, isto , os diferentes tratamentos a que a amostra foi sujeita conduz a resultados estatisticamente diferentes.

Na sequncia de uma anlise de varincia em que se conclua que existem diferenas significativas entre as mdias dos diversos tratamentos em anlise, faz-se um teste suplementar a fim de identificar quais so as mdias estatisticamente diferentes.

Vamos ilustrar a metodologia de anlise de varincia, usando os valores apresentados no quadro seguinte, referentes s produes obtidas num ensaio em que se pretende. Para cada densidade de fizeram-se 4 repeties. Densidade 25 50 75 Repeties Seleccionar para o campo o nome da varivel que contm os valores da varivel que contm os resultados a analisar no exemplo, producao ; no campo selecciona-se a varivel que identifica os diferentes tratamentos densidad.

Seleccionar a opo para definir qual ou quais os testes de comparao de mdias a efectuar na sequncia da anova. Pode seleccionar-se apenas um ou mais testes. ESACB No exemplo, pediram-se os testes LSD e Tuckey. Mean Difference I-J Std. Error Means for groups in homogeneous subsets are displayed.

O primeiro quadro de resultados contm a mdias, desvio padro e erro padro da mdia e intervalo de confiana da mdia, mnimo e mximo para cada tratamento. O quadro que se segue a tabela da anlise de varincia, apresentando a variabilidade particionada entre os tratamentos betwen groups e residual within groups. Contudo, este resultado no nos permite concluir qual ou quais densidades conduzem a produes mdias significativamente diferentes de outras.

Para concluir tal, h que proceder comparao da mdia de cada um dos tratamentos com todas as restantes. Este o princpio de qualquer teste de comparaes mltiplas. Contudo, h que fixar um critrio que defina a fronteira entre o que uma diferena grande e uma diferena pequena. Este critrio estabelecido por cada um dos testes LSD, Scheff, Tukey, etc , com base em expresses que relacionam a mdia das somas dos quadrados residual calculada na tabela anova e com base em funes de distribuio de probabilidades.

Isto , o teste LSD acusa como diferentes tratamentos cujas mdias esto menos afastadas do que o teste Tuckey, que d, por assim dizer, maior margem de dvida antes de imputar essas diferenas aos efeitos dos tratamentos. De seguida aparece um quadro complementar do teste Tukey em que agrupa os tratamentos em grupos homogneos, sendo o critrio de agrupamento o facto de no existirem diferenas significativas entre os mdias dos tratamentos includos no mesmo grupo.

O mesmo tratamento pode pertencer a mais do que um grupo, desde que no difira dos restantes tratamentos desse grupo. Assim, as densidades de sementeira de , , , 25 constituem um grupo de tratamentos, cujas produes mdias so as mais baixas; as densidades de , , 25, 50, 75 constituem outro grupo, cujas produes so as mais altas.

Contudo, estas so algumas reflexes de ndole tcnica que competem ao analista desenvolver, no cabendo propriamente no mbito deste manual. No final aparece um grfico representado as mdias dos tratamentos, que pode ser til explorar no sentido de compreender os resultados, e deles tirar o proveito no mbito da aplicabilidade da Estatstica ao delineamento de ensaios agrcolas. Seleccionar para o campo o nome da varivel que contm os valores da varivel a analisar no exemplo, producao ; no campo selecciona-se a varivel que identifica os diferentes tratamentos densidad.

Seleccionar o boto a fim de pedir a elaborao da tabela da anlise de varincia. Por defeito, so calculados os parmetros mdia e desvio padro; o utilizador pode seleccionar outras estatsticas a calcular:. A tabela da anova idntica obtida no procedimento anterior. Contudo, este procedimento no permite a obteno dos testes subsequentes que foram obtidos previamente. A designao de Eta adoptada pelo SPSS no contexto da anova destina-se a no fazer confuso com o coeficiente de determinao, R2, usado no contexto da regresso linear, e que pode ser obtido a partir da tabela da anova da regresso pela expresso anterior.

A resposta de um organismo a um nico factor de crescimento pode variar com o nvel de outros factores; assim, os delineamentos uni-factoriais so criticados pelo seu pequeno leque de aplicabilidade. Na realidade, os resultados dos delineamentos uni-factoriais so apenas vlidos para o caso particular e extremamente difceis de conseguir de todos os restantes factores serem mantidos constantes.

Neste sentido, quando se espera que a resposta a um factor de interesse varie sob diferentes nveis de outros factores, devem evitar-se os delineamentos uni-factoriais, e considerar um delineamento multi-factorial que permita estudar em simultneo dois ou mais factores. Em ensaios factoriais, h a considerar os efeitos de cada um dos nveis de um dos factores, mantendo os nveis dos outros factores constantes efeitos simples , os efeitos de cada um dos factores, abstraindo da presena dos outros factores efeitos principais e interaco entre os nveis dos diversos factores interaco entre factores.

Diz-se que existe interaco entre dois factores se a resposta a um dos factores varia consoante os nveis do outro factor. A fim de ilustrar o procedimento de clculo da anlise de varincia multi-factorial, vamos usar o ficheiro arroz. Na caixa de dilogo seguinte, seleccionar a varivel dependente a analisar producao e os factores de produo cuja influncia se pretende analisar variedad e adubacao :. Por defeito, est seleccionada a opo , que especifica que a tabela da anova apresentar a os efeitos principais de cada factor, bem como as interaces o utilizador pode definir entre factores.

Optando por que a anova apresente apenas os efeitos principais, ou apenas algumas das interaces a definir. Por defeito, est definido o mtodo de clculo da soma de quadrados tipo III ; para delineamentos em que no haja missing-values deve definir-se esta metodologia de clculo. A opo deve ser seleccionada por defeito, est activada. Caso se assuma que os dados passam pela origem dos eixos isto , caso a ausncia dos factores em anlise conduzam a valor zero da varivel dependente , pode omitir-se esta opo.

Da sua incluso no modelo resulta a apresentao de mais uma linha inusitada na tabela da anova, que traduz a variabilidade associada varivel dependente para os nveis zero dos factores. As restantes linhas da tabela so as usuais. Fazer para regressar janela GLM General factorial, onde se deve.

Para seleccionar o grfico das mdias de um factor, definir esse factor em ; fazer para adicionar esse grfico; para definir o grfico das interaces, seleccionar um factor para Horizontal Axis e outro factor para Separate Lines. Fazer Optar por para continuar. Seleccionar para seleccionar o clculo de parmetros estatsticos, teste de Levene de homogeneidade de varincias e os intervalos de confiana para as mdias:. Tests the null hypothesis that the error variance of the dependent variable is equal across groups.

Estimated Marginal Means 1. The mean difference is significant at the. Adjustment for multiple comparisons: Least Significant Difference equivalent to no adjustments.

The F tests the effect of Variedade. This test is based on the linearly independent pairwise comparisons among the estimated marginal means. Mean Difference I-J The F tests the effect of Adubao.

Mean O caso mais simples traduzir esta relao pela equao de uma recta, quando o acrscimo de uma varivel, designada por dependente e usualmente representada por y, varia linearmente com os acrscimos provocados noutra varivel, designada por independente, representada por x. Como regra, previamente ao clculo da regresso linear, deve fazer-se uma anlise grfica aos dados grfico de disperso ou scatterplot , a fim de ter uma percepo visual da existncia ou no de uma tendncia de dependncia entre as variveis, e como mtodo de detectar possveis observaes outliers ou influentes, que distoram os resultados.

A representao grfica dos dados, num grfico de pontos scatterplot ajuda a identificar algumas situaes em que a equao de regresso linear simples no tem um ajustamento perfeito. De seguida, ilustram-se algumas destas situaes.

Na situao 1, a observao assinalada um outlier bi-variado, muito embora no o seja em relao a cada uma das variveis, j que no observao extrema. Contudo, o par x,y est deslocado do contexto geral das restantes observaes. Em relao s restantes observaes, o grfico evidencia uma tendncia segundo uma recta crescente. O utilizador dever verificar os dados e corrigir eventuais registos errneos, ou simplesmente desprezar esta observao e efectuar a regresso com os dados restantes.

Note-se que a incluso desta observao ir provocar uma acentuada variao no declive da recta. Na situao 2 existe uma observao igualmente muito influente em termos do declive da recta ajustada. Neste caso, a observao assinalada tem tendncia a ser outlier, quer bi-variado, quer em relao a cada uma das variveis.

Alm disso, eliminando esta observao, resta uma nuvem de pontos, em que no ntida qualquer tendncia de relao entre as variveis. Situao 2 Na situao 3, a varincia da varivel y no uniforme, ao longo dos valores em x, isto , tomando fatias verticais ao longo do eixo dos xx, a disperso dos valores y vai aumentando para valores mais elevados de y.

Muito embora a normalidade dos dados no seja um pressuposto obrigatrio para a estimativa da regresso linear, contudo necessrio que os resduos yobs yest tenham distribuio normal e varincia constante. Nesta situao, estes pressupostos so violados, invalidando as inferncias que se faam a partir da equao estimada.

A situao 4 ilustra uma forte relao entre x e y, mas no de tipo linear, pelo que o ajustamento de uma recta para traduzir esta funo de dependncia errada e sem significado.

Situao 4 Na situao 5 recolheram-se observaes apenas nas zonas extremas do intervalo de variao de x, no existindo dados para valores intermdios da varivel x. A funo de regresso linear nesta situao fortemente influenciada pelos valores extremos, mas no traduz a relao que existe para todo o intervalo de x. Na recolha de dados, deve haver a preocupao de que a amostragem cubra todo o intervalo de variao de x, de modo a evidenciar o comportamento da relao no interior desse intervalo.

Situao 5 O clculo dos coeficientes de regresso faz-se pelo mtodo dos mnimos quadrados, que minimiza 2 a soma dos quadrados dos resduos, isto , minimiza a funo y obs y , em que y representa o valor estimado pela equao para dado valor x. A equao de regresso linear uma estatstica, e como tal, tem inerente a componente de erro estatstico. A fim de interpretar a equao estimada, so apresentados uma srie de coeficientes e estatsticas suplementares, que de um modo geral permitem analisar o maior ou menor grau de rigor com que a equao de regresso traduz a relao entre as variveis em estudo.

Um dos coeficientes associados equao o coeficiente de correlao linear, representado por r, que representa, na escala ]-1, 1[, a correlao ou associao entre as. A estatstica F tem um valor alto quando a varivel independente ajuda a explicar a variabilidade da varivel dependente. Alm disso, a tabela da anlise de varincia fornece a mdia da soma dos quadrados dos resduos, cuja raz quadrada o erro padro da estimativa.

A equao de regresso to mais ajustada aos dados, quanto menor for o erro padro da estimativa, comparativamente com o desvio padro da varivel dependente.

Aparece a seguinte caixa de dilogo, No menu anterior, seleccionar a opo onde se define a varivel dependente solidos e a varivel independente insoluve para os respectivos campos:. Seleccionar o boto , que abre a seguinte caixa de dilogo, onde se seleccionam as opes Confidence intervals e Descriptives; as opes Estimates e Model fit esto activadas por defeito:.

Nesta caixa de dilogo, deve seleccionar e para obter o histograma e o grfico do ajustamento normal dos resduos, a fim de verificar se os resduos seguem distribuio normal pressuposto para a validade da regresso linear para verificar a linearidade e a igualdade de varincia dos resduos, efectuar o grfico dos resduos, com os valores estimados standardizados ZPRED no eixo dos xx, e os resduos standardizados ZRESID no eixo dos yy.

No final, fazer regressar janela Linear Regression. O boto d acesso seguinte caixa de dilogo, onde se podem definir critrios de selecco ou remoo de variveis independentes s tm efeito em regresso mltipla :. A anlise e interpretao pormenorizadas dos resultados deixam-se a cargo do leitor. Chama-se apenas a ateno para o facto de os resduos estarem ligeiramente desajustados da distribuio normal, como est evidenciado no histograma nota-se um acentuado enviezamento esquerda, bem como a falta de resduos numa das classes centrais e no grfico de ajustamento normal um perfeito ajustamento traduzido pela diagonal do grfico; neste caso, os resduos situam-se sistematicamente acima ou abaixo desta linha, em diferentes zonas do grfico.

No grfico dos resduos standardizados versus valores previstos standardizados nota-se uma tendncia para que os resduos se distribuam segundo uma curva ligeiramente cncava. O ajustamento a uma equao de segundo grau ser abordado no pargrafo seguinte. Os coeficientes de regresso b1, b2, Neste caso, previamente a efectuar o procedimento da regresso linear, devem gerar-se as variveis correspondentes s potncias x2, x3, No pargrafo seguinte ser abordada uma metodologia diferente que permite o ajustamento de equaes de curvas polinomiais a uma amostra de dados x,y.

Quando se ajusta um modelo de regresso mltipla, pode acontecer que se justifique estatisticamente incluir na equao de regresso todas as variveis independentes, ou que se incluam apenas algumas destas variveis explanatrias. Esta deciso tomada em funo da significncia do parmetro de regresso de cada uma das variveis, ou pelo acrscimo do coeficiente de determinao, R2, provocado pela incluso dessas variveis.

De um modo geral, existem duas estratgias a seguir: i comear por incluir todas as variveis, e analisar a contribuio ou significncia dos coeficientes de regresso de cada uma das variveis independentes no modelo; eliminar a varivel independente menos significativa, desde que a sua contribuio seja inferior a determinado limite normalmente analisado em termos da estatstica F associada a essa varivel na tabela da anova ; recalcular de novo o modelo sem esta varivel e, se for caso disso, eliminar nova varivel, e assim sucessivamente, at que todas as restantes variveis independentes sejam significativas para a preciso do modelo.

Este tipo de estratgia designa-se por processo backward ou stepback. Este tipo de metodologia designa-se por processo stepwise ou forward. Pode acontecer que os modelos obtidos por estes dois tipos de metodologias, para a mesma amostra de valores, no sejam inteiramente coincidentes, nomeadamente quando alguma ou algumas das variveis independentes esto muito prximas do limite que define a significncia da sua incluso ou no incluso no modelo.

Chama-se a ateno que, por vezes, a incluso de muitas variveis explanatrias no modelo pouco acrscimo trazem em termos de preciso do modelo, e este fica muito ESACB Para estimar uma equao de regresso mltipla executar o seguinte procedimento: Statistics Regression. No menu anterior, seleccionar a opo. Aparece a seguinte caixa de dilogo, onde se definem a varivel dependente e as todas as variveis independentes:.

No campo das variveis independentes esto includas todas as variveis explanatrias. O mtodo de clculo seleccionado Enter, que obriga incluso de todas as variveis independentes no modelo, sejam ou no significativas. A fim de comparar diversos modelos de regresso, vamos comear por incluir todas as variveis independentes, optando pelo mtodo Enter; seguidamente, deve repetir-se a metodologia, e optar por outros mtodos de clculo, nomeadamente Stepwise e Backward.

Seleccionar o boto linear simples. Regression Descriptive Statistics Std. All requested variables entered. Dependent Variable: Consumo mensal de gua m3 Model Summaryb.

Dependent Variable: Consumo mensal de gua m3. Unstandardized Coefficients Model 1 B Correlations Zero-order. Minimum Predicted Value Predicted Value Residual Repita-se o processo, optando pelo mtodo de clculo Stepwise. Repare-se que se simplificou o modelo, sem contudo prejudicar a preciso deste como instrumento de estimativa da varivel dependente. De seguida apresentam-se os resultados completos obtidos com o mtodo stepwise, de modo a possibilitar a comparao com o modelo que inclui todas as variveis independentes:.

Change Statistics R Square Change. F Change. Predictors: Constant , Dias teis no ms b. Predictors: Constant , Dias teis no ms, Produo mensal Ton c. Unstandardized Coefficients Model 1 2 B Predictors in the Model: Constant , Dias teis no ms b. Dependent Variable: Consumo mensal de gua m3 a Residuals Statistics. O SPSS dispe de uma rotina que permite o ajustamento de vrios modelos prdefinidos a uma amostra de valores bi-variados x,y.

Tais modelos so:. Muitos destes modelos so frequentemente usados em modelos economtricos, em que a varivel independente ou causal o decurso do tempo.

Se for este o caso, no menu apropriado o utilizador pode definir que x o tempo ver caixa de dilogo seguinte. Para exemplificar esta metodologia, vamos usar os dados referentes s caractersticas do molho de tomate em anexo. Como anteriormente se viu, o grfico denota uma ligeira curvatura na zona superior dos valores xx, que faz suspeitar que um modelo polinomial talvez seja melhor ajustado que o modelo linear simples.

Para tal, fazer: Statistics Regression. Neste menu, seleccionar a opo Curve Estimation O utilizador pode seleccionar um ou mais modelos, com o objectivo de, pela anlise dos resultados, nomeadamente R2 e anova, seleccionar o modelo melhor ajustado. No exemplo, foi solicitado para calcular os modelos linear, quadrtico e cbico.

Dependent variable.. Deletion of Missing Data R. A janela do organigrama apresenta a sequncia de resultados, que comeam na identificao ; cada rotina ou tarefa aparece identificada com uma marca identificativa dos resultados, e respectivo contedo; por exemplo, os resultados correspondentes obteno das estatsticas descritivas identificado no organigrama.

Cada conjunto de resultados comea pela identificao da rotina ou tarefa e com o respectivo contedo; esta rotina apresenta um ttulo repare que o livro est aberto , e que corresponde linha visvel Descriptives na janela direita, um conjunto de notas que no esto visveis no output o livro est fechado , e as estatsticas descritivas visveis na janela de output o livro est aberto.

Esta organizao mantm-se para os resultados das tarefas seguintes. Note que cada rotina tem um conjunto de notas, mas que no esto visualizadas; para as ver na janela de output, o utilizador s tem que fazer duplo click sobre , de modo a abrir o livro, e aparecerem as notas na janela direita. Repare que as notas incluem a data e hora de obteno dos resultados, a localizao do ficheiro de dados usado, o nmero de linhas ou casos do ficheiro de dados, indicaes sobre a existncia e tratamento de missing values, e as instrues que originaram os resultados o utilizador gerou estas instrues, ou programa, seleccionando cons e janelas nos menus do programa; contudo, e para utilizaes mais avanadas, o SPSS tem um editor de programas, em que o utilizador constri as rotinas de anlise, como se de uma linguagem de programao de tratasse.

A ltima linha das notas indica o tempo de processamento que a CPU do computador levou a executar esta rotina neste caso, 0. Para fechar o livro de notas, isto , para que as notas no sejam visualizadas no output, fazer duplo click sobre. Para condensar a parte de organigrama correspondente a uma rotina de anlise, fazer click sobre o boto - esquerda da sua identificao; por exemplo, para condensar o organigrama das estatsticas descritivas, fazer click sobre.

Esta condensao do organigrama tem a vantagem de permitir maior rapidez na localizao de determinados conjuntos de resultados, pois o utilizador pode condensar as partes no relevantes do organigrama, ficando apenas aberta a parte relevante do organigrama. Para ter acesso imediato ao diagrama de extremos-e-quartis referente a todos is valores, fazer click sobre o item.

Alm da visualizao, o utilizador pode copiar este grfico ou qualquer outro conjunto de resultados para outra aplicao em Windows por exemplo, processador de texto. Para tal, localizar o bloco de resultados pretendido tal como descrito ; Fazer Edit Copy ou CTRL-C , para capturar uma imagem do bloco seleccionado para o clipboard rea de transferncia do Windows; colocar-se na aplicao pretendida poor exemplo, num documento do Word e fazer a colagem da imagem Edit Past, ou CTRL-V.

Se se efectuou uma anlise e se chegou concluso que est repetida, ou que pura e simplesmente no interessa, pode eliminar-se do Viewer. No exemplo seguinte, repetiuse a rotina Descriptives, de modo que os resultados esto em duplicado. Podem acrescentar-se caixas de texto com comentrios aos resultados, por exemplo algumas anlises que se considerem pertinentes.

Para incluir o comentrio O histograma evidencia uma tendncia assimtrica aps o histograma, seleccionar o item Histogram:. Na janela de resultados aberta uma caixa de texto, onde se esccrevem os comentrios pretendidos:. Para eliminar um dos conjunto de resultados da rotina Descriptives, fazer click sobre o item respectivo no organigrama:. Podem guardar-se os resultados em ficheiro, de modo que posteriormente o utilizador possa recuper-los sem ter de os recalcular.

Posteriormente, se se pretender apenas consultar os resultados, basta abrir este ficheiro no SPSS. Caso se pretenda continuar a executar anlises e acrescent-las a este ficheiro, ento deve abrir-se tambm o ficheiro de dados para a partir da proceder s anlises.

Para imprimir os resultados do Viewer, faz-se File Print; na caixa de dilogo seguinte, confirmar a impressora, e fazer OK:. Se interessar imprimir no todo o conjunto de resultados, mas apenas alguns dos blocos, devem seleccionar-se previamente. Para tal, se os blocos so contguos, manter a tecla SHIFT carregada e fazer click sobre os items a seleccionar; se os blocos no so adjacentes, manter a tecla CTRL carregada e fazer click sobre os items a seleccionar:.

Neste exemplo, apenas o bloco Descriptives e o bloco Producao esto seleccionados; se se mandar imprimir, s sero impressos estes resultados. Pular no carrossel. Anterior no carrossel. Explorar E-books. Os mais vendidos Escolhas dos editores Todos os e-books.

Explorar Audiolivros. Os mais vendidos Escolhas dos editores Todos os audiolivros. Explorar Revistas. Escolhas dos editores Todas as revistas. Log In Sign Up. Download Free PDF. Leandro Bargas. Download PDF. A short summary of this paper. Uma janela Viewer abre automaticamente na primeira vez que o utilizador executar uma tarefa que gera output.

Para tal, efectua-se o seguinte procedimento: Se o ficheiro pretendido aparece na listagem, faz-se click sobre o nome do ficheiro, ou escreve-se na caixa , e de seguida faz- se. Para a eliminar, seleccionar e de seguida ou carregar na tecla DEL. Para tal, executar o seguinte procedimento: File Open Para tal, faz-se o seguinte procedimento: File Open Vamos ilustrar usando o ficheiro pulso. Para tal, fazer: Data Select Cases Vamos ilustrar utilizando o ficheiro arroz.

No final, fazer e depois. No final, fazer. Error Producao IR8 Mean Deviation Seleccionar: Statistics Summarize Frequencies Veja no Viewer os resultados. Para tal: Graphs Bar Para prosseguir, fazer. Executar o seguinte procedimento: Graphs Histogram Expected Normal quantiles calculated using Blom's proportional estimation formula and assigning the mean to ties. Graphs Scatter Para tal: Graphs Interactive Scatterplot Mean Std. Error Difference F Sig. Error Difference Sig. Pode seleccionar-se apenas um ou mais testes.

Between Groups Error Sig.



0コメント

  • 1000 / 1000