Validação do Questionário Computadorizado de Auto-Avaliação da Escala de Hamilton para Depressão

Introdução

A Escala de Hamilton para Depressão

            A Escala de Hamilton para Depressão (EDH) (Hamilton, 1960) foi desenvolvida durante o final dos anos 50 como uma escala padrão para avaliação da severidade dos sintomas depressivos. Os sinais e sintomas são definidos em itens e uma escala mede a intensidade de cada um deles presentes. Os avaliadores devem considerar não apenas a intensidade, mas também a freqüência com que ocorrem. A escala foi inicialmente desenvolvida para produzir um escore total baseado em 17 dos 21 itens.

            Desde a sua publicação inicial, a EDH tem sido considerada a escala mais utilizada em todo o mundo para seleção de pacientes e acompanhamento em pesquisas de depressão (Williams, 1988). O sucesso da escala se deve a grande abrangência das características dos sintomas depressivos, bem como sua boa capacidade psicométrica. Em numerosos estudos, o escore total da EDH tem provado que a escala tem boa confiabilidade e alto nível de validade concorrente e diferencial.

O Questionário de Auto-Avaliação da Escala de Hamilton para Depressão

            Recente surgiram duas versões dessa escala: O Questionário de Auto-Avaliação da Escala de Hamilton para Depressão (QAEH-D)(Carr e col., 1981) e a Entrevista Estruturada da Escala de Hamilton para Depressão (EEEHD)(Williams, 1988). 

            O QAEH-D tem sido utilizado em diversas pesquisas e os resultados demonstraram que as aplicações realizadas com auxílio de um computador apresentam alta correlação com as avaliações dos clínicos. Na Inglaterra foi arbitrariamente escolhido o ponto de corte de 1O. As informações obtidas pelo QAEH-D, utilizando-se o computador, foram bastante precisas em discriminar pacientes deprimidos de um grupo de controle normais (Carr e col., 1981). Outros estudos demonstraram que o QAEH-D aplicado pelo computador apresentou uma alta correlação com a EDH, sendo utilizado em pesquisa de tratamento de farmacológico de pacientes com depressão (Akhtar e col., 1983). Foi ainda observado que o questionário conseguiu fazer a previsão do suicídio com precisão maior do que os clínicos (Levine e col., 1989).

Tradução para o português do QAEH-D

            Carvalho e col. (1993) realizaram uma cuidadosa tradução do inglês para a língua portuguesa do QAEH-D, com excelentes resultados. O estudo incluiu a avaliação da tradução, encontrando uma boa eqüivalência lingüística, conceitual e da escala. De fato, foram obtido altos índices de concordância entre os questionários em Inglês e Português. Além do esforço do grupo em tentar obter uma boa tradução, a técnica de “back-translation” e consultas freqüentes a profissionais com experiência em tradução ajudaram no processo. Esses dados indicam que ela pode ser utilizada em Português para avaliação de estados depressivos. O ideal seria que os instrumentos de medida das condições de saúde fossem desenvolvidos independentemente em cada cultura e posteriormente comparados através de estudos transculturais (Phillips e col., 1991), entretanto, a experiência acumulada nas pesquisas em outras culturas podem ajudar na construção de um novo instrumento. 

Validação do QAEH-D

            Na pesquisa anteriormente citada para validação da tradução do QAEH-D, chamou a atenção a taxa de 17,3% (21,2% em inglês) dos indivíduos que obtiveram um escore acima do ponto de corte de 10, o que pode ser considerado alto para uma amostra utilizada, representada por estudantes de uma universidade brasileira. Em estudo anterior, Carr e col. (1981) observaram que em um grupo controle de 43 indivíduos “normais”, todos os escores ficaram abaixo de 11. Não podemos ignorar que o estudo citado foi realizado na Inglaterra e os questionários foram aplicados por computador. Talvez essas variáveis tenham alguma relação com os diferentes resultados, apesar de que algumas pesquisas não tenham demonstrado importante diferença no escore de questionários de auto-avaliação aplicados com lápis e papel e aplicados pelo computador. Estudos futuros de validação desse questionário em população brasileira poderão indicar um ponto de corte acima de 10.

            Uma tentativa anterior para validação do QAEH-D foi realizada na UNICAMP (Lima e col., 1992). Apesar dos bons resultados, o número reduzido de pacientes não permite avaliar a precisão do ponto de corte. É necessário ainda levar em consideração as diferentes culturas e subculturas no Brasil, o que significa que essa tradução pode não apresentar os mesmos resultados em diferentes regiões do país. Dentro desse propósito, estudos como o realizado por Carvalho e col. (1992) utilizando o QAEH-D em pesquisa com pacientes de hospitais gerais em 3 diferentes estados do Brasil, podem contribuir para melhor elucidação dessa questão.

Estratégia para validação de um teste

            A validação de um teste não pode se basear exclusivamente nos resultados encontrados quando a situação em questão está presente ou ausente. Para se avaliar um teste adequadamente é necessário submetê-lo a cinco fases experimentais (Mello, 1993), que seguem uma rotina lógica semelhante à utilizada para a avaliação de um novo medicamento. Cada fase avalia um tipo específico de hipótese e, à medida que se avança para as fases subseqüentes, situações adquirem uma complexidade crescente.

             Na primeira fase os estudos de avaliação se centram na questão da aplicabilidade do teste. Avaliam-se os processos de aplicação e o momento ideal para a avaliação. A amostra estudada é formada exclusivamente por casos típicos e a precisão do diagnóstico pré-teste tende para 100%. Se o teste apresentar o mesmo padrão de resposta na maioria da amostra ele será considerado satisfatório, indicando a necessidade de passarmos para a segunda fase. Se os resultados não forem uniformes não faz sentido prosseguir na avaliação. O QAEH-D passou por essa fase empiricamente, quando foi utilizado uma pesquisa farmacológica para depressão. 

            Na segunda fase comparam-se os resultados obtidos no casos típicos com os obtidos numa população normal – pessoas que não têm patologia que o teste deve identificar e nem outro tipo de patologia. Essa fase avalia a capacidade do teste para discriminar os portadores da doença dos indivíduos saudáveis. Se o teste não for capaz de diferenciar as duas categorias podemos interromper a investigação, pois, independentemente dos resultados obtidos nas outras fases, o teste não terá utilidade clínica. Dessa forma, a pesquisa realizada por Lima e col (1992) indicam que os pacientes com quadros típicos de depressão apresentaram alto escore no QAEH-D, enquanto que, a aplicação na amostra de estudantes (pessoas que não têm a patologia) apresentou resultados com baixos escores.

            Na terceira fase a amostra dos portadores da doença que o teste pretende identificar é ampliada. Além dos casos típicos, incluímos formas menos severas e casos atípicos. Se o resultados na fase II foram satisfatórios, a utilização do grupo-controle é opcional. Se o teste for capaz de identificar os casos típicos, atípicos, graves e moderados da doença, passamos para a fase IV. Aqui começamos a discurssão sobre a dificuldade do diagnóstico em psiquiatria. A ausência de um padrão-ouro nesta especialidade torna o diagnóstico dependente dos critérios utilizados para identificar um “caso” do transtorno mental, ou seja, os casos limítrofes, justamente aqueles que terão peso importante na determinação do ponto de corte, estarão na dependência do sistema diagnóstico utilizado. Mantendo-se o ponto de corte em 10 e utilizando um instrumento que inclui vários sistemas diagnósticos, como o LIST-D10, facilitará o diagnóstico clínico para Síndrome Depressiva Maior do DSM-III-R, podendo ter acesso a outros sistemas diagnósticos como, por exemplo,  a Décima Revisão da Classificação Internacional de Donças (CID-10).

            A quarta e a quinta fase, embora não faça parte desse estudo, serão citadas. Na quarta fase amplia-se o grupo com a doença e o grupo-controle. No grupo-controle incluem-se casos clinicamente semelhantes aos doença que se deseja identificar. Também se incluem, no grupo com a doença e no controle, casos com outras condições clínicas associadas para se elas interferem com os resultados. Essa fase é de grande importância, pois é a primeira vez que o experimento se aproxima da realidade clínica. Na quinta fase abandonamos os grupos criados com prevalências artificiais e passamos a avaliar o desempenho do teste numa amostra idêntica à encontrada na prática clínica. O teste passa a ser utilizado em pacientes admitidos consecultivamente, com espectro indefinido de condições, com ou sem comorbidade. Quanto mais próxima da realidade clínica for a fase V maior será a precisão da avaliação do teste.

            Esse processo pode parecer exaustivo e complexo, mas é através dele que limitamos a proliferação de teste absolutamente estéreis que tentam se incorporar á prática clínica. A avaliação criteriosa dos testes resguarda o paciente, evita gastos desnecessários e mais: que o profissional perca tempo estudando, fazendo cursos, etc., sobre “to deal with clinical reality requires a confrontation with clinical complexity”

Objetivo

                        O objetivo desse trabalho é delimitar um ponto de corte onde o QAEH-D tenha uma alta sensibilidade pois os testes com essa característica são úteis quando a doença é grave, porém tratável, e quando o diagnóstico errôneo não traz danos econômicos ou psicológicos para o paciente. Um exemplo clínico onde necessitamos de um teste com alta sensibilidade – capaz de identificar todos ou quase todos os casos – é a depressão, um distúrbio que pode ser fatal quando não diagnosticado, mas quando feito o diagnóstico praticamente 90% dos casos evoluem favoravelmente. Por outro lado, os teste de alta especificidade são úteis quando a doença é grave, incurável ou intratável, ou quando o diagnóstico errôneo traz sérios danos econômicos ou psicológico para o paciente, como é o caso, por exemplo, da esquizofrenia.

Pacientes e Métodos

Pacientes

A validação da QAEH-D será realizada com a inclusão de 100 pacientes.

Local da pesquisa

Ambulatório de Doenças Afetivas do Hospital das Clínicas da Universidade Federal de Pernambuco (ADA/HC/UFPE). Esse ambulatório é especializado no diagnóstico e tratamento dos distúrbios afetivos. Nele são desenvolvidas várias linhas de pesquisa em depressão, distúrbios de ansiedade e outros distúrbios afetivos.

Critérios de inclusão:

  • Idade entre 15 a 60 anos.
  • Escolaridade: ter, pelo menos, completado o primeiro grau.
  • Ter procurado o ADA/HC/UFPE para avaliação clínica. 
  • Aceitar participar da pesquisa.

Seleção da amostra

            A amostra será selecionada aleatóriamente a partir de indivíduos que vão ao ADA/HC/UFPE e que, seja indicado pela recepcionista do referido ambulatório para ser avaliado pelo Dr. Everton Sougey. Serão considerados apenas os casos novos avaliados pelo psiquiatra, não considerando os que já vêm em tratamento por esse médico.

O diagnóstico de depressão

            O diagnóstico clínico de Síndrome Depressiva Maior (DSM-III-R) será realizado pelo Dr. Everton Sougey. Ele é Professor Adjunto do Departamento de Neuro-Psiquiatria da Universidade Federal de Pernambuco (UFPE), com doutorado em Saúde Mental pela UNICAMP, ocasião em que desenvolveu o sistema computadorizado para multidiagnóstico da depressão, o LIST-D10. Atualmente é coordenador do ADA/HC/UFPE.

O instrumento diagnóstico

            O List-D10 é um sistema computadorizado de inteligência artificial baseado em regras e apropriado para pesquisas em psiquiatria pois utiliza a moderna estrutura dos sistemas classificatórios psiquiátrico, que são baseados em critérios operacionais para o diagnóstico. Dentre esses sistemas nosológicos, o software incorpora o DSM-III-R, da Associação Americana de Psiquiatria e a CID-10, da Organização Mundial de Saúde, que deverá entrar em vigor a partir de janeiro de 1995.

A aplicação do QAEH-D

            O QAEH-D será aplicado, em todos os casos, através de um microcomputador portátil do tipo notebook, com auxílio de um mouse do tipo “trackball”. As pessoas, após preencherem os critérios de inclusão, serão convidadas a responder o questionário no computador. Dois dados demográficos deverão ser coletados: idade e sexo. Uma rápida explicação deve ser fornecida a respeito de como proceder para responder as questões no computador. A avaliação deve ser feita com o paciente sozinho diante do computador. O avaliador fica próximo para a eventualidade de ser necessário para tirar alguma dúvida do avaliado. Após a avaliação, os dados são arquivados no próprio computador. Após a availação pelo computador, o paciente irá para avaliação psiquiátrica, sem que o médico saiba o escore obtido no QAEH-D.

Avaliação da sensibilidade

            Após avaliação de 100 pacientes, os dados serão colocados em uma tabela do tipo “2×2” para análise dos resultados positivos (caso de depressão) e negativos (casos sem depressão) a partir do QAEH-D (escore > 10) e do diagnóstico clínico de depressão utilizando o Critérios para Síndrome Depressiva Maior pelo DSM-III-R. A sensibilidade do teste será analisada, devendo ser superior a 95%. Caso não ocorra esse resultado, o ponto de corte poderá ser modificado para atingir esse objetivo.

Outras considerações sobre os resultados

            Espera-se que a especificidade também será razoavelmente alta para utilidade do teste, mas esse item não é fundamental nesse tipo de escala. Simulações estatísticas serão aplicada para analizar o poder preditivo, considerando os pacientes com diagnóstico de distúrbio de humor depressivo pelo DSM-III-R e o ponto-prevalência desse transtorno de 0,2% (Regier e col., 1984).

Sobre Dr. Tarcio Carvalho

Médico-psiquiatra, doutor em Saúde Mental pela UNICAMP
Esse post foi publicado em Depressão, Diagnóstico, Diagnóstico computadorizado, Escalas de Avaliação, Informática médica, Internet, QCA-D, Software e marcado , , , , , , . Guardar link permanente.

Deixe um comentário