Ensaios clínicos comparativos, randomizados e duplo cego: a base de uma abordagem científica rigorosa
Um tratamento é eficaz quando previne ou tem um efeito positivo sobre as manifestações ou o curso normal de uma doença, por exemplo, aliviando os sintomas, acelerando a recuperação, reduzindo a incidência de complicações ou recorrência, ou prolongando a sobrevivência.
Qual é a melhor maneira de demonstrar a eficácia de um tratamento? Em outras palavras, como estabelecer uma relação causal entre o tratamento e a melhora clínica de magnitude suficiente para justificar o risco de sofrer os danos conhecidos – ou os ainda desconhecidos – de um medicamento?
Este artigo é baseado na revisão da literatura da Prescrire, especialmente no que se refere à avaliação de novos medicamentos e outros tratamentos. No texto, é explicado o significado dos seguintes termos: ensaio clínico, comparativo, randomizado, duplo-cego e o critério clínico.
Experimentação em vez de simples observação
Na pesquisa clínica, há dois tipos diferentes de estudos: observacionais ou descritivos e intervencionistas ou experimentais.
Estudos observacionais: descrevem sem intervir. Em um estudo observacional, é observado um grupo de pessoas (uma “coorte”) que não está recebendo uma intervenção adicional, além do tratamento habitual, para mudar o curso de sua saúde. Esses estudos fornecem informações úteis para avaliar um tratamento, especialmente para formular hipóteses sobre seus efeitos e para estimar a frequência dos efeitos adversos [2]. Entretanto, eles não demonstram uma relação causal entre os efeitos observados e o tratamento recebido: eles não fornecem evidências sobre a eficácia de um tratamento.
Por exemplo, um estudo usando dados de 121.700 mulheres, coletados entre 1976 e 1994, sugeriu que a mortalidade era menor entre as que usavam terapia hormonal pós-menopausa do que entre as que não usavam. A diferença parecia ser mais acentuada em mulheres com fatores de risco para eventos cardiovasculares. Ela foi considerada estatisticamente significativa depois que alguns “ajustes” foram feitos, por exemplo, alguns cálculos para levar em conta algumas diferenças entre as que usaram e as que não usaram, que estavam relacionados principalmente ao peso corporal, ao status de fumante, à presença ou ausência de hipertensão e a outros fatores associados a um risco maior de morte prematura [4].
Cuidado com os fatores de confusão que não são levados em conta. Esse estudo observacional estabeleceu a existência de uma associação estatística – nessa coorte de mulheres – entre o uso de terapia hormonal pós-menopausa e a mortalidade [4]. Entretanto, essa associação estatística pode ser explicada de várias maneiras, além do uso desse tratamento. Por exemplo, é provável que as mulheres que optaram por usar a terapia hormonal pós-menopausa (que, naquela época, já era considerada benéfica há muito tempo) tenham prestado mais atenção à sua saúde do que as não usuárias e tenham se exercitado regularmente, seguido uma dieta mais saudável e provavelmente feito mais exames de saúde, etc. Esses fatores de “confusão”, se não fossem igualmente distribuídos entre os dois grupos de mulheres, poderiam ter contribuído para a menor mortalidade observada entre as usuárias de terapia hormonal na pós-menopausa. Fatores de confusão é uma das muitas causas de viés que devem ser levadas em conta ao analisar os resultados de tais estudos [3].
Outra possibilidade é que essa associação estatística seja simplesmente o resultado do acaso (a).
Mais adiante, no início dos anos 2000, um ensaio clínico maior, randomizado, comparativo, duplo-cego, chamado Women’s Health Initiative (WHI) refutou os resultados desse estudo: ele mostrou que a incidência de eventos cardiovasculares era maior em mulheres que usavam terapia hormonal na pós-menopausa [5].
Estabelecer um vínculo causal: ensaios clínicos. Um ensaio clínico é um estudo experimental no qual os efeitos de uma intervenção terapêutica são observados com o objetivo principal de avaliar e quantificar sua eficácia clínica [6].
Por tanto, um estudo clínico é um experimento científico realizado para confirmar a hipótese predefinida de que existe uma relação causal entre uma intervenção (por exemplo, a administração de um tratamento) e o estado de saúde do paciente enquanto recebe a intervenção ou depois dela. Se a intervenção for um tratamento, o experimento consiste, por exemplo, em administrar o tratamento do estudo a um grupo de pacientes e o tratamento padrão a outro grupo de pacientes inscritos no mesmo ensaio clínico. Se não houver um tratamento de referência, o tratamento em estudo é comparado a um placebo ou a nenhum tratamento [6].
Se a comparação for feita com um grupo de pacientes que foi formado de forma diferente, como pacientes inscritos em outro ensaio clínico, ela estará sujeita ao mesmo tipo de viés que um estudo observacional. Isso se aplica, por exemplo, à comparação entre grupos de pacientes que parecem ter características semelhantes, mas que foram monitorados em instituições diferentes ou com anos de diferença. Salvo algumas raras exceções, as comparações só são conclusivas se forem diretas e entre pacientes inscritos no mesmo ensaio clínico (b).
Comparação direta para melhor avaliação
Na década de 1950, cirurgiões em Parma e na Filadélfia propuseram tratar a angina de peito ligando as artérias mamárias internas, uma cirurgia realizada sob anestesia local. Mais da metade dos pacientes relatou uma melhora acentuada nos sintomas alguns dias ou semanas após o procedimento. Em 1959 e 1960, dois ensaios clínicos randomizados compararam a ligadura das artérias mamárias internas com a cirurgia simulada. A melhora clínica (em alguns casos dramática) foi tão comum no grupo da cirurgia simulada quanto no grupo da ligadura.
Com essa descoberta, concluiu-se que a ligadura das artérias mamárias internas não tinha eficácia inerente [7].
No começo de 2020, uma equipe de Marselha (França) relatou resultados clínicos positivos em pacientes com covid-19 que haviam sido tratados com hidroxicloroquina [8]. Nos meses seguintes, vários ensaios clínicos comparativos estabeleceram de forma consistente que a progressão da covid-19, independentemente de ser inicialmente leve ou grave, é a mesma para pacientes tratados com hidroxicloroquina e para aqueles tratados com placebo [9].
Esses exemplos ilustram o risco de concluir erroneamente que um tratamento é eficaz quando ele não foi diretamente comparado com o tratamento de referência, um placebo ou nenhum tratamento.
Em um estudo clínico comparativo, os pacientes geralmente são divididos em dois grupos e monitorados simultaneamente (c
0. Os participantes do grupo de “intervenção” recebem o tratamento do estudo. Os participantes do outro grupo, o grupo “controle”, recebem o tratamento comumente usado para tratar o problema ou, se não houver nenhum, um placebo ou nenhum tratamento (d) [6]. No final do estudo clínico, o estado de saúde dos participantes do grupo de intervenção é comparado ao do grupo de controle. No entanto, para obter evidências de alta qualidade, é melhor garantir que, no momento da inscrição, a saúde dos participantes nos dois grupos seja a mais semelhante possível e que, antes do início do ensaio clínico, eles tenham características semelhantes: esse é o objetivo da randomização.
Randomização para garantir que os grupos sejam idênticos, exceto pelo tratamento que recebem
Para garantir que as diferenças observadas entre os grupos de intervenção e controle em um ensaio clínico sejam devidas ao tratamento em estudo, é essencial que não haja outra explicação. Isso é obtido por meio da formação de grupos com as mesmas características antes do início do estudo [6].
A randomização significa que um processo aleatório, semelhante ao lançamento de uma moeda, é usado para designar cada participante do estudo clínico para o grupo que receberá o tratamento experimental ou para o grupo de controle. É o método mais simples e confiável para garantir que, exceto pelo tratamento que receberão, os participantes inscritos terão as mesmas características antes do início do ensaio clínico. Quanto mais participantes forem incluídos no estudo, maior será a probabilidade de a randomização produzir grupos com prognóstico semelhante [6].
A randomização também evita a possibilidade de que o tratamento atribuído a cada paciente seja influenciado, consciente ou inconscientemente, pela presença ou ausência de características que possam afetar o curso da doença, como idade, estado de saúde ou gravidade da condição que está sendo tratada.
Sendo assim, a randomização também é um pré-requisito para a significância estatística (e) [6]. A descrição das características do paciente no momento da atribuição do grupo serve para confirmar, com base em algumas características importantes e em fatores de confusão prováveis ou confirmados, que o acaso não gerou diferenças entre os grupos que poderiam alterar os resultados do estudo.
É essencial garantir que, durante todo o ensaio clínico, as intervenções que estão sendo comparadas sejam os únicos fatores que poderiam contribuir para as diferenças nos efeitos observados em cada grupo. Esse é o objetivo do duplo cegamento: após a randomização, ele evita fatores que possam afetar um grupo mais do que o outro [6].
Ocultamento com duplo cegamento para minimizar o viés e a subjetividade
O objetivo do duplo cegamento é evitar que ocorram diferenças entre os grupos (além do tratamento recebido) durante o estudo clínico, e também evitar o viés nos resultados. Duplo cegamento significa que nem os pacientes nem os profissionais de saúde sabem qual tratamento cada participante recebeu até que o estudo clínico e a análise de seus resultados sejam concluídos.
O tratamento recebido é ocultado dos pacientes para evitar que eles modifiquem seus comportamentos relacionados à saúde ou interpretem suas experiências com base em seus conhecimentos ou crenças sobre o tratamento em estudo. Por exemplo, sem cegamento os pacientes que sabem que não receberam o tratamento em avaliação para prevenir eventos cardiovasculares provavelmente estarão mais inclinados a se exercitar ou parar de fumar.
Os profissionais de saúde não sabem se o participante está recebendo o tratamento para evitar que essa informação influencie, consciente ou inconscientemente, suas decisões sobre o acompanhamento do paciente ou a introdução de outros tratamentos. Por exemplo, quando não há cegamento e o médico sabe se um paciente está ou não recebendo o tratamento experimental, essa informação poderia induzi-lo a usar mais ou menos tratamentos adicionais ou a monitorar o paciente com mais ou menos cuidado.
Por fim, o tratamento recebido é ocultado dos avaliadores para evitar que essa informação influencie sua avaliação. Por exemplo, se eles souberem que um paciente recebeu tratamento sob avaliação para prevenção cardiovascular, isso poderia levá-los a atribuir erroneamente a morte de um paciente a uma causa não cardiovascular.
Selecionar critérios que sejam importantes para os pacientes.
A evidência de eficácia em um estudo clínico randomizado, comparativo e duplo-cego não prova necessariamente que o tratamento é benéfico. Também é necessário garantir que a eficácia demonstrada corresponda a uma melhora real para os pacientes [1].
Critérios de avaliação substitutos: raramente são úteis para os pacientes. Às vezes, a eficácia potencial de um tratamento é avaliada com base em critérios não clínicos, que não constituem um benefício real para os pacientes. Quando se presume que um critério esteja associado à melhora clínica, ele é chamado de critério substituto. Os exemplos incluem concentrações de colesterol sérico, pressão arterial, níveis de hemoglobina glicosilada no sangue (HbA1c), extrassístole ventricular em um eletrocardiograma, densidade mineral óssea ou evidência radiográfica de fraturas vertebrais assintomáticas. Os critérios clínicos reais, como morte, desconforto respiratório, distúrbios visuais associados à retinopatia diabética, fraturas ósseas sintomáticas e desconforto ou incapacidade que os pacientes possam sentir em suas vidas diárias são mais úteis para medir a melhora ou a deterioração da saúde de um paciente [1].
Demonstrar que um tratamento tem um efeito positivo em um critério indireto não prova que essa melhora se aplica aos critérios clínicos que são importantes para os pacientes. Por exemplo, demonstrou-se que o clofibrato reduz o colesterol sérico, mas aumenta a mortalidade; demonstrou-se que a rosiglitazona reduz a HbA1c, mas aumenta o risco de insuficiência cardíaca; demonstrou-se que o flúor aumenta a densidade óssea, mas aumenta o risco de fraturas; e demonstrou-se que a flecainida reduz a taxa de extrassístole ventricular após infarto do miocárdio, mas aumenta o risco de morte súbita [10-14].
Às vezes, é razoável usar um critério substituto que se relaciona intimamente com o curso clínico de uma doença em vez de critérios clínicos. O uso da carga viral do HIV como um critério substituto ao avaliar a terapia antirretroviral é um exemplo disso [1].
Na prática: os estudos clínicos randomizados, comparativos e duplo-cegos continuam sendo a melhor ferramenta de avaliação, mas têm algumas limitações
Os estudos clínicos randomizados, comparativos e duplo-cegos são a ferramenta de avaliação mais robusta para demonstrar a eficácia potencial de um tratamento. Entretanto, a demonstração de um efeito em um critério clinicamente relevante em um ensaio clínico randomizado, comparativo e duplo-cego não é suficiente para demonstrar a eficácia real em pacientes. Também é necessário que não existam falhas no desenho do estudo clínico, na sua execução ou na sua interpretação, para que seus resultados não sejam tendenciosos. E, como em qualquer ciência baseada em experimentação, é importante garantir que os resultados possam ser reproduzidos, ou seja, confirmar os resultados em pelo menos um outro ensaio clínico realizado por outra equipe.
Mesmo sem falhas metodológicas, um ensaio clínico comparativo, randomizado e duplo-cego tem escopo limitado: quanto mais diferentes forem as características dos pacientes e dos participantes de um ensaio clínico, menor será a probabilidade de esses resultados serem traduzidos para a prática clínica.
“Os médicos costumam se gabar de que podem curar todos os seus pacientes com algum tratamento que usam (…) Poderíamos estar sujeitos todos os dias aos maiores enganos sobre o benefício de um tratamento se não tivéssemos a possibilidade de acesso a um experimento comparativo. Gostaria de lembrar apenas um exemplo recente sobre o tratamento da pneumonia. O experimento comparativo mostrou, de fato, que o tratamento da pneumonia com sangria, que se pensava ser o mais eficaz, é uma mera ilusão terapêutica”. Claude Bernard (trecho da tradução para o inglês de Henry Copley Greene do livro Introduction à l’Étude de la Médecine Expérimentale [Introdução ao Estudo da Medicina Experimental”, 1865]).
Referências selecionadas da revisão bibliográfica da Prescrire