Fechar

Amostragem: o que é e para que serve?

Por Renato Faria em 28 de outubro 2020
Geral

Tempo de leitura: 10 minutos

Você já ouviu falar em amostragem? Sabe qual a importância dela para realizar pesquisas de qualidade?

A amostragem é o processo que determina os elementos que serão selecionados de uma população estatísticas. Para realizar pesquisas de qualidade é importante selecionar as amostras mais fidedignas possíveis. 

Além disso, para o sucesso das pesquisas é preciso entender alguns conceitos como população, margem de erro, cálculo da amostra, entre outras. Mas fique tranquilo, vamos te explicar tudo sobre o assunto neste artigo. Vamos lá?

O que é amostragem?

Antes de começar é importante ter bem claro o conceito de amostragem. Ela é definida como o processo que seleciona um conjunto da população para fazer análises estatísticas e, a partir de então, estimar características populacionais no geral.

A amostragem é comumente usada por pesquisadores, pois através dela eles conseguem colher informações úteis sem precisar pesquisar toda a população—o que seria praticamente impossível, não é mesmo?  Além disso, é um método mais conveniente, cômodo e econômico.

Entendendo a amostragem na prática

entendendo a amostragem na prática

Grande parte dos artigos e blogs que você encontra na internet vai começar a discutir o tema de amostragem e cálculo de tamanho de amostra explicando termos como amostra, população, margem de erro, nível de confiança

Vamos, no entanto, tentar uma opção diferente: aqui iremos te mostrar o que pode e, muito provavelmente, vai dar errado quando você não se preocupa com todos esses conceitos relacionados a amostragem. 

E não se preocupe, também vamos te apresentar todos eles, mas queremos que você consiga entender onde cada um se aplica.

Vamos começar com uma pequena história sobre amostragem

Imagine que você tenha acesso a uma base absurdamente grande de clientes com dados cadastrais – digamos 10 milhões de clientes, e que você esteja interessado em fazer uma pesquisa para descobrir quem vai ser o vencedor de uma eleição com 2 candidatos. 

Agora imagine que você disparou a pesquisa para seus 10 milhões de clientes e que 2,4 milhões desses clientes retornaram com respostas. 

Qualquer que seja o tamanho da população onde você estiver fazendo essa pesquisa, a margem de erro com uma amostra com 2,4 milhões de pessoas sempre será melhor que 1%, não importando o nível de confiança que você definir. 

Agora imagine você reportar para a sociedade que o candidato A iria vencer a eleição com 57% dos votos contra 43% do candidato B e ainda por cima, você afirmar para seu público que você iria reportar esse resultado com margem de erro insignificante  quando na realidade o candidato B venceu a eleição com 62% dos votos.

Curioso? Uma busca na web sobre “The 1936 Literary Digest Poll” vai te ajudar a entender melhor o cenário que descrevemos aqui, mas quero chamar sua atenção para um ponto: dentre algumas falhas que essa pesquisa tinha, talvez a principal era que a amostra não era adequada e não representava a população alvo de verdade.  

Problemas com amostras para pesquisas on-line

No exemplo da “The 1936 Literary Digest Poll”, podemos ver algumas situações que acontecem com muita frequência quando estamos falando sobre pesquisas com indivíduos, e, mais ainda, quando essas pesquisas são conduzidas por canais on-line. 

A amostra é por conveniência, ou seja, os destinatários das pesquisas decidem se vão ou não estar na amostra. Na grande maioria das pesquisas on-line, não existe uma garantia de que os destinatários irão retornar, e hoje temos taxa de respostas variadas.

A pesquisa é disparada para um grupo de indivíduos e, com raras exceções, somente o tamanho da amostra é levado em consideração. A caracterização da população raramente é avaliada quando uma amostra é selecionada, e assim, extrapolar o resultado para a população apresenta grandes riscos.

Somente o fato de ter uma amostra “grande” não é suficiente para generalizar os resultados para toda a população. É necessário que ela seja aleatorizada para ser representativa o público.

E se não tivermos uma amostra “aleatorizada” e que não seja representativa da população real? Nenhuma generalização pode ser feita. Qualquer resultado é reportado somente para a amostra.

Quais as características de uma boa amostra?

amostragem boa amostra

Uma amostra ideal é uma versão reduzida da população de interesse, com as mesmas características da população original.

Mas o que isso significa?

Vamos supor que temos uma base de clientes, e que existem inúmeras características deles que temos acesso ( o estado, a idade, o gênero, o ticket médio, o número de compras, etc) e outras inúmeras que não temos acesso (como a classe social, outros fornecedores de quem ele consome, hábitos de consumo, etc)

A nossa amostra perfeita deveria levar em conta cada uma dessas características para selecionar um subconjunto mais representativo possível da população de clientes. 

Aqui você já percebe que o conceito de amostra “ideal” é inviável.  Ao selecionar quaisquer amostras não teremos a garantia que ela realmente representa o comportamento da nossa população em relação ao hábito de consumo, já que não temos acesso a essa informação.

Uma vez que não temos acesso a nossa amostra ideal, o que devemos procurar é uma amostra que represente nossa população de clientes em relação a um conjunto de características que sejam do nosso interesse. 

Mas, como assim?

Vamos deixar um pouco mais claro com um exemplo: suponha queremos estimar o NPS de todos os clientes.

Além disso,  queremos extrapolar ou generalizar o NPS estimado somente para o estado, a faixa etária e o gênero dos nossos consumidores– ou seja, queremos dar resposta do tipo “O NPS estimado de Minas Gerais é 65, variando entre 62 e 68, com 95% de confiança”. 

Assim, não precisamos nos preocupar com todas as características dos nosso público para generalizar a nossa estatística – no caso NPS, somente com aquelas que temos interesse. 

Aqui um ponto de muita atenção:  se você selecionar uma amostra com base em um conjunto de características e usar essa mesmo amostra para outro conjunto de características, nada garante que seus resultados vão ser assertivos e você corre um grande risco de ter uma estatística viciada.

Termos e definições de amostragem

Agora chegou a hora de entender um pouco mais sobre os termos falados. Afinal, não podemos pensar em amostragem sem entender o que é população, fontes de erros, entre outros conceitos não é mesmo?

Unidade observacional 

É a entidade onde as informações são obtidas ou avaliadas. Como estamos falando de pesquisas sobre experiência dos clientes, nossa unidade observacional é o cliente ou o indivíduo.

População

É o conjunto de todas as unidades observacionais possíveis. No nosso caso, seriam todos os clientes da nossa organização. 

População alvo 

É a população que nós queremos realmente estudar. Veja que aqui existe uma pequena diferença entre a população e a população alvo. 

Vamos imaginar uma empresa de varejo que atue no segmento on-line e físico e, neste caso, estamos interessados em estudar o comportamento dos clientes do segmento on-line. 

Aqui a população seria todos os clientes da organização e a população alvo seriam os clientes do varejo online. 

Amostra 

É um subconjunto da população alvo. 

Amostragem

É o processo ou método utilizado para selecionar a amostra. 

Unidade amostral

É um elemento que pode ser amostrado. 

Mas atenção, fique de olho no detalhe: suponha que sua organização atenda aos clientes de B2B, e não tenha uma lista de cada indivíduo de cada organização cliente, nesse caso, a unidade amostral é a organização cliente. 

Painel de Amostragem

É uma lista ou uma definição das unidades amostrais em que a amostra pode ser selecionada. 

No nosso caso, o nosso painel de amostragem pode ser a lista de clientes no CRM, a base de clientes num banco de dados, ou a lista de contatos que você mantém no Excel.

Fontes de Erro

É um conjunto de características que podem explicar a não assertividade dos resultados de uma pesquisa. 

Quais são as fontes de erro de amostragem?

Como já mencionamos, as fontes de erro são características da amostra, do processo de amostragem ou do processo de pesquisa que podem gerar valores não assertivos de uma dada medida. Para deixar ainda mais claro, veja esse exemplo:

“Você está interessado em estimar o nível de satisfação dos seus clientes com o processo de entrega da sua organização e, para isso, aplicou uma pesquisa on-line, com um grupo de 200 clientes, chegando a um CSAT médio de 3,5. 

Uma pergunta que você pode fazer é: o quanto esse valor representa fielmente a satisfação média de todos meus clientes? As fontes de erro são características que influenciam nesse resultado, ou seja, indicam o quão certo esse valor 3,5 representa o CSAT de todos os seus clientes. “

Elas acontecem devido a alguns fatores específicos. Veja só:

Margem de Erro

A margem de erro indica o quão preciso devem ser seus resultados. Você precisa responder algumas perguntas nesse momento: o quanto de precisão eu preciso? Pra que eu vou usar os resultados? Qual é o erro aceitável? 

A  maioria das pesquisas que você encontrar irão reportar a margem de erro, quase sempre como um percentual – a pesquisa apresenta margem e erro de 3 pontos percentuais para mais ou para menos.

Em alguns casos, no entanto, a margem de erro aparece contextualizada – em 95 resultados de cada 100 pesquisas realizadas com uma amostra semelhante a essa, o valor do NPS não apresentará valor diferente de 3% para mais ou para menos do valor real se você avaliasse todos os seus clientes.

Vício de Não-Respondentes

Aqui temos a situação onde selecionamos uma amostra representativa, mas devido aos destinatários se recusarem a responder, a amostra de respondentes se torna muito diferente daquela ideal, gerando assim uma amostra viciada.

Vício de Respondentes

Esse é o vício onde os participantes de uma pesquisa respondem a pesquisa de forma não precisa ou falsa, e uma amostra mal selecionada pode ser composta por um conjunto muito grande de indivíduos que têm características que levam a esse vício. 

Redação das perguntas

Esse é um dos erros mais interessante de todos, e o mais difícil de ser relacionado ao processo de amostragem. 

De maneira bem simplificada, esse erro está relacionado a forma como a pesquisa é construída – como o texto do item, as opções, cores, formatação, etc.

E aqui a relação com a seleção da amostra é muito sutil, mas tente imaginar da seguinte maneira: você conseguiria fazer uma pergunta direcionando a resposta de um certo grupo de clientes?

Imagine uma pesquisa avaliando a métrica CES – Customer Effort Score  que  avalia a relação de esforço do seu cliente com algum processo na jornada do cliente. Veja o exemplo a seguir:

Item 1: A <Empresa X> tornou fácil para mim o processo de instalação do Software ABC.

Item 2: A <Empresa X> tornou fácil o processo de instalação do Software ABC.  

A única diferença nos dois itens é a inclusão do termo “para mim”. Curioso? Procure por distorções cognitivas na web para entender melhor a influência do “para mim” no contexto desse item. 

Mas de maneira bem resumida, o “para mim” pode levar o respondente a ver o esforço na instalação no software como um culpa sua, individual e não realmente do processo de esforço dessa instalação ser complexo. 

Cálculo do tamanho da amostra

Na grande maioria da vezes, quando você encontrar uma pesquisa que reportou um resultado muito fora da realidade, o motivo dessa discrepância entre a realidade e o que foi predito reside no fato da amostra utilizada não ser representativa da população.

Uma maneira de garantir que sua amostra seja representativa é utilizar esquemas de amostras probabilísticas. 

Uma maneira simples de entender o conceito de amostragem probabilística é considerar que cada unidade observacional tem uma probabilidade (ou chance) conhecida de ser selecionada na amostra final. 

Agora vamos entender um pouco melhor os tipos de amostragem:

Amostra Aleatória simples

É o tipo mais simples de amostragem probabilística e cada unidade observacional, ou cliente no nosso caso, tem a mesma chance de ser selecionado para participar da amostra e, no final, da pesquisa. 

Amostra estratificada

Aqui a população alvo é dividida em subgrupos de interesse, por exemplo classe social ou estado, e uma amostra aleatória simples é realizada dentro de cada estrato. 

Amostra por conglomerados

As unidades amostrais são agrupadas em conglomerados maiores e então esses estes são selecionados usando amostra aleatória simples. 

Talvez esse seja o método menos intuitivo no universo da Experiência do Cliente, mas um exemplo seria sua organização possuir um serviço que é fornecido para um grande número de outras empresas e você não ter em mãos a lista de usuários de cada uma delas.

Deste modo, você selecionaria aleatoriamente um subconjunto de empresas e todos os usuários de cada uma delas  iria compor a amostra. 

Amostra sistemática

Aqui você teria uma esquema de seleção da amostra predeterminado. Por exemplo, você teria uma lista de todos os seus clientes e um ponto de partida, e sistematicamente selecionaria o i-ésimo cliente a partir desse ponto de partida. 

Muito interessante não é? Mas de maneira prática, pensando no seu cenário, você consegue encaixar suas amostras no processo de avaliação da experiência do cliente em algum desses tipos de amostragem? 

Com raríssimas exceções a pesquisa on-line utiliza os métodos de amostragem não probabilística. 

Amostra por conveniência

Simplificadamente, a amostra é construída por aqueles indivíduos que estão disponíveis para serem analisados. Nenhum método de seleção é aplicado aos indivíduos e todos os que responderem serão utilizados nas análises. 

Esse tipo de amostragem tem alguns problemas conhecidos e, o principal deles,  é a não representatividade da população alvo. 

É fácil ver que uma vez que analisamos as respostas que são coletadas e a pesquisa é disparada para todos os clientes – ou para um grande grupo deles sem preocupação com qualquer método de seleção – podemos ter uma amostra viciada.

Um exemplo: nossa população de clientes pode ser composta de 80% de clientes da classe C e 20% da classe AB, mas devido a restrições tecnológicas, nossa amostra será composta por 80% da classe AB e 20% da classe C. Você teria coragem de generalizar a experiência do cliente para todo sua população com essa amostra?

Existem maneiras de tratar essa situação, quando bem planejadas, antes de você executar a pesquisa. Mas lembre-se, esse tratamento não atua para estancar o sangue, ele atua como solução pensada e planejada para corrigir esse problema. 

Quando estamos avaliando métricas de experiência, como o NPS, o CES ou CSAT,  frequentemente estamos interessados somente nas medidas desses indicadores. Diferentemente de pesquisas em outras áreas, onde o interesse pode estar em várias medidas diferentes. 

Assim, para definir o tamanho da amostra necessária para nosso estudo, normalmente focamos nosso objetivo em uma ou duas respostas principais, ou itens de maior interesse na pesquisa, e essa informação é utilizada para estimar o tamanho da amostra necessário. 

Lembre-se das perguntas que devem direcionar a estimativa do tamanho da sua amostra: quanto de precisão eu preciso, pra que eu vou usar os resultados e qual é o erro aceitável. 

Amostragem: fundamental para uma pesquisa de qualidade

Agora você já sabe um pouco mais sobre amostragem e como selecionar a amostra ideal para sua pesquisa, não é mesmo?

E se você gostou deste assunto conta aí nos comentários para gente e fique de olho no nosso blog, sempre tem um conteúdo interessante para você

Ah, não esqueça de nos seguir nas redes sociais Instagram, LinkedIn e Facebook). 

Ainda não conhece a Track.co? Então acesse o nosso site. Te convidamos a saber mais sobre a nossa nova plataforma, a mais completa e atualizada em termos de métricas Experiência do Cliente

vamos conversar? hello@track.co

Tudo sobre Experiência do Consumidor, métricas, pesquisa de satisfação e sobre as tecnologias mais inovadoras de CX.




    Artigos relacionados

    As marcas que utilizam o NPS: o que…

    28 de outubro 2020 Geral

    Como definir metas para indicadores de Customer Experience

    28 de outubro 2020 Geral

    Processamento de Linguagem Natural: como a Track utiliza…

    28 de outubro 2020 Geral