Recursos Humanos


Ferramentas de RH

Matemática e Estatística Aplicada a Administração de Pessoal/RH

 

Distribuição de Freqüência

A estatística trata de fenômenos sobre os quais dispomos de numerosos dados. No entanto, para captá-los, necessitamos de métodos que permitam organizar e condensar as informações disponíveis.

 

Dados brutos:

O Gerente de Pessoal de uma empresa está interessado em verificar se o número de filhos por funcionário da fábrica tem algum comportamento característico do ponto de vista estatístico. Isto porque a empresa paga o salário-família, de acordo com o número de filhos que o funcionário possui.

Nota: O salário-família não constitui propriamente um desembolso de caixa da empresa, como você já sabe. Ele preocupa mais no sentido de que se trata de uma antecipação de um recolhimento futuro ao INSS.

Vamos admitir que a empresa conte com 120 funcionários entre casados e solteiros. Para iniciar a sua análise, o Gerente consulta o arquivo das fichas de Salário-Família dos funcionários, de onde extrai os seguintes dados:

NÚMERO DE FILHOS DE FUNCIONÁRIOS

0

1

0

2

3

0

0

4

0

0

3

0

2

0

2

3

0

3

0

2

0

1

4

1

0

0

5

0

0

1

0

3

0

2

0

2

5

2

0

3

0

0

0

1

2

4

0

3

1

5

4

0

4

2

0

7

2

0

0

3

1

0

5

3

0

3

3

0

6

4

0

2

5

2

3

4

0

2

5

2

1

3

4

0

2

0

6

2

0

4

3

1

4

0

5

4

0

4

3

5

0

4

5

3

2

2

3

6

1

3

6

2

0

0

1

7

8

2

3

4

Cada numero da tabela representa a quantidade de filhos de cada funcionários. Nela podemos localizar, cm certa facilidade, o menor número (zero) e o maior (8).

Pouca coisa além disso pode ser deduzida diretamente da tabela. Ela contém o que denominamos DADOS BRUTOS, isto é, os resultados obtidos pela simples coleta de informações numéricas a respeito do fenômeno, sem nenhum tratamento.

Uma primeira tarefa consiste, pois, em condensar os dados brutos de forma a torná-las mais expressivos.

 

Distribuição de frequências - Dados não aggrupados em classes:

Há números que aparecem repetidas vezes no quadro acima: o número 5 aparece nove vezes; o 6, quatro vezes, etc.

 

Organização de dados:

Podemos organizar os dados dispondo-os numa tabela: de um lado, o número de filhos em ordem crescente (ou decrescente); no meio, uma coluna para efetuar a contagem; do outro lado, colocamos o número de funcionários correspondente aos valores constantes da primeira coluna, isto é, a freqüência daqueles valores.

Para elaborar esta tabela, começamos pela coluna relativa ao número de filhos, preenchendo-a em ordem crescente (desde zero até 8 filhos). Com isso, relacionamos todos os casos possíveis.

Agora, anota-se as ocorrências na coluna de contagem. Em seguida, ela deve ser expressa numericamente na última coluna, referente à FREQÜÊNCIA, que desta maneira, conterá o número de funcionários que possuem um certo número de filhos. Veja como ficou o quadro:

NÚMERO DE FILHOS DE EMPREGADOS DA EMPRESA

Nº DE FILHOS

FREQÜÊNCIA

0

40

1

11

2

20

3

19

4

14

5

9

6

4

7

2

8

1

TOTAL =>

120

Agora, a apreensão do comportamento do fenômeno é mais fácil. Podemos notar que 40 dos 120 funcionários não tem filhos; 11 possuem um único; 20 possuem 2, etc. Não se considerando o caso dos que não possuem filhos (caso em que a maioria dos solteiros está incluída), as situações mais freqüentes são as dos funcionários que tem 2 ou 3 filhos.

Além desse aspecto de visualização de fenômenos, a elaboração de tabelas de freqüência vai simplificar os métodos que exporemos daqui para frente.

FREQÜÊNCIA é, então, o número de vezes em que os dados aparecem. Este tipo de sintetização de dados brutos é denominado DISTRIBUIÇÃO DE FREQÜÊNCIAS.

 

Variável Discreta:

As quantidades relacionadas na coluna da esquerda, que no caso, representam o número de filhos dos funcionários, recebem o nome de VARIÁVEL. Trata-se, portanto, da expressão quantitativa do fenômeno e poderia ser definida como uma quantidade que assume mais de um valor numérico. Em nosso exemplo, a VARIÁVEL (nº de filhos) assume, sucessivamente, os valores 0, 1, 2, 3, 4, 5, 6, 7 e 8. Podemos dizer, então, que, associada a cada valor da variável, temos uma freqüência. Em nosso caso, a freqüência de cada um dos particulares valores assumidos pela variável é, respectivamente, 40, 11, 20 19, 14, 9, 4, 2 e 1.

Apenas para simplificar as futuras notações, designaremos a variável por "x" e as respectivas freqüências por "f".

Com isso, podemos repetir o quadro anterior e resumiremos da seguinte maneira:

VARIÁVEL

X

0

1

2

3

4

5

6

7

8

TOTAL

FREQÜÊNCIA

f

40

11

20

19

14

9

4

2

1

120

Portanto, a freqüência (f) de funcionários com 5 filhos (x) é igual a 9.

Quando queremos nos referir a uma valor genérico desses conjuntos de valores sem, entretanto, precisar exatamente qual deles, usaremos os seguintes símbolos: Xi (x índice i) e Fi (f índice i), cujos índices indicarão a ordem dos valores de "x" e "f" considerados.

Ao atribuirmos número aos índices estaremos especificando qual o que nos interessa no momento. Assim: X5 e F5 nos fazem considerar imediatamente o quinto par de valores, em que x = 4 e f = 14.

 

Frequência Total:

O total de observações, isto é, o total de funcionários pesquisados, é indicado pela letra N. N é portanto, igual à soma de todos os Fi. Traduzindo isto em símbolos:

         n
N = å fi = f1 + f2 + f3 + ... + fn
        i = 1

 

                               n
onde o símbolo å fi deve ser lido como soma de "fi", quando "i" varia de 1 até "n".
                              i=1

Representa, portanto a soma de "n" freqüências sucessivas.

Neste exemplo, em que a variável considerada era o nº de filhos, à mesma se diz uma variável DISCRETA ou descontínua. Note-se que nenhum funcionário da empresa pode ter meio filho ou, então, um filho e meio.

Em outras palavras, a variável considerada não assume todos os valores de um dado intervalo, porque só pode, pela natureza do fenômeno, ser um número inteiro não negativo. O mesmo já não ocorre no próximo exemplo.

 

Distribuição de frequências - Dados agrupados em classes:

Suponhamos, agora, uma máquina que pesa e ensaca, automaticamente, um produto qualquer, digamos, arroz, em sacos de 3 quilos. Nesta operação, o peso efetivo de cada saco, em geral, não coincide exatamente com o dos 3 quilos previstos, variando em torno disso de forma aleatória.

Vamos admitir que queremos verificar como se comporta o peso real dos sacos embalados pela máquina, a fim de saber se ela apresenta defeito na pesagem ou se as diferenças, em relação aos 3 quilos previstos, se encontram dentro de níveis razoáveis.

Para tanto, pesamos, em uma balança de precisão, 90 dos sacos embalados pela máquina, tomados ao acaso. Sejam os seguintes os resultados dessa repesagem:

 

Peso real da amostra de sacos embalados:

3,13

2,98

2,98

2,94

2,90

3,03

3,00

2,96

3,02

3,18

2,88

2,90

2,90

3,00

3,05

2,85

3,05

2,99

3,20

3,10

2,94

2,95

2,75

2,98

3,00

3,00

3,15

3,08

2,90

3,08

2,94

3,05

3,11

2,93

3,04

3,18

3,16

2,80

3,04

2,89

2,85

3,13

3,04

2,89

2,95

3,12

2,99

2,97

2,99

2,86

2,96

2,97

2,96

2,95

3,13

3,05

2,90

2,99

2,89

2,97

3,06

3,02

2,98

3,20

3,01

2,88

2,89

2,90

3,07

3,15

2,87

2,98

3,18

2,95

2,96

2,94

3,10

3,00

3,01

2,95

3,18

3,24

2,98

2,95

2,97

3,00

2,95

2,98

2,94

3,04

Nota: este exemplo é meramente hipotético.

Os dados, assim como se encontram, tal como no exemplo anterior, não nos permitem nenhuma conclusão.

Nesse caso, contudo, não é conveniente procedermos como no caso anterior, isto é, não adiantaria relacionar os pesos em ordem crescente e contar quantos apresentam os mesmos pesos, pois, a nossa lista teria que começar com 2,75kg (o menor valor) e, aumentando de 0,01 a cada vez, terminaria com 3,24kg (o maior valor da tabela). Com isso, a tabela de freqüências teria 49 valores e seria, ainda, muito extensa.

Ao invés disso, vamos considerar intervalos para os pesos e contar quantas observações se encaixam dentro de cada intervalo.

 

Sacos embalados segundo seu peso efetivo:

CLASSES

FREQÜÊNCIA

PONTO MÉDIO

2,75 a 2,80

1

2,775

2,80 a 2,85

1

2,825

2,85 a 2,90

10

2,875

2,90 a 2,95

12

2,925

2,95 a 3,00

26

2,975

3,00 a 3,05

15

3,025

3,05 a 3,10

8

3,075

3,10 a 3,15

7

3,125

3,15 a 3,20

7

3,175

3,20 a 3,25

3

3,225

TOTAL =>

N = 90

 

Em outras palavras, agrupamos os dados em classes ou grupos, segundo seu peso. Este procedimento é usado quando a variável for discreta mas o número de valores muito grande; ou quando a variável for contínua, como neste caso.

A variável é dita contínua quando pode assumir todo e qualquer valor intermediário dentro de um intervalo.

Já tínhamos visto que freqüência é o número de vezes que um certo valor aparece. Neste exemplo, temos à considerar os seguintes presentes na distribuição:

 

Classe de frequência:

Corresponde a cada uma das subdivisões da variável. Assim no exemplo, a primeira classe de freqüências vai de 2,75kg a 2,80kg; a segunda, de 2,80kg a 2,85kg e assim sucessivamente, num total de 10 classes.

 

Limites das classes:

São os valores extremos de cada classe. O símbolo |_____ , não utilizada no exemplo anterior, porém substituída por "a", significa que na classe estão incluídos os valores à esquerda do mesmo e excluídos os valores da direita.

Por exemplo, a especificação 2,85 |____ 2,90 indica que nessa classe foram computados os sacos com exatamente 2,85kg e todos os sacos com peso superior a 2,85 até 2,89, não estando computados, no entanto, os sacos com exatamente 2,90kg que são contados na classe seguinte.

LIMITE INFERIOR:

O valor à esquerda, 2,85kg, o menor valor da classe se diz limite inferior da classe.

LIMITE SUPERIOR:

O valor à direita 2,90kg é chamado LIMITE SUPERIOR.

Há outras formas de se indicar as classes. Como exemplo citado, podemos utilizar a seguinte notação:

2,75 a 2,79
2,80 a 2,84
2,85 a 2,89, etc.

Esse modo de definir as classes é muito comum. Nesse caso, os limites reais das classes são obtidos somando-se o limite superior de cada classe ao limite inferior da classe seguinte e dividindo-se por dois. Assim, a classe de 2,85 a 2,89 teria como limites reais 2,845 a 2,895, respectivamente, como limites inferior e superior, estando computados nela todos os valores contidos entre os limites reais.

 

Amplitude das classes:

É o comprimento de cada classe e resulta da diferença entre os limites inferiores de classes contínuas. Assim, a amplitude da classe de 2,85 |____ 2,90 pode ser determinada diminuindo-se o limite inferior 2,85 do limite inferior da classe subsequente 2,90 |____ 2,95, que é 2,90.

Devemos, sempre que possível, adotar classes de amplitudes iguais.

 

Ponto Médio da Classe:

Quando agrupamos as observações para efetuar a contagem, como no nosso exemplo, é preciso adotar um elemento que represente cada classe. O valor representativo é o seu PONTO MÉDIO (ou ponto CENTRAL).

Para determiná-lo deve-se somar a metade da amplitude de classe ao seu limite inferior.

Assim, a classe 2,95 |____ 3,00 tem como ponto médio que a representa, o valor 2,975, obtido acrescentando-se ao seu limite inferior - 2,95 - a metade da amplitude.

Portanto, PONTO MÉDIO =

2,95 + (3,00 - 2,95) : 2 = 2,95 + 0,025 = 2,975

limite inferior da classe

limite inferior da classe subsequente

limite inferior da classe

 

Amplitude Total:

Refere-se à diferença entre o maior e o menor valor d conjunto de dados. No exemplo, o menor valor é 2,75 e o maior é 3,24, e, portanto a amplitude total, neste caso é de 3,24 - 2,75 = 0,49.

 

Como construir a distribuição de frequências:

Para elaborarmos a tabela de freqüências a partir dos dados brutos, devemos proceder da seguinte maneira:

É conveniente adota amplitudes que permitam fixar o ponto médio das classes de forma fácil e inequívoca.

Suponha por exemplo, que numa dada distribuição a variável assumisse os valores extremos 10 e 61.

A amplitude total seria 51. Adotando-se 10 classes, a amplitude das classes seria de 51/10 = 5.1, Ter-se-iam, então, as seguintes classes de freqüência:

CLASSES

PONTO MÉDIO

10,0 |____ 15,1

12,55

15,1 |____ 20,2

17,65

20,2 |____ 25,3

22,75

Esses números são muito trabalhosos e conviria alterar o número de classes para 13, por exemplo. Assim: Amplitude = 51/13 = 3,923 @ 4.

Neste caso, usando o valor inteiro mais próximo do quociente, teríamos:

CLASSES

PONTO MÉDIO

10 |___ 14

12

14 |___ 18

16

18 |___ 22

20

Estes valores são muito mais fáceis de operação.

Em seguida, só resta estabelecer as CLASSES DE FREQÜÊNCIA e proceder à contagem.

 

Frequências Acumuladas:

Até agora, consideramos as freqüências simples, isto é, o número de vezes que um determinado valor ou classe aparece. Podemos, contudo, estar interessados em dizer quantas observações se encontram abaixo ou acima de um certo valor.

Para atender esta pergunta, podemos agregar mais duas colunas à tabela anterior do nosso exemplo, que ficaria como vemos no quadro seguinte:

CLASSES

PONTO MÉDIO CLASSE

FREQÜÊNCIA SIMPLES

FREQÜÊNCIAS ACUMULADAS

ABAIXO DE

ACIMA DE

2,75 |___ 2,80

2,775

1

1

90

2,80 |___ 2,85

2,825

1

2

89

2,85 |___ 2,90

2,875

10

12

88

2,90 |___ 2,95

2,925

12

24

78

2,95 |___ 3,00

2,975

26

50

66

3,00 |___ 3,05

3,025

15

65

40

3,05 |___ 3,10

3,075

8

73

25

3,10 |___ 3,15

3,125

7

80

17

3,15 |___ 3,20

3,175

7

87

10

3,20 |___ 3,25

3,225

3

90

3

 

TOTAL =>

n = 90

   

A freqüência acumulada "abaixo" de uma determinada classe é obtida somando-se as freqüências simples de todas as classes anteriores a ela e mais a da própria classe.

Inversamente, a FREQÜÊNCIA ACUMULADA "acima" de uma determinada classe é calculada somando-se as freqüências simples de todas as classes posteriores a ela e mais a da própria classe.

Olhando-se a coluna das freqüências acumuladas "abaixo de" podemos imediatamente verificar, por exemplo, que 50 dos 90 sacos pesaram menos que 3,00 kg. E pela coluna das freqüências acumuladas "acima de", podemos constatar que 88 sacos pesaram mais do que 2,85 kg, na repesagem a que forma submetidos os 90 sacos.

 

Frequências Relativas:

Poderíamos ainda estar interessados em saber que percentagem do total das observações corresponde a cada classe.

Para tanto, podemos calcular as FREQÜÊNCIAS RELATIVA de cada uma das classes, dividindo as suas respectivas freqüências pela freqüência total (soma de todas as freqüências), ou seja, pelo total "N" de observações.

Calculando as freqüências relativas, poderíamos completar o quadro seguinte:

CLASSES

PONTO MÉDIO

CLASSE

FREQÜÊNCIA SIMPLES

FREQÜÊNCIAS ACUMULADAS

ABSOLUTA

RELATIVA %

ABAIXO DE

ACIMA DE

ABSOLUTA

RELATIVA %

ABSOLUTA

RELATIVA %

2,75 |__ 2,80

2,775

1

1,1

1

1,1

90

100,0

2,80 |__ 2,85

2,825

1

1,1

2

2,2

89

98,9

2,85 |__ 2,90

2,875

10

11,1

12

13,3

88

97,8

2,90 |__ 2,95

2,925

12

13,3

24

26,6

78

86,7

2,95 |__ 3,00

2,975

26

28,9

50

55,5

66

73,4

3,00 |__ 3,05

3,025

15

16,7

65

72,2

40

44,5

3,05 |__ 3,10

3,075

8

(8,9)

73

(81,1)

25

(27,8)

3,10 |__ 3,15

3,125

7

7,8

80

88,9

17

18,9

3,15 |__ 3,20

3,175

7

7,8

87

96,7

10

11,1

3,20 |__ 3,25

3,225

3

3,3

90

100,0

3

3,3

 

TOTAIS =>

N = 90

100,0

       

Verifique as percentagens assinaladas com parêntesis na tabela. A primeira, nos informa que 8,9% dos sacos tiveram peso entre 3,05 kg e 3,10 kg; a segunda, que 81,1% dos sacos apresentaram peso inferior a 3,10 kg; e a terceira, que 27,8% dos sacos pesaram mais do que 3,05 kg.