Ficheiro:Graphique Zipf pour Ulysses.png

Graphique_Zipf_pour_Ulysses.png (640 × 480 píxeis, tamanho: 4 kB, tipo MIME: image/png)

Descrição do ficheiro

Descrição
English: log/log graph of rank/frequency of words in "Ulysses" by James Joyce (Zipf Law)
Français : graphique log/log de la fréquence des mots par leur rang dans "Ulysses" de James Joyce (Loi de Zipf)
Data
Origem Obra do próprio
Autor User: Xofc

Method

Using "Ulysses" by James Joyce found on http://www.gutenberg.org/etext/4300

PERL code:

#!/usr/bin/perl
while ($line = <STDIN>)
        {
        $line =~ tr/[A-Z]/[a-z]/;
        @WORDS_IN_LINE = split /\W+/, $line;
        for (@WORDS_IN_LINE)
                {
                $word_freq{$_}++
                }
        }
sub numeriquement { $b <=> $a; }
foreach $freq (sort numeriquement values %word_freq)
        {
        printf("%-5d %d\n", $i++, $freq);
        }

Or 'bash' code :

cat 4300-8.txt
|tr [A-Z] [a-z]|sed 's/[^a-z]/\n/g'|awk '/[a-z]/{print $1;}'|sort|uniq -c|awk '{print $1;}'|sort -rn|pr -n -t
# |tr "[A-Z]" "[a-z]"            # convert to lower cases
# |sed 's/[^a-z]/\n/g'       # one word per line : convert every non alpha by carriage_return
# |awk '/[a-z]/{print $1;}'  # forget empty lines
# |sort|uniq -c              # sort and count
# |awk '{print $1;}'         # just remember the count (forget the word)
# |sort -rn                  # sort numerically, descending order
# |pr -n -t                  # put a line number (=rank)
 
Este(a) PNG gráfico foi criado com o Gnuplot por n.

Licenciamento

Eu, titular dos direitos de autor desta obra, publico-a com as seguintes licenças:
GNU head É concedida permissão para copiar, distribuir e/ou modificar este documento nos termos da Licença de Documentação Livre GNU, versão 1.2 ou qualquer versão posterior publicada pela Free Software Foundation; sem Secções Invariantes, sem textos de Capa e sem textos de Contra-Capa. É incluída uma cópia da licença na secção intitulada GNU Free Documentation License.
w:pt:Creative Commons
atribuição partilha nos termos da mesma licença
This file is licensed under the Creative Commons Attribution-Share Alike 4.0 International, 3.0 Unported, 2.5 Generic, 2.0 Generic and 1.0 Generic license.
Pode:
  • partilhar – copiar, distribuir e transmitir a obra
  • recombinar – criar obras derivadas
De acordo com as seguintes condições:
  • atribuição – Tem de fazer a devida atribuição da autoria, fornecer uma hiperligação para a licença e indicar se foram feitas alterações. Pode fazê-lo de qualquer forma razoável, mas não de forma a sugerir que o licenciador o apoia ou subscreve o seu uso da obra.
  • partilha nos termos da mesma licença – Se remisturar, transformar ou ampliar o conteúdo, tem de distribuir as suas contribuições com a mesma licença ou uma licença compatível com a original.
Pode escolher a licença que quiser.

Legendas

Adicione uma explicação de uma linha do que este ficheiro representa

Elementos retratados neste ficheiro

retrata

Histórico do ficheiro

Clique uma data e hora para ver o ficheiro tal como ele se encontrava nessa altura.

Data e horaMiniaturaDimensõesUtilizadorComentário
atual17h11min de 4 de outubro de 2009Miniatura da versão das 17h11min de 4 de outubro de 2009640 × 480 (4 kB)Xofc{{Information |Description={{en|1=log/log graph of rank/frequency of words in "Ulysses" by James Joyce (Zipf Law)}} {{fr|1=graphique log/log de la fréquence des mots par leur rang dans "Ulysses" de James Joyce (Loi de Zipf)}} |Source=Own work by uploader

A seguinte página usa este ficheiro:

Utilização global do ficheiro

As seguintes wikis usam este ficheiro: