Wikipédia Discussão:AutoWikiBrowser/Typos
arquivo |
Instruções
editarTodos os editores autoconfirmados podem colocar novas correções diretamente na lista, na seção de Inclusões recentes. Se não conhece como funcionam as expressões regulares, pode optar por inserir uma regra simples com este formato:
<Typo word="palavra certa" find="\bpalavra errada\b" replace="palavra certa" />
Os "\b"s representam as "bordas" das palavas, e evitam que elas sejam convertidas se estiverem contidas em outras maiores (como ocorre com "cor", "ação" e "coração"). Tanto o AWB quanto o gadget WikEd ignorarão a regra se por acaso ela for inserida com a sintaxe errada (não ocorre nada mais sério).
Depois a regra estiver na lista, outros editores poderão melhorá-la conforme for necessário (por exemplo, fazendo com que ela funcione tanto para palavras com letras minúsculas quanto no caso de sua inicial ser maiúscula, com esta sintaxe).
Na próxima seção há algums exemplos do tipo de regra que não deve ser incluída na lista. Em caso de dúvidas ou sugestões, crie um novo tópico.
Regras removidas
editarEsta seção reúne as regras que foram removidas, provavelmente por que causam muitos problemas (falsos positivos).
- R ancora → âncora (conjugação do verbo ancorar)
- R Asia → Ásia (não necessariamente)
- R cambio → câmbio (conjugação do verbo cambiar)
- R ja → já (não é muito simples?)
- R maquete → maqueta (não faz sentido, maquete é aceito em ptbr e ptpt, este último de acordo com o Priberam)
- R q → que (muito simples, não vale a pena)
- R seguimento → segmento "Seguimento" existe em Português!
- R serie → série
- R so → só (não é muito simples?)
- R tv → televisão
Dúvidas, sugestões e outros comentários
editarTravessão
editarÉ o seguinte, não dá para fazer o AWB corrigir o " - " para o "—"? Para evitar que se troquem erroneamente hífens poderia fazer o seguinte: Marca todas as sequências 1]] - [[1 ; 1]] - [[2 ... 1]] - [[9 ; 2]] - [[1, assim por diante, para serem trocadas. Isso porque sempre haverá um número antes e depois do traço quando ele for necessário, exemplo [[5 de agosto]] de [[1789]] — [[13 de junho]] de [[1823]] (no caso seria 9]] — [[1) Espero não ter esquecido algum detalhe importante. O que acham da idéia? Montemor Courrège Faroe msg 10:42, 26 Fevereiro 2007 (UTC).
- A ideia é boa, mas não é assim tão simples. É preciso ter cuidado com os contextos de busca, que não são só aqueles e que não podem confundir-se com outros. Aconselho a leitura dos artigos Travessão e Meia-risca (estão correctos e actualizados). Acho que consigo trazer algumas formatações de busca automática para isto, mas hoje não as tenho comigo. Abraço, Ozalid 23:21, 26 Fevereiro 2007 (UTC)
Afinal, são apenas dois os contextos de busca para encontrar situações em que, possivelmente, o travessão deveria substituir um hífen. O sinal cardinal corresponde a um espaço.
-#
#-
Basicamente, a detecção depende da existência de um hífen precedido ou sucedido por um espaço (o uso correcto de um hífen ou de uma meia-risca é sempre sem espaços, e. g., couve-flor, 1383–1385). Isto é, quase sempre, quando um hífen tem um espaço antes ou depois, deveria lá estar um travessão.
Em relação à meia-risca, talvez seja melhor não introduzir nada. É que a maior parte das pessoas nunca ouviu falar em meia-risca, nem sabe o que isso seja. Se essas pessoas se puserem a usar estas semi-automatizações, vão substituir tudo com travessões e acabam com as poucas meias-riscas que possam existir na Wikipédia. Abraço, Ozalid 23:17, 28 Fevereiro 2007 (UTC)
Acordo ortográfico
editar- ato -> acto
- atual -> actual
- ação -> acção
- setor -> sector
- projétil -> projéctil
- reação -> reacção
- reator -> reactor
- objeto -> objecto
Outros:
- planejamento -> planeamento
- planejar -> planear
Eu sei que isto tem a ver com as diferenças entre o português e o português do brasil, no entanto existe um acordo ortográfico e parece-me que deve ser respeitado, senão ninguém se entende. —o comentário precedente não foi assinado por Coimbra68 (discussão • contrib.)
- Caro Coimbra68, tenha a bondade de ler Wikipedia:Versões da língua portuguesa e o artigo Acordo Ortográfico de 1990. Abraço, Ozalid 19:43, 8 Abril 2007 (UTC)
- Entretanto li, ainda antes de ver a sua resposta. O facto é que me custa um bocado a habituar-me a ver essas palavras sobretudo num local onde se descreve a minha aldeola. Coimbra68
Então primeiro vamos fazer a lista completa de mudanças. Assim que ele for aprovado só colocar na lista de correções. => Rjclaudio msg 11h58min de 22 de Março de 2008 (UTC)
- Há um novo projecto que pretende reunir os wikipedistas interessados em discutir, propor e executar tarefas relacionadas com a aplicação das normas do Acordo Ortográfico de 1990 na Wikipédia de língua portuguesa. Increve-te: Wikipedia:Projetos/Acordo ortográfico. Um abraço lusófono,Manuel de Sousa (discussão) 09h46min de 21 de Maio de 2008 (UTC)
Videoclipe
editarA configuração atual muda videoclipe para videoclipee. Fiz uma mudança, mas então não colocaria o "e" em videoclip. Não sei se há como resolver ambos os problemas. Maurício msg 10h37min de 21 de Dezembro de 2008 (UTC)
Séries -> Series
editarPeço que retirem essa modificação que está automaticamente afetando a vários artigos relacionados a wrestling, que são trocados indevidamente automático. Christian msg 19h55min de 13 de fevereiro de 2009 (UTC).
- Foi um caso isolado? Parece-me mais caso de falta de revisão da edição, algo essencial para semi-bots. A regra que gera essa mudança é bastante genérica, e de forma geral atende aos casos. --Leonardo Stabile msg 04h03min de 15 de fevereiro de 2009 (UTC)
Androide -> Andróide
editarSugiro a retirada deste termo na lista dos typos, visto que androide é a maneira correta em Portugal e está nas alterações previstas do Acordo Ortográfico de 1990. Davemustaine opa 04h06min de 15 de fevereiro de 2009 (UTC)
- De acordo com o Priberam, o correto em pt-pt é com acento. Mas retiro a regra por conta do AO. --Leonardo Stabile msg 04h11min de 15 de fevereiro de 2009 (UTC)
(I|i)nicio → $1nício
editarSugiro a retirada dessa entrada pelo motivo que "Inicio" faz parte do verbo "iniciar". Gustavob мsg 18h36min de 15 de fevereiro de 2009 (UTC)
- Removido. --Leonardo Stabile msg 09h00min de 16 de fevereiro de 2009 (UTC)
- Eu acredito que é seguro adicionar esta regra novamente (colocando \b no início e no fim), uma vez que os artigos não são escritos em primeira pessoa. Caso contrário, pode ser bom remover também "deposito". Helder 14h25min de 30 de julho de 2011 (UTC)
À
editarParece que ninguém sabe a diferença entre "à" e "a". Sugiro a retirada dos acentos em "à seu", "à meu", "à teu", à 100 (qualquer número cardinal).JF (discussão) 23h03min de 20 de fevereiro de 2009 (UTC)
- Feito. --Leonardo Stabile msg 02h44min de 22 de fevereiro de 2009 (UTC)
- Errado. Só se deve corrigir "à meu(s)" porque não há concordância de género. "à minha" é perfeitamente possível, pelo menos em Pt-pt. "Vou dizer à minha mãe" está certo, mas "vou dizer à meu pai" é um disparate.JF (discussão) 16h50min de 22 de fevereiro de 2009 (UTC)
- Feito. Suponho que o problema também valia para "à tua", então também removi. --Leonardo Stabile msg 23h31min de 22 de fevereiro de 2009 (UTC)
- Observação: "à minha", "à tua", "à sua" está correto em qualquer variante, mas não é obrigatório – de fato, há quem diga que o "mais correto" é sem crase, visto não ser necessário artigo definido frente a possessivo (assim como nos equivalentes masculinos, a meu, a teu, a seu etc.). --tony :: jeff ¿ 02h49min de 5 de agosto de 2009 (UTC)
- A minha recomendação era sobre "à meu" que obviamente estava errado. Quanto a saber se é necessário ou não o "à" antes de "minha" depende da versão do português. Lembre-se que em Pt-pt as palavras "à" e "a" pronunciam-se de modo diferente, a necessidade ou não de saber se se usa acento grave no "a" é facilmente aferida pela pronúncia. Em Portugal "Vou dizer a minha mãe" é tão estranho como, e equivalente a "vou dizer o meu pai".JF (discussão) 12h34min de 5 de agosto de 2009 (UTC)
- Acho interessante salientar para que não seja criada nenhuma rotina que, obrigatoriamente, coloque a crase frente a pronome possessivo, nem que a remova. Quanto à necessidade, perceba que não depende de variante: o possessivo tem caráter definidor, e a crase (a+a, preposição+artigo definido), assim, torna-se desnecessária (apesar de não ser errada). Todavia, o regionalismo é que vai ditar a maneira mais usual e sua pronúncia. "Vou falar a minha mãe" não equivale a "Vou dizer o meu pai", mas sim a "Vou dizer a meu pai". --tony :: jeff ¿ 12h51min de 5 de agosto de 2009 (UTC)--tony :: jeff ¿ 12h51min de 5 de agosto de 2009 (UTC)
- Errado. Só se deve corrigir "à meu(s)" porque não há concordância de género. "à minha" é perfeitamente possível, pelo menos em Pt-pt. "Vou dizer à minha mãe" está certo, mas "vou dizer à meu pai" é um disparate.JF (discussão) 16h50min de 22 de fevereiro de 2009 (UTC)
- Isso depende da percepção. Em pt-pt os determinantes (não os pronomes) "minha" e "meu" são quase sempre indissociáveis dos
pronomesartigos "a" e "o" ao contrário do pt-br onde normalmente não são usados. Assim, os falantes de pt-pt sentem que o "a" que falta em "vou dizer a minha mãe" é a proposição "a" e não opronomeartigo "a". Mas resumindo e concluindo, nós os dois concordamos que não devemos pôr nem tirar o acento grave em "a minha", "a meu" e "à minha",porque depende da versão, mas que "à meu" é um erro a corrigir, tal como está explicitado neste bot.JF (discussão) 13h26min de 5 de agosto de 2009 (UTC)
Eletró(ô)nico
editarSó tem a opção "eletrónico", tem como constar as duas (pt-pt,pt-br)?--Reynaldo Avaré Msg 18h54min de 12 de março de 2009 (UTC)
- Se o termo é encontrado sem acento, é preciso fazer uma escolha, não é possível constar as duas opções. Tendo em vista a saída do "c" com o AO, não é possível discernir a variante exceto pelo acento. Como discernir? --Leonardo Stabile msg 04h55min de 13 de março de 2009 (UTC)
Correções
editarO AWB está a alterar indevidamente as seguintes palavras: estadio; Mocambique; Turnes. Como tenho o Typos a correr, não dá muito jeito estar sempre a alterar. Alchimista Fala Comigo! 23h44min de 18 de junho de 2009 (UTC)
- Poderia citar exemplos de artigos em que esses erros acontecem? Diff se houver. Simplificará consideravelmente a discussão. --Leonardo Stabile msg 09h11min de 19 de junho de 2009 (UTC)
Ajuste
editarLeonardo, um pequeno ajuste nas suas últimas alterações: de <Typo word="privilegiar" find="\b$1revil(egiar|égio|egio)\b" replace="(P|p)rivil$2" /> para <Typo word="privilegiar" find="\b(P|p)revil(egiar|égio|egio)\b" replace="$1rivil$2" />. Abraços Mwaldeck msg 15h37min de 8 de julho de 2009 (UTC)
- Bizarro: havia copiado da regra anterior, nem havia notado o erro. Corrigidas. --Leonardo Stabile msg 06h50min de 9 de julho de 2009 (UTC)
Outras sugestões
editar- tv, Tv -> TV
- icone -> ícone
- romantico, romantica -> romântico, romântica
Bisbis msg 05h42min de 18 de julho de 2009 (UTC)
- tbm tenho uma, que vi recorrente hoje pelo Huggle:
- despois -> depois
- despois -> depois
- --Quark 11h48min de 20 de julho de 2009 (UTC)
- mais 1:
- mostando -> mostrando
- --Quark 12h40min de 20 de julho de 2009 (UTC)
Adicionei as regras, exceto a da televisão. Não me sinto tão à vontade com uma regra tão simples, não existem exceções aqui? --Leonardo Stabile msg 05h40min de 22 de julho de 2009 (UTC)
- Não entendi – a abreviação correta é TV mesmo, em maiúsculas. Que exceção poderia haver? --tony :: jeff ¿ 02h55min de 5 de agosto de 2009 (UTC)
- contrução -> construção
- contruído -> construído
- supermecado -> supermercado
- muncipio -> município
- brasilero -> brasileiro ; brasilera -> brasileira (embora haja pelo menos essa exceção: Aldea Brasilera). Eamaral (discussão) 07h29min de 30 de julho de 2009 (UTC)
- É verdade, Leonardo. Pensando melhor, realmente existem exceções para essa regra da televisão (sites com .tv, por exemplo). Obrigado por alertar e por adicionar os outros. Bisbis msg 20h39min de 30 de julho de 2009 (UTC)
- historia -> história. => Rjclaudio msg 15h11min de 1 de agosto de 2009 (UTC)
- E que tal "estória"? Segundo o Houaiss, é diacronismo antigo e regionalismo brasileiro. Não consta no Priberiam. Por mim, substituiria por "história", que tem o mesmo sentido (além de outros), é comum a todas as variantes e, para muitos, a única forma correta. --tony :: jeff ¿ 02h54min de 5 de agosto de 2009 (UTC)
tv pode ser abreviatura de talvez. GoEThe (discussão) 14h34min de 7 de agosto de 2009 (UTC)
- California -> Califórnia
- aerea -> aérea
Bisbis msg 17h44min de 16 de agosto de 2009 (UTC)
Mussarela
editarPara mozarela, conforme consenso aqui, ou para sua outra forma correta em português, muçarela. --tony :: jeff ¿ 21h17min de 9 de agosto de 2009 (UTC)
Datas
editarAchei um falso-positivo nas datas. O texto "2007/08/09/10" está sendo trocado por "2007/[[8 de setembro]] de [[2010]]). " Recomendaria colocar um espaço antes da data, ou um [^/\-]. => Rjclaudio msg 03h00min de 12 de agosto de 2009 (UTC)
Anti-inflamatório -> Antiinflamatório
editarPeço que retirem esse item, pois a forma correta, pelo Novo Acordo Ortográfico, é com hífen mesmo: Anti-inflamatório.
Yanguas diz!-fiz 23h06min de 29 de outubro de 2009 (UTC)
- Só uma confirmação: a regra atual de substituição retira o hífen de qualquer "anti-" se seguido de qualquer letra exceto h, r ou s. Essa regra realmente existe e "anti-inflamatório" é uma exceção, essa regra não existe ou essa regra existe mas não é exatamente assim? --Leonardo Stabile msg 06h38min de 30 de outubro de 2009 (UTC)
- Stabile, a regra que você citou existe e serve, em geral(*), para qualquer prefixo, mas há outra regra que manda separar por hífen o prefixo que termina com a mesma vogal que inicia a palavra seguinte. Pela mesma regra, modificaram-se as palavras (exemplos):
- microônibus --> micro-ônibus
microondas --> micro-ondas
antiinflacionário --> anti-inflacionário. - A palavra microrganismo agora tem duas formas: essa e micro-organismo (a primeira permaneceu como exceção, por ser considerada consagrada).
- Yanguas diz!-fiz 23h31min de 30 de outubro de 2009 (UTC)
- (*) Há variações conforme a terminação do prefixo. Exemplo: pan-, que pede hífen antes de n, m e vogal, mas muda o n para m quando a palavra seguinte começa com b: pan-americano, pan-misticismo, pan-niilista, mas pambrasileiro.
- Obrigado, era exatamente isso que procurava. Para efeitos práticos, adiciona-se i à lista de exceções composta por h, r e s, fiz a modificação. Essa mesma regra pode impactar outras substituições, há uma seção inteira de expressões para prefixos. Cabe revisão. --Leonardo Stabile msg 02h02min de 1 de novembro de 2009 (UTC)
Copenhague
editarSugiro que haja a correção "Copenhagen -> Copenhague". Sei que existe a forma portuguesa "Copenhaga", mas normalmente quem escreve "Copenhagen" são brasileiros que desconhecem a forma "Copenhague". Dantadd (α—ω) 14h03min de 14 de dezembro de 2009 (UTC)
- Esse tipo de regra não me atrai. Não é uma mera questão ortográfica, o que significa exigir uma análise semântica do texto para realmente avaliar se a edição é válida. Apesar de valer para a ampla maioria dos casos, em Experimento de Afshar o nome do seminário estaria errado, assim como o nome da peça em Arte Ciência no Palco ou a bibliografia em Metecos. Casos reais disso atualmente incluem "Africa" e "Series". A canção do Toto não tem acento, nem Master Series: caso a pessoa não revise corretamente a edição, acaba-se piorando o artigo. Não há (atualmente) forma trivial de se resolver isso na wiki. Em todo caso, fiz a mudança, pelo simples fato de que Africa e Series também estão lá (não é um problema incomum), mas essa questão deve ser discutida mais a sério no futuro. --Leonardo Stabile msg 05h18min de 16 de dezembro de 2009 (UTC)
É verdade. Os bots não distiguem se estamos a escrever em português ou noutra língua. Haverá algum código wiki que faça o bot ignorar uma palavra? tipo <ignora>Africa<ignora>?JF (discussão) 09h42min de 16 de dezembro de 2009 (UTC)
- Atualmente, não. Uma solução prática seria justamente algo assim, adicionar mais informação semântica ao texto, mas a pt está disposta a isso? Não "ignora", que diz respeito exclusivamente a bots, é muito restrito, mas sim algo como <textarea lang="de-de">, ou até mesmo <NomePróprio>. Infelizmente, creio que ainda não é hora para essa discussão. A apresentação de código das predefinições nas caixas de edição de wikitexto ainda é um desafio da wiki de forma geral, imagino que informação semântica seria o passo adiante. --Leonardo Stabile msg 13h04min de 19 de dezembro de 2009 (UTC)
Duas sugestões
editarO texto seguinte foi movido de: Wikipedia:Coordenação robótica#Erro ortográfico
Olá pessoal! Vim aqui pedir para alguém consertar dois erros q encontrei por aqui. etInia e manuNtenção. Łυαη fala! 23h02min de 14 de dezembro de 2009 (UTC)
- Faça esta sugestão na lista de typos do AWB.--Lépton ✉ 03h07min de 15 de dezembro de 2009 (UTC)
O texto seguinte foi movido de: Wikipedia:Coordenação robótica#Erro ortográfico -- Łυαη fala! 18h43min de 18 de dezembro de 2009 (UTC)
Pois então, concordam com as sugestões?? Łυαη fala! 18h43min de 18 de dezembro de 2009 (UTC)
Já a introduzi nas sugestões. Incluí também o erro "étnia".JF (discussão) 19h29min de 18 de dezembro de 2009 (UTC)
- Mais algumas sugestões:
- incluiram -> incluíram
- ambito -> âmbito
- raizes -> raízes
Bisbis msg 05h30min de 20 de dezembro de 2009 (UTC)
- Valeu, JF. Łυαη fala! 22h10min de 21 de dezembro de 2009 (UTC)
Feito. Raízes já existia, por um acaso você encontrou algum caso em que não funcionou? --Leonardo Stabile msg 19h43min de 26 de dezembro de 2009 (UTC)
- Estranho... Estava usando o AWB em algumas páginas e numa delas apareceu "raizes", que o programa parece não ter detectado. Acho que corrigi manualmente, mas não lembro de que artigo se trata, infelizmente... De qualquer forma, obrigado pela ajuda! Bisbis msg 21h44min de 26 de dezembro de 2009 (UTC)
- Outro erro que sugiro que seja incluído: Penísula. O correto é Península. Łυαη fala! 17h03min de 7 de janeiro de 2010 (UTC)
Sugestões
editar- Petroquimico > Petroquímico
- Petrólio > Petróleo (apenas Petrólio com acento, porque sem acento pode ser nome próprio)
ThiagoRuiz msg 18h17min de 26 de dezembro de 2009 (UTC)
Feito --Leonardo Stabile msg 19h43min de 26 de dezembro de 2009 (UTC)
Projeto Ortográfico: eliminação de trema em 5 de janeiro
editarOlá a todos.
Devido ao consenso obtido aqui, o Projeto do Acordo Ortográfico 1990 inicia sua nova fase em 5 de janeiro, eliminando os tremas de palavras da língua portuguesa.
Já há uma discussão iniciada em subprojeto aqui, que será continuada aqui.
Àqueles que aqui participam, fica o convite para unirmos esforços em prol do interesse comum.
Obrigado. --tony :: jeff ¿ 01h12min de 2 de janeiro de 2010 (UTC)
Fim de semana
editarSugiro que "final de semana" seja corrigido em "fim de semana", pois a primeira forma é errada já que usa um adjetivo no lugar do substantivo, apesar de ser forma comum na língua coloquial. Dantadd (α—ω) 19h30min de 9 de janeiro de 2010 (UTC)
Adição de erros
editarTem várias sugestões de correção de erros na lista acima que poderiam constar nos typos, como relogio -> relógio, tranformação -> transformação, piquinique -> piquenique e vários outros. Quem souber colocar os erros na página (e for sysop) peço que faça, visto que lá tem erros que não parecem ter problemas.--Lépton ✉ 01h05min de 21 de janeiro de 2010 (UTC)
Corintiano
editarMais uma sugestão: corinthiano/a/s->corintiano/a/s. Dantadd (α—ω) 22h52min de 8 de fevereiro de 2010 (UTC)
Suponho que seja a retirada do 'h'; nesse caso, feito. --Leonardo Stabile msg 08h31min de 9 de fevereiro de 2010 (UTC)
- Isso... obrigado! Dantadd (α—ω) 17h37min de 21 de março de 2010 (UTC)
Excepção para South Africa
editarDeveriam ser adicionadas excepções para South Africa e Southern Africa (e várias outras possivelmente relacionadas com África) pois ele tenta corrigir o acento ali, indevidamente. --- Darwin Alô? 04h22min de 28 de fevereiro de 2010 (UTC)
E porque não África do Sul e África meridional? Em que contexto é que essas expressões têm de ser usadas em inglês? E qual é a diferença em relação a Asia ou America? —o comentário precedente deveria ter sido assinado por Japf (discussão • contrib.) ups! esqueci-me de assinar.JF (discussão) 19h40min de 1 de março de 2010 (UTC)
- A diferença é que Ásia e América não estão a ser corrigidas de forma automática. Na verdade, penso que o melhor mesmo será tirar África dali da lista, gera demasiados falsos positivos, e atrapalha bastante no AWB. Outro caso é series, que o chato insiste em mudar para séries, porque alguém incluiu isso na lista. Também deveria ser retirado. --- Darwin Alô? 19h44min de 28 de fevereiro de 2010 (UTC)
- Album é outro caso que me lembro que gera muitos falsos positivos. Tudo isso deveria desaparecer dessa lista. --- Darwin Alô? 19h47min de 28 de fevereiro de 2010 (UTC)
- Há uma discussão sobre isso em #Copenhague. Diria que o caminho seria definir que robôs ignoram {{lang}} e uma possível {{próprio}}, e reforçar o uso de tais predefs para fornecer mais informação semântica ao texto. --Leonardo Stabile msg 05h25min de 1 de março de 2010 (UTC)
- Concordo que isso seria o ideal. Entretanto, enquanto isso não é implementado, não seria melhor remover os casos que têm probabilidade significativa de gerar falsos positivos da lista, como estes que eu apontei? --- Darwin Alô? 09h29min de 1 de março de 2010 (UTC)
- Isso é responsabilidade do editor executando o AWB, ele deve ser responsável por essa edição, ela não é necessariamente manual por acaso. Seria o mesmo que limitar o código das predefinições no domínio principal antevendo má utilização. É preciso mais contexto sobre isso, algum caso real usado como referência ou somente esbarrou na mudança usando o AWB? Se for o primeiro, o editor deve ser alertado, outros casos podem estar acontecendo sem revisão. Se for o segundo, podemos começar uma solução local nesse sentido. Typos são habilitados somente para semi-robôs, e tais editores geralmente usam configs prontas. Pode-se injetar um código de reconhecimento por lá para ignorar {{lang}}. Em tempo: removi a regra temporariamente por via das dúvidas. --Leonardo Stabile msg 06h42min de 2 de março de 2010 (UTC)
- Eu tenho dado com estes casos, de forma mais ou menos sistemática, ao usar o AWB. Aparecem sobretudo em referências de obras estrangeiras, discografias ou listas de nomes de seriados, isto para os três exemplos que apresentei. Também creio que em tempos já corrigi várias correcções erradas do mesmo género feitas por semi-bots em artigos, mas não me recordo de nenhum exemplo concreto.
- É verdade que a responsabilidade é sempre de quem opera o semi-bot, e pode compensar ter uma lista de typos muito abrangente para quem se dedica a esse tipo de manutenção mas, por outro lado, a grande quantidade de falsos positivos leva a que os operadores que fazem correcções gerais ou correcções específicas diversas dos typos tendam a não usar essa função, com o consequente prejuízo nas correcções feitas nessas edições.
- Havendo maneira de impedir que o AWB faça correcções nessas situações, seria a situação ideal. --- Darwin Alô? 06h59min de 2 de março de 2010 (UTC)
- Em relação Às correcções na lista de typos, Serie -> Série (singular) pode ser mantido, pois isso não causa problema. Outro caso que seria bom desactivar também é o Album -> Álbum, pois é falso positivo num grande número de discografias estrangeiras. --- Darwin Alô? 07h03min de 2 de março de 2010 (UTC)
- A técnica para identificar tais casos no AWB é uma variação da substituição por etapas, que havia ensinado a certo tempo ao Rjclaudio. Meu AWB está editando "violentamente" neste momento com desambiguações, virou a casa das 7 mil edições agora pouco, mas quando liberar eu tento escrever alguma coisa nesse sentido. Ainda não sei se funcioná pois depende da ordem de execução dos componentes (typos antes e regras pessoais depois ou vice versa?) --Leonardo Stabile msg 07h40min de 2 de março de 2010 (UTC)
- Pessoalmente costumo colocar tudo o que é typos, correcções textuais e substituições no início, por facilitar o código que vem depois. Bom, depois, se tiveres tempo, fala com o Rjclaudio ou comigo, também não me importo de testar isso :) --- Darwin Alô? 14h05min de 2 de março de 2010 (UTC)
- A técnica para identificar tais casos no AWB é uma variação da substituição por etapas, que havia ensinado a certo tempo ao Rjclaudio. Meu AWB está editando "violentamente" neste momento com desambiguações, virou a casa das 7 mil edições agora pouco, mas quando liberar eu tento escrever alguma coisa nesse sentido. Ainda não sei se funcioná pois depende da ordem de execução dos componentes (typos antes e regras pessoais depois ou vice versa?) --Leonardo Stabile msg 07h40min de 2 de março de 2010 (UTC)
A regra seria (para todas, ignore case e apply 99999):
- Antes de qualquer outra regra:
\{\{\s*lang\s*(\|[^\|\}]*\|)
→{{lang-temp$1◆
◆([^\}])([^◆])
→◆$1◆$2
- Depois de qualquer outra regra:
lang-temp
→lang
◆
→
Pensando bem, será difícil funcionar devido a ordem de execução dos componentes do AWB, mas fica o código para interesse. --Leonardo Stabile msg 07h16min de 8 de março de 2010 (UTC)
Ultra-
editarSugiro correção automática para o prefixo "ultra-", que deve ser usado sem hífen quando seguido de consoante (exceto se seguido de "h", "r" e "s"; segundo antiga ortografia). Dantadd (α—ω) 17h40min de 21 de março de 2010 (UTC)
- Remover o hífen se seguido de [bcdfgjklmnpqtvwxz]. Feito --Leonardo Stabile msg 05h35min de 22 de março de 2010 (UTC)
Ultravioleta
editar"Ultravioletas" ou "ultra-violetas" para "ultravioleta". A palavra não flexiona nunca em número. Dantadd (α—ω) 17h47min de 21 de março de 2010 (UTC)
Feito --Leonardo Stabile msg 05h35min de 22 de março de 2010 (UTC)
troféis -> troféus
editarErro ortográfico muito comum, troféis como plural de troféu. O termo correcto é troféus.[1]--- Darwin Alô? 02h30min de 10 de abril de 2010 (UTC)
Correção ortográfica
editarOlá, gostaria que algum bot corrigisse as palavras progama e progamação para programa e programação, respectivamente. Obrigado. OffsBlink (discussão) 01h19min de 2 de maio de 2010 (UTC)
- A regra já existe, falta alguém se disponibilizar para corrigir de fato com o AWB. Farei para esses dois termos agora. --Leonardo Stabile msg 01h28min de 2 de maio de 2010 (UTC)
- Feito. Começando agora alguns dos outros adicionados recentemente. --Leonardo Stabile msg 03h39min de 2 de maio de 2010 (UTC)
Seguimento -> segmento
editarEsta entrada está errada e vários artigos já têm sido erradamente alterados. "Seguimento" é um termo perfeitamente válido, legítimo e de uso corrente em português. Agradeço a um sysop que edite a página ao lado e remova essa entrada antes que mais estrago seja feito.--- Darwin Alô? 16h00min de 2 de maio de 2010 (UTC)
- Feito, retirando aquela regra. --Leonardo Stabile msg 07h00min de 4 de maio de 2010 (UTC)
Entreter e contia
editarRetirei algumas formas do verbo entreter que tinham sido colocadas na lista e que são formas válidas desse verbo[2], assim como o termo 'contia' que existe em português com um significado muito preciso[3].--- Darwin Ahoy! 10h54min de 7 de maio de 2010 (UTC)
@Darwin: a meu ver, a conjugação correta de entreter é essa, que o nosso Wikcionário também indica. Nota que a tua fonte indica que deduziu a conjugação a partir de vender (# paradigma deduzido: vender (regular)), o que parece ser incorreto. Seria bom, pois, recolocar as correções de entreter no AWB. Quanto a contia, confesso que desconhecia o substantivo. Saudações. Mschlindwein msg 08h54min de 25 de maio de 2010 (UTC)
- Ainda sobre contia: penso que o número de vezes que a palavra será empregada (erroneamente) aqui em vez de continha é infinitamente superior ao número de vezes que será empregada como substantivo ;o) (uma busca em Contia na WP é esclarecedora - mas hoje não, pois já corrigi os erros). Por isso, ainda acho uma boa ideia manter a substituição contia-->continha (para dez mil corretas, teremos uma errada - se tivermos...). Ainda prefiro 9999 corretas e uma errada a 9999 erradas e uma correta. ;o) Saudações, Mschlindwein msg 13h00min de 25 de maio de 2010 (UTC)
ao encontro do
editarPor favor corrijam a entrada "ao encontro do" na página ao lado, a substituição deve ser "ao encontro do" e não "ao encontro de".--- Darwin Ahoy! 05h14min de 13 de maio de 2010 (UTC)
- Se possível, também é favor verificar a correção de "descubrir"... o programa sugeriu uma alteração para "descobriir". Bisbis msg 14h56min de 3 de junho de 2010 (UTC)
- Mais um: à ela -> a el$a. Bisbis msg 14h57min de 3 de junho de 2010 (UTC)
- Outro: seria possível remover enfrente -> em frente, já que enfrente é uma forma de se conjugar o verbo enfrentar? Bisbis msg 16h33min de 3 de junho de 2010 (UTC)
Acho que ainda há algo errado na regra do descobrir; o programa acabou de sugerir uma substituição de descubre por descobrie. Bisbis msg 19h48min de 3 de junho de 2010 (UTC) Ops. Bisbis msg 19h52min de 3 de junho de 2010 (UTC)
pra → para
editarPenso que seria melhor remover a regra, já que "pra" pode ser tanto contração de "para" como de "para a", como aconteceu aqui. – Opraco (discussão) 16h49min de 3 de junho de 2010 (UTC)
- Estou verificando as minhas últimas contribuições, para consertar outros possíveis erros, mas não sei se retirar essa regra é a melhor solução. A maior parte dos casos geralmente se resolve desse jeito, como em [4], [5] e [6]. Bisbis msg 17h04min de 3 de junho de 2010 (UTC)
- Pode dar falso positivo em nomes de música tbm.--Lépton msg 17h07min de 3 de junho de 2010 (UTC)
- Feito. Verifiquei todas as minhas edições recentes e corrigi aquelas que tinham problemas, como [7] e [8]. Bisbis msg 17h27min de 3 de junho de 2010 (UTC)
- Concordo com a remoção. ThiagoRuiz msg 18h49min de 21 de julho de 2010 (UTC)
- Concordo também. Bisbis msg 21h04min de 27 de julho de 2010 (UTC)
mantem
editar"mantem" tanto pode ser "mantém", como "mantêm", logo não pode ser usado.JF (discussão) 21h39min de 3 de junho de 2010 (UTC)
pt-pt, pt-br, pt-cv etc. Ele mantém, eles mantêm.JF (discussão) 21h59min de 3 de junho de 2010 (UTC)
- Ah, de fato... Concordo com a remoção da regra. Bisbis msg 22h07min de 3 de junho de 2010 (UTC)
Minha sugestão é a alteração de "golpe de estado" para "golpe de Estado". Łυαη fala! 14h34min de 24 de setembro de 2010 (UTC)
ágnato X agnato
editarVer WP:CR#ágnato X agnato. Łυαη fala! 19h35min de 2 de dezembro de 2010 (UTC)
"possue" -> "possui"
editarHá já cerca de um mês existiam na pt.Wikipedia cerca de 250 ocorrências da palavra errada "possue", o que se mantém actualmente. Esta palavra já faz parte da página Wikipédia:AutoWikiBrowser/Typos, na secção da letra "P", pelo que deveria estar já corrigida. Não conhecendo em absoluto o funcionamento interno do AWB, arrisco uma explicação para o facto; olhem por favor para as duas linhas consecutivas que transcrevo do Wikipédia:AutoWikiBrowser/Typos:
- <Typo word="possui" find="\b(P|p)ossue\b" replace="$1ossui" />
- <Typo word="possui" find="\b(V|v)itoria(s|)\b" replace="$1itória$2" />
Será isto um erro, e o causador da falta da correcção de "possue"? Se o que estou a perguntar é em si mesmo um grande disparate, desculpem desde já, mas a minha intenção é tentar ajudar. --JotaCartas (discussão) 02h42min de 8 de fevereiro de 2011 (UTC)
- Cuidado com a alteração de possue para possui, para não danificarem transcrições de textos em português arcaico. Não creio que essa palavra deva estar nas correcções automáticas, por esse mesmo motivo.--- Darwin Ahoy! 04h35min de 8 de fevereiro de 2011 (UTC)
- Na en:WP existem os templates {{sic}} e {typo}} (ver: en:Template:Sic e en:Template:Typo) que obviam este problema. Já fiz testes preliminares com o AWB em português e funciona. Seria necessário cria-los na pt.WP, mas creio que isso é tarefa para um administrador
- Usando o template {{sic}} - a pagina não é seleccionada pelo AWB
- Usando o template {{Typo}} - aparece uma caixa avisando: "This page contains a 'sic' tag or template, please take extra care when correcting typos."
- Usando o template {{Not a typo}} - não é detectado pelo AWB. --JotaCartas (discussão) 03h53min de 20 de fevereiro de 2011 (UTC)
- Na en:WP existem os templates {{sic}} e {typo}} (ver: en:Template:Sic e en:Template:Typo) que obviam este problema. Já fiz testes preliminares com o AWB em português e funciona. Seria necessário cria-los na pt.WP, mas creio que isso é tarefa para um administrador
Disfrutar >> Desfrutar
editare respetivas flexões... João Sousa DC 17h16min de 11 de fevereiro de 2011 (UTC)
Erros e falsos positivos no ficheiro Typos
editar- Erro 1:
Alguem → aguémcorrigido - Erro 2: antissalazarista → anti-ssalazarista
- Falsos positivos por causa do inglês: África, série, álbum; (prestar atenção dobrada)
- Outros falsos positivos:
mantem → mantém, tambem pode ser mantêm.eliminado
autonomo → antônomo, só valido para o Brasil.eliminado
Talvez fosse útil uma página especifica para colocar estes avisos até serem corrigidos, e/ou acautelar os utilizadores do AWB. --JotaCartas (discussão) 23h45min de 22 de fevereiro de 2011 (UTC)
- Corrigi o erro 1, mas não percebo como é que o erro 2 ocorre, uma vez que o erro <Typo word="anti" find="\b(A|a)nti(-| )([aàábcdeéèfgjklmnoóòpqtuvwxyz])" replace="$1nti$3" /> não deveria detectar palavras começadas por antis... Corri também os outros falsos positivos. Os falsos positivos do inglês mantive, uma vez que o AWB deve mesmo ser usado com cautela. GoEThe (discussão) 17h49min de 28 de fevereiro de 2011 (UTC)
- O Erro 2 é provocado pela linha: <Typo word="anti-" find="\b(A|a)nti(| )([hrsiíì])" replace="$1nti-$3" /> --JotaCartas (discussão) 21h02min de 28 de fevereiro de 2011 (UTC)
Para ultrapassar erros da página Typos como "alguem→aguém", enquanto não forem corrigidos, pode-se usar a opção "Find & replace" conjuntamente com a opção "Enable Regex TypoFix".
- Separador: Options / Find & replace / Normal Settings (obs.: Não checar a caixa "Apply after general fixes otherwise before")
--JotaCartas (discussão) 12h21min de 28 de fevereiro de 2011 (UTC)
defenir -> definir
editarRegra melhorada , para cobrir 'redefinir'; +tempos de verbos; + '-se/o/a' --JotaCartas (discussão) 23h54min de 6 de março de 2011 (UTC)
- <Typo word="definir" find="\b(In|in|)(Re|re|)(D|d)efeni(r|ção|ções|do|da|dos|das|u|a|ndo)(\b|\-)" replace="$1$2$3efini$4$5" />
Evocar e Invocar
editarAmbos estão correctos: Evocar é lembrar, chamar à presença (na imaginação): Invocar é pedir o auxílio ou a protecção, e também recorrer ao testemunho de. Fonte Ciberdúvidas I e Ciberdúvias II --JotaCartas (discussão) 03h38min de 9 de março de 2011 (UTC)
- <Typo word="invocar" find="\bevocar\b" replace="invocar" />
- Por favor retirem evocar da lista o quanto antes, esse termo é correctíssimo em português, nunca deveria ter sido colocado aí.--- Darwin Ahoy! 09h44min de 6 de agosto de 2011 (UTC)
Bege
editarPara também incluir "beije", um erro comum, pode-se usar o Typo abaixo, embora com cuidado, por causa dos falsos positivos (presente do conjuntivo do verbo beijar.) --JotaCartas (discussão) 22h30min de 9 de março de 2011 (UTC)
- <Typo word="beje" find="\b(B|b)e(ig|j|ij)(e|es)\b" replace="$1eg$3" />
Voô(s), dôou
editarPodem acrescentar também estes typos frequêntes (mencionados aqui): voô, voôs, dôou.
<Typo word="voo" find="\b(V|v)oô(s?)\b" replace="$1oo$2" />
<Typo word="doou" find="\b(D|d)ôou\b" replace="$1oou" />
Helder 13h16min de 13 de março de 2011 (UTC)
Catalisar
editarNovo Typo para também cobrir: catalisadores; catalisadoras; catalisados; catalisadas.--JotaCartas (discussão) 19h04min de 23 de março de 2011 (UTC)
- <Typo word="catalisador" find="\b(C|c)ataliza(dor|dora|r|do|da|dores|doras|dos|das)\b" replace="$1atalisa$2" />
Álbum/Álbuns
editarEstes são os typos já existentes:
- <Typo word="álbum" find="\balb[ùúu](m|ns)\b" replace="álbu$1" />
- <Typo word="álbum" find="\balb[ùúu]ms\b" replace="álbuns" />
mas não corrigem as formas "Ábums" nem "álbums" das quais existem 420 ocorrências, proponho mais um:
- <Typo word="álbum" find="\b(Á|á)lb[ùúu]ms\b" replace="$1lbuns" /> já corrigidos manualmente com o AWB
- Ou então
substituir tudo pelos 4 seguintes, que cobrem todas as situações possiveis:
- <Typo word="álbum" find="\b[aàá]lb[uùú](m|ns)\b" replace="álbu$1" />
- <Typo word="Álbum" find="\b[AÀÁ]lb[uùú](m|ns)\b" replace="Álbu$1" />
- <Typo word="álbuns" find="\b[aàá]lb[uùú]ms\b" replace="álbuns" />
- <Typo word="Álbuns" find="\b[AÀÁ]lb[uùú]ms\b" replace="Álbuns" />
Obs: ainda há cerca de 3 400 ocorrências de "Albums" já corrigidos manualmente com o AWB, tendo ficado somente os relativos a 'charts' como "Canadian Albums Chart" e outros charts estrangeiros, que provocam muitos falsos positivos.
Assim, para 'desprezar' somente a forma "Albums" (o que me parece um bom compromisso), dever-se-á substituir o Typo #4 por:
- 4.1 <Typo word="Álbuns" find="\b[AÀÁ]lb[ùú]ms\b" replace="Álbuns" />
- 4.2 <Typo word="Álbuns" find="\b[ÀÁ]lb[u]ms\b" replace="Álbuns" />
--JotaCartas (discussão) 17h57min de 25 de março de 2011 (UTC)
CDs e DVDs
editarDe igual modo que a sigla EP, CD e DVD não deverão levar plural. N.º de erros na pt:WP: CDs - 2 088; CD's - 213; DVDs - 1 200; DVD's - 148. --JotaCartas (discussão) 02h35min de 8 de abril de 2011 (UTC)
Sugestão ideia
editar<Typo word="ideia" find="\b(I|i)déia(s|)\b" replace="$1deia$2" /> 189.63.241.198 (discussão) 08h52min de 8 de abril de 2011 (UTC)
África e série
editarApesar de estarem colocados entre <!-- observações --> na página Typos, continuam a produzir-se as correções de Africa → África, e de serie → série. --JotaCartas (discussão) 08h03min de 9 de abril de 2011 (UTC)
AO 1990
editarGalera, baseando-me em WP:ORT, queria pedir a um que sabe algo de AWB que programe para mudar palavras que possam mudar do FO 1943 para o AO 1990, como por exemplo:
- cinqüenta -> cinquenta
- pingüim -> pinguim
- qüinqüenal -> quinquenal
- seqüência -> sequência
E por aí vai.Existem muitas palavras para transferir e por isso é bom um semi-bot para fazer isso em boa parte dos artigos. Pedroca cerebral Fala-Faço 01h28min de 14 de julho de 2011 (UTC)
- Para eliminar o trema, provavelmente bastará usar as mesmas expressões regulares que surgiram desta discussão e que foram implementadas nas configurações do conversor de idiomas
- Localizar:
/([gq])ü([iéêí])/g
- Substituir por:
$1u$2
- Substituir por:
- Localizar:
/qüe/g
- Substituir por:
que
- Substituir por:
- Localizar:
- Mas quem usar tais regras deve sempre conferir se elas não estão alterando indevidamente alguns nomes estrangeiros. Helder 02h24min de 14 de julho de 2011 (UTC)
- Por isso é bom colocar para testes e ver qual vai ser o resultado disso.O que acha?Acredito que expressões como qüe e güe não vão alterar palavras estrangeiras.Mas mesmo assim, é necessária cautela. Pedroca cerebral Fala-Faço 14h52min de 16 de julho de 2011 (UTC)
- Conforme o que foi dito na outra discussão, a regra para "güe" é particularmente problemática com os nomes próprios, por isso não foi incluída (veja esta lista de palavras com trema). Helder 03h37min de 21 de julho de 2011 (UTC)
- Por isso é bom colocar para testes e ver qual vai ser o resultado disso.O que acha?Acredito que expressões como qüe e güe não vão alterar palavras estrangeiras.Mas mesmo assim, é necessária cautela. Pedroca cerebral Fala-Faço 14h52min de 16 de julho de 2011 (UTC)
E já falando no AO 1990, muitas outras palavras devem ser mudadas, como
- idéia - ideia
- alcatéia - alcateia
- coréia - coreia
- assembléia - assembleia
Mais palavras devem ser mudadas. Pedroca cerebral Fala-Faço 15h03min de 16 de julho de 2011 (UTC)
- Não sei bem o se isto é o que quiz dizer com querer "fazer um bot com o AWB", já que o AWB não é um bem robõ e todas as edições feitas com ele deve(ria)m ser monitoradas pelos editores que o utilizarem. Então quando para fazer as alterações precisará adicionar cada par de palavras às listas de localizar e substituir do AWB ou então sintetizar várias delas em umas poucas expressões regulares (o que dá um certo trabalho, pois pode ser difícil de prever os falsos positivos). Helder 03h37min de 21 de julho de 2011 (UTC)
Surpreza
editarNão seria interessante adicionar uma linha para substituir esta palavra por surpresa? Digo, de forma que a linha também corrija versões próximas da palavra, como surprezo, etc. --Mister Sanderson 14h28min de 6 de agosto de 2011 (UTC)
Algumas novas sugestões
editarAchei estes erros enquanto corrigia typos com o AWB:
- receptaculo -> receptáculo
gang -> ganguegangster -> gângster- analises -> análises
- paraíbano -> paraibano
Bisbis msg 14h59min de 6 de agosto de 2011 (UTC)
- gang e gangster são termos bem conhecidos e usados do pt-pt, não são erros. Analises é uma forma verbal do verbo analisar, pelo que também não deveria ser incluída, embora o uso dessa forma em artigos deva ser algo raro.--- Darwin Ahoy! 15h09min de 6 de agosto de 2011 (UTC)
- Não sabia que se usava assim em pt-pt, perdão. Já risquei os dois. O caso do 'analises' como conjugação do verbo analisar me parece bastante incomum... acho que não haveria problema na inclusão (ou então que se fizesse um teste; se fosse verificada a ocorrência do 'analises' por diversas vezes, a regra seria rejeitada). Bisbis msg 15h13min de 6 de agosto de 2011 (UTC)
Mais uma:
- erupição -> erupção
Bisbis msg 17h04min de 7 de setembro de 2011 (UTC)
- Incluí a regra nesta edição, mas deixo uma sugestão:
- Acredito que não haverá problemas se quiser colocar novas sugestões diretamente na lista, agora que a página foi desprotegida. Se não conhece como funcionam as expressões regulares, pode optar por inserir uma regra simples com este formato:
<Typo word="palavra certa" find="\bpalavra errada\b" replace="palavra certa" />
- (os "\b"s foram colocados apenas para indicar as "bordas" da palava e evitar que elas sejam convertidas se estiverem contidas em outras palavras, como ocorre em "coração"). Tanto o AWB quanto o gadget WikEd ignorarão a regra se por acaso ela for inserida com a sintaxe errada (não ocorre nada mais sério).
- Além disso, uma vez que a regra tenha sido adicionada, outros editores poderão melhorá-la conforme for necessário (por exemplo, fazendo com que ela funcione tanto para palavras com letras minúsculas quanto no caso de sua inicial ser maiúscula, com esta sintaxe). Helder 18h37min de 7 de setembro de 2011 (UTC)
successo
editarA correção para esta palavra está errada. Está gerando sucesso$5. --Mister Sanderson 17h00min de 4 de setembro de 2011 (UTC)
- Esta edição deve te corrigido o problema. Helder 18h50min de 6 de setembro de 2011 (UTC)
Seguimento --> Segmento
editarA palavra "seguimento" existe em português! Assim, a substituição por "segmento" proposta nessa página poderá causar MUITOS estragos!. Favor remover da lista! Mschlindwein msg 11h02min de 5 de outubro de 2011 (UTC)
- Vejo que o mesmo erro já foi feito antes e corrigido: Wikipédia_Discussão:AutoWikiBrowser/Typos#Seguimento_-.3E_segmento.
Mschlindwein msg 11h06min de 5 de outubro de 2011 (UTC)
- Vou retirar "Seguimento --> Segmento" desta página, pois. Mschlindwein msg 11h46min de 5 de outubro de 2011 (UTC)
Anti-s >>> Anti-s
editarVi que o AWB faz a correção de Anti-social para antisocial, o que como é óbvio, está mal, devendo ser antissocial. João Sousa DC 10h44min de 18 de novembro de 2011 (UTC)
- A expressão "Anti-social" não é detectada por nenhuma das duas expressões regulares que estão na página (confira no rubular: aqui e aqui). Teria um exemplo concreto de uma página em que viu o problema ocorrer? Helder 11h11min de 18 de novembro de 2011 (UTC)
- erro meu. era anti-social para anti social[10].João Sousa DC 21h52min de 18 de novembro de 2011 (UTC)
- Pelo que vi no seu link, na verdade era "
Anti-Sociais
" -> "AntiSociais
". Como o "S" era maiúsculo, a expressão era detectada pela expressão regular "\b([Aa])nti[- ]([^hiíìrs])
", pois no trecho "hiíìrs
" só há o "s" minúsculo, e consequentemente, era feita a remoção do hífen. Se a regex for alterada para "\b([Aa])nti[- ]([^hiíìrsHIÍÌRS])
", ela deixará de detectar casos como acima, e consequentemente de remover o hífen indevidamente. - Além disso, note que essa expressão regular é a que remove hífens ou espaços, e como sua intenção era trocar o S maiúsculo por um minusculo e algo como "
\b([Aa])nti-([HIÍÌRS])
" -> "$1nti-$2
" não faria a letra ficar minúscula, a (única?) opção é criar novas expressões regulares, uma para cada letra que costume ser colocada em maiúscula depois do hífen. Exemplos:
- Pelo que vi no seu link, na verdade era "
- erro meu. era anti-social para anti social[10].João Sousa DC 21h52min de 18 de novembro de 2011 (UTC)
<Typo word="anti" find="\b([Aa])nti-H" replace="$1nti-h" />
<Typo word="anti" find="\b([Aa])nti-I" replace="$1nti-i" />
<Typo word="anti" find="\b([Aa])nti-Í" replace="$1nti-í" />
<Typo word="anti" find="\b([Aa])nti-R" replace="$1nti-r" />
<Typo word="anti" find="\b([Aa])nti-S" replace="$1nti-s" />
- Isso faz sentido? É assim que deve ser? Helder 11h24min de 19 de novembro de 2011 (UTC)
"Grã-bretanha" / "Grã bretanha" / "Grã Bretanha" para "Grã-Bretanha"
editarSerá possível corrigir automaticamente por um bot todas as ocorrências "Grã-bretanha", "Grã bretanha" ou "Grã Bretanha" para o certo "Grã-Bretanha"? Zdtrlik (discussão) 18h50min de 21 de novembro de 2011 (UTC)
- Sim. Isso deve resolver.Helder 19h21min de 21 de novembro de 2011 (UTC)
Erro aqui ou no corretor?
editarO corretor me sugeriu [praça -> paraça]. Talvez por causa do [pra -> para]? Ariel C.M.K. (discussão) 23h26min de 28 de janeiro de 2012 (UTC)
- O problema não é em nenhum dos dois, mas sim na implementação de expressões regulares em JavaScript, pois há limitações ao lidar com caracteres que não sejam ASCII, causando-nos problemas ao tentar detectar as bordas das palavras quando há letras acentuadas, cedilha ou caracteres de outros idiomas.
- Se eu não me engano, na linguagem em que o AWB é feito, não existe esse problema. Helder 01h30min de 29 de janeiro de 2012 (UTC)
Hmmm . Ariel C.M.K. (discussão) 01h35min de 29 de janeiro de 2012 (UTC)
É... Esse problema é que está ferrando: por exemplo eu adicionei [alimento s → alimentos], e ele quis fazer [alimento são → alimentosão], rsrs. Ariel C.M.K. (discussão) 04h43min de 30 de janeiro de 2012 (UTC)
- Isso deve evitar o problema neste caso. Helder 12h52min de 30 de janeiro de 2012 (UTC)
Suspenção > Suspensão
editarPoderiam fazer essa correção: Suspenção > Suspensão
187.107.2.38 (discussão) 16h06min de 15 de julho de 2012 (UTC)
WPCleaner
editarHi,
If you're interested, WPCleaner can now be configured to use the same list as AWB to detect spelling and typography mistakes and provide suggestions. --NicoV (discussão) 09h43min de 23 de setembro de 2012 (UTC)
- Muito interessante! Eu não conhecia essa ferramenta... Obrigado pela sugestão! Helder 12h26min de 10 de julho de 2013 (UTC)
Rectaguarda -> retaguarda
editarProponho a inclusão da correcção de "rectaguarda" -> "retaguarda". Encontrei cerca de vinte erros, que já corrigi. --JotaCartas (discussão) 09h34min de 24 de novembro de 2012 (UTC)
Saiem -> saem
editarProponho a inclusão da correcção "saiem" -> "saem". Encontrei cerca de vinte erros que já corrigi. --JotaCartas (discussão) 10h21min de 24 de novembro de 2012 (UTC)
Acréscimo e decréscimo
editaracréssimo -> acréscimo; decréssimo -> decréscimo. Encontrei e corrigi somente três erros. Não serão relevantes para a lista de "typos", mas poderão ser incluídos em Wikipédia:Lista de erros comuns/Máquinas --JotaCartas (discussão) 18h48min de 28 de novembro de 2012 (UTC)
AWB Regex TypoFix Bug?
editarReportei um erro? na página Wikipédia_Discussão:AutoWikiBrowser#Bug_ou_funcionalidade? pois pareceu-me o local mais indicado, de toda a forma aqui fica a chamada. --JotaCartas (discussão) 12h35min de 29 de novembro de 2012 (UTC)
- Afinal é o modo de funcionar do AWB
- Está em discussão na en:WP se a funcionalidade se deverá manter ou alterar. Para discutir sobre o assunto ia a Wikipédia_Discussão:AutoWikiBrowser#Bug_ou_funcionalidade?. --JotaCartas (discussão) 05h24min de 12 de dezembro de 2012 (UTC)
- Para facilitar, eis o link para a página em que está ocorrendo a discussão: en:Wikipedia talk:AutoWikiBrowser/Typos#Interaction between typo-fixing and the names of linked images. Helder 15h53min de 20 de dezembro de 2012 (UTC)
- Corrigido na rev 8834 - A restrição de não aplicar a regra se corresponder a um link será aplicada somente aos wikilinks, não a imagens/interwikis/categorias. --JotaCartas (discussão) 16h20min de 16 de janeiro de 2013 (UTC)
- Para facilitar, eis o link para a página em que está ocorrendo a discussão: en:Wikipedia talk:AutoWikiBrowser/Typos#Interaction between typo-fixing and the names of linked images. Helder 15h53min de 20 de dezembro de 2012 (UTC)
Regras "endividada" erradas
editarAs regras foram corrigidas e expandidas
- <Typo word="endividada" find="\bindividad([a|o])(s?)\b" replace="endividad$1$2" />
- <Typo word="endividada" find="\bIndividad([a|o])(s?)\b" replace="Endividad$1$2" /> --JotaCartas (discussão) 00h59min de 6 de dezembro de 2012 (UTC)
- Aquelas barras "|" não deveriam estar ali. Além disso, o s? pode ficar no mesmo grupo de captura do "a" e do "o". Fiz as alterações nesta edição. Helder 15h58min de 20 de dezembro de 2012 (UTC)
Síndrome
editarÉ género feminino em Ptbr, mas sempre foi masculino em Ptpt http://www.linguee.pt/portugues-ingles/search?source=auto&query=um+s%EDndrome Síndromo não se diz em Ptpt. Síndroma agora tem um acento agudo mas não tinha e pronunciava-se [sindrôma]. Todas as variantes estão corretas: um síndrome (mais frequente em Portugal), uma síndrome (mais frequente no Brasil), um síndroma (também se diz em Portugal). Mas síndromo não existe em Portugal e creio que nem em português (pelo menos no dicionário que uso). O dicionário que apresento em link é muito versátil e apresenta as variantes no Brasil e em Portugal. Se repararem diz que é feminino mas apresenta exemplos no masculino. Nini00 Como? 00h06min de 12 de dezembro de 2012 (UTC)
Expandir regras para que aceitem mais sufixos
editarComo é aconselhado, isto deveria ser feito para os verbos? Em inglês é fácil (-ed, -ing), mas em português é mais complicado. Tomando como exemplo o verbo "analisar", paradigma flexional "amar", estendi as regras somente para as 3ªs pessoas do singular e plural, gerúndio e particípio passado (as mais usuais na linguagem enciclopédica), e seria assim:
usar forma abaixo<Typo word="analisar" find="\b([Aa])naliz(e(m?)|ou|a(ra(m?)|rá|rão|ria(m?)|m|va(m?)|sse(m?)|rem|d[ao](s?)|r|ndo)?)\b" replace="$1nalis$2" />
A replicação para outros verbos com o mesmo paradigma seria fácil, mas como ainda não vi nada parecido aqui, tenho algumas dúvidas se deverá ser implementado? Obrigado. --JotaCartas (discussão) 03h09min de 12 de dezembro de 2012 (UTC)
- Versão simplificada:
<Typo word="analisar" find="\b([Aa])naliz(em?|ou|a(?:r(?:am?|á|ão|em|iam?)?|m|vam?|ssem?|d[ao]s?|ndo)?)\b" replace="$1nalis$2" />
- Em relação a usar ou não em todos os verbos, acho que só precisamos ponderar que se por um lado ganharemos em termos de precisão, diminuindo os falsos positivos, pode-se perder um pouco em termos da performance (mas não sei se a lentidão chegaria a ser perceptível). Helder 16h08min de 20 de dezembro de 2012 (UTC)
- Versão simplificada + alfabética:
<Typo word="analisar" find="\b([Aa])naliz(a(?:d[ao]s?|m|ndo|r(?:am?|á|ão|em|iam?)?|ssem?|vam?)?|em?|ou)\b" replace="$1nalis$2" />
- usei a sua forma simplificada (que me parece bem) e coloquei os parâmetros por ordem alfabética (será mais fácil conferir), --JotaCartas (discussão) 06h29min de 17 de janeiro de 2013 (UTC)
- Versão simplificada + alfabética:
Regras que também seleccionam a forma correcta
editarHá algumas regras que também seleccionam as formas correctas. Ex.:
<Typo word="devoção" find="\b([Dd])evo[cç][aã]o\b" replace="$1evoção" />
Esta regra também apanha a palavra correcta "devoção"; isto é evidenciado no separador/aba "Typos" do AWB, sublinhado a amarelo. Não sei se é importante ou não para a performance do AWB e se deverão ser corrigidas. Aguma opinião? --JotaCartas (discussão) 03h29min de 12 de dezembro de 2012 (UTC)
- Após alguns testes, concluí que se na pagina houver um erro, mas a expressão concordar com um link, vai desactivar a regra para toda a página e obviamente não corrige o erro:
A devocao é uma qualidade ...
== Ver também ==
*[[Devoção a Deus]]
- Nesta situação e com a regra antiga, o erro "devocao" não seria corrigido. Com a regra nova, "devocao" é corrigida. Assim, creio que deverão ser corrigidas todas as regras nesta situação. --JotaCartas (discussão) 01h14min de 13 de dezembro de 2012 (UTC)
- Sugiro corrigir regras que detectem palavras corretas. Helder 16h10min de 20 de dezembro de 2012 (UTC)
- Todas as regras que tinha detectado foram corrigidas: alcoólico, aeronáutica, assassino, coletânea, devoção, doações, etnia, ministério, perspectiva, privilégio, ritmo, visualizar. --JotaCartas (discussão) 15h33min de 16 de janeiro de 2013 (UTC)
- Sugiro corrigir regras que detectem palavras corretas. Helder 16h10min de 20 de dezembro de 2012 (UTC)
A expressão ([^a-záàâãçéêíóôõúü\-])
editarA expressão ([^a-záàâãçéêíóôõúü\-]
) é utilizada para ultrapassar as diferenças entre o AWB e o wikEd, pois este último não considera os caracteres acentuados (diacríticos) como caracteres alfanumérico (\w
) e selecciona-os como fronteira de palavra (\b
). Assim, para ficar compatível com o AWB, acho que o carácter hífen (-
) não deveria estar na cadeia, pois no AWB ele é considerado como fronteira de palavra (i.e. não é considerado um carácter alfanumérico). --JotaCartas (discussão) 03h53min de 12 de dezembro de 2012 (UTC)
- Não me recordo se precisei colocar esse hífen por algum motivo quando acrescentei essas classes de caracteres. Isso já causou algum problema? Se sim, seria bom registrar aqui, caso façamos a mudança e tenhamos que reverter no futuro... Ficaria mais fácil de compreender a situação tendo casos concretos a disposição. Helder 16h20min de 20 de dezembro de 2012 (UTC)
Predefinição:Sic
editarA predef. {{Sic}} é reconhecida pelo AWB, dando um alerta: "Contains Sic tag/template" e é usada pala en.WP para marcar Falsos Positivos (FP). Para isso é conveniente que tenha os parâmetros da en:Template:Sic para poder ser escondido, mascarar os erro e também poder usar os templates associados en:Template:Not a typo/"não é erro", en:Template:Proper name/"nome próprio" e en:Template:As writen/"como escrito". Tudo isto foi solicitado em Wikipédia:Predefinições pedidas#Predefinição:Sic e assim que estiver pronto poderá ser usado para marcar FP's. Se tiverem algo a dizer (ou ajudar) discutam lá.
- Nota - O {{Sic}} actualmente existente já é reconhecido pelo AWB e o simples texto "[sic]" também. O inconveniente é que nem sempre é aconselhável que fique visível no texto da página, por exemplo para marcar como FP o nome de uma pessoa. Uma maneira de ultrapassar a situação é incluir <!-- [sic] --> para que fique invisivel, mas vai desactivar todas as regras typo para essa página.--JotaCartas (discussão) 04h29min de 12 de dezembro de 2012 (UTC)
- Foi alterada a predefinição {{Sic}} e criadas as predefs. {{Não é erro}}, {{Como escrito}} e {{Nome próprio}} para serem usadas marcando os FP's à medida que forem sendo encontrados pelo AWB, impedindo o seu aparecimento posterior. --JotaCartas (discussão) 15h39min de 16 de janeiro de 2013 (UTC)
Parabéns pelo esforço
editarEstive a ler um pouco desta página e quero felicitar-vos pelo esforço. Não percebo nada destes códigos de modo que não posso ajudar neste campo. Porém, sempre poderei colaborar no género do que disse para a palavra síndrome. Se em algum momento acharem que eu talvez possa ajudar não hesitem. Tenho encontrado formas "esquisitas" (para mim) de utilizar os pronomes antes ou depois do verbo. Deduzi que no Brasil as regras gramaticais são diferentes. Mas não tenho a certeza de que é verdade. Por exemplo "dou-lhe" no Brasil é mesmo "dou a ele"? Deduz-se (Se deduz?) que a gramática brasileira é diferente da portuguesa? Um abraço Nini00 Como? 08h51min de 12 de dezembro de 2012 (UTC)
- Há quem diga que a gramática é a mesma, mas o uso se diferenciou.JF (discussão) 17h33min de 20 de dezembro de 2012 (UTC)
- Sim deve ter razão pois os alunos do programa Wikipédia na Universidade escrevem praticamente como em Portugal. Nini Como? 20h57min de 20 de dezembro de 2012 (UTC)
È -> É
editarIncluídas e testadas regras para corrigir (è) e (È). Existem cerca de 1 000 páginas com este erro. Aparecem alguns falsos positivos, nomeadamente em títulos em italiano. Grande parte dos falsos positivos (cerca de 50) foram 'protegidos' com a predef {{lang}} para evitar que voltem a ser selecionados pelo AWB. Ter atenção a páginas com versos em italiano e páginas sobre línguas que representem este caracter. --JotaCartas (discussão) 09h32min de 20 de dezembro de 2012 (UTC)
- Resolvido o problema dos versos e outros textos em italiano. Foram incluídos entre
<blockquote></blockquote>
, parece que o AWB não lhes 'pega'..--JotaCartas (discussão) 11h55min de 21 de dezembro de 2012 (UTC)
Número mínimo de erros
editarNão sei se está estabelecido um número mínimo de erros para inclusão na página de typos? p.ex.:
- ligua -> língua, cerca de 60 páginas
- liguagem -> linguagem, cerca de 30 páginas
Para já aqui ficam registados --JotaCartas (discussão) 12h20min de 21 de dezembro de 2012 (UTC)
- Isso já se tornou um problema?
- Como fez a contagem?
- Lembrando que pode não ser boa ideia remover regras existentes só por não haver mais ocorrências. Mais importante do que a quantidade de erros é a frequência com que ocorrem, mas isso não é tão fácil de medir. Helder 15h38min de 21 de dezembro de 2012 (UTC)
- 1. Nas minhas buscar por erros encontro alguns com 2,3 ou meia-duzia de ocorrências que vou corrigindo, mas não crio regras na página de typos. Talvez um mínimo de 20 fosse um número aceitável - notar que uma vez introduzidos na página e os erros corrigidos ninguém saberá qual terá sido a incidência de erros e sará difícil elimina-los por baixa ocorrência. Para já julgo não haver problema de performance, mas desconheço se, caso a lista cresça muito, venham a ocorrer - a en.WP tem cerca de 3 600 regras, algumas bem mais complexas e creio não haver queixas de performance.
- 2. A contagem não é muito certa, mas eis o método, p.ex. 'ligua':
- - busca normal da wikipédia com o texto entre aspas (") - "ligua" - normalmente dá uma contagem precisa. (ver: en:Help:Searching#Search engine features - Phrases in double quotes).
- - também uso o 'make list' do AWB, source: "Wiki search (text) - resultado normalmente idêntico ao acima.
- - muitas vezes os resultados não diferenciam as letras com ou sem sinais (diacríticos) , e aí uso a o 'make list' do AWB, source: "Google search", a maioria das vezes os resultados são mais precisos.
- - claro que repito a busca para "ligua", "lígua", "liguas", "líguas", etc. - tudo somado dá um resultado aproximado
- - a este valor há que retirar as ocorrências que o AWB nunca irá corrigir por estarem em links internos ou externos, dentro de predefinições, entre aspas (") 'quoted', em títulos de secções, etc. etc. - 50% é um racio aceitável
- - se pretendo uma contagem mais 'fina/precisa', crio o uma regra no "Find & Search" do AWB e 'corro' a lista produzida anteriormente, vendo no separador "logs" o nº de incidências.
- - uff! se precisar de mais dicas, 'feel free to ask'
- 3. É evidente que para ter dados mais correctos sobre a incidência de erros seria necessário manter registos onde cada um introduzisse o nº de correcções que fosse fazendo ao longo do tempo. Eu vou mantendo os meus registos em folhas exel no meu PC, e em algumas em páginas pessoais (Usuário:JotaCartas/Ortografia), mas sistematizar isto num projecto da wikipedia parece-me demasiado complexo. Assim vamos vivendo do trabalho individual de cada um (por períodos mais ou menos curtos), mas este é um nos 'senãos' da wikipedia – falta de coordenação/contacto. Tenho algumas ideias sobre um possível projecto:correcções ortográficas/gramaticais, mas como disse, será muito complexo de implementar .. vamos falando. Abrç --JotaCartas (discussão) 00h45min de 22 de dezembro de 2012 (UTC)
poderam -> poderão
editar<Typo word="poderão" find="\b([Pp])oderam\b" replace="$1oderão" />; pode também ser corrigido para "puderam" JotaCartas (discussão) 04h23min de 5 de janeiro de 2013 (UTC)
- Na correcção efectuada de "poderam" a grande maioria correspondia a "puderam", embora possa corresponder também a "poderão". vou alterar a regra em conformidade--JotaCartas (discussão) 15h57min de 16 de janeiro de 2013 (UTC)
mantem -> mantém
editar<Typo word="mantém" find="\b([Mm])antem\b" replace="$1antém" /> - poderá também ser "mantêm" se for 3ª pessoa do plural --JotaCartas (discussão) 04h41min de 12 de janeiro de 2013 (UTC)
- Esta regra já tinha sido removida em 2010, mas está lá outra vez.JF (discussão) 12h31min de 14 de janeiro de 2013 (UTC)
- Removi novamente. Helder 16h17min de 14 de janeiro de 2013 (UTC)
- Atç! Colocar uma regra
<!-- entre comentários -->
não a remove. Continua activa no AWB. O mesmo se passa com "Africa" e "série" --JotaCartas (discussão) 20h22min de 14 de janeiro de 2013 (UTC)- Bem observado. Conferi a sintaxe usada na enwiki e acredito que assim deve funcionar. Helder 20h42min de 14 de janeiro de 2013 (UTC)
- Atç! Colocar uma regra
- Removi novamente. Helder 16h17min de 14 de janeiro de 2013 (UTC)
perspectiva / perspetiva
editar<Typo word="perspectiva" find="\b([Pp])(?:er|res?)pe(c?)tiv(\w{1,7})\b" replace="$1erspe$2tiv$3" />. Embora pareça demasiado abrangente, foi testada em cerca de 500 páginas, despoletou 50 correcções e não deu qualquer 'falso positivo', Não existem quaisquer palavras começadas por perpectiv... prepectiv... prespectiv... ; Não interfere com o AO, pois mantém o 'c' nas palavras que o tinham, e não inclui o 'c' nas palavras que o não tinham. --JotaCartas (discussão) 09h27min de 15 de janeiro de 2013 (UTC)
Typo "h (hora)"
editarPrponho que a regra:
<Typo word="h (hora)" find="\b[Hh]r?s\b" replace="h" />
seja substituida por<Typo word="h (hora)" find="(\d)\s?[Hh]r?s\b" replace="$1 h" />
para assegurar que é o símbolo da hora (aparece depois de um dígito - com ou sem espaço) e introduz um 'espaço duro' entre o dígito e o simbolo "h". --JotaCartas (discussão) 19h03min de 16 de janeiro de 2013 (UTC)
- Parece bom (exceto por eu não saber se a convenção é usar o ou não). Helder 20h09min de 16 de janeiro de 2013 (UTC)
- Parece-me que os símbolos das unidades são sempre separados do valores por um espaço ( o General fixes do AWB faz isso); a questão do é para evitar que o "h" possa ficar isolado numa nova linha. Aideia é que, num texto onde não hajam numeros, p.ex. "demorou muitas hrs ..." não seja feita a subst. por "h" que não faria muito sentido (deverá ser alterado manualmente para "horas")
- PS:Julgo que o mais correcto é usar duas regras para as horas:
- se o formato for hh o simbolo "h" pode ficar junto (o mais usual gramaticalmente) -> "7h", "24h", "12h15min"
<Typo word="h (hora hh)" find="(\s[0-2]?\d)(?:\s[Hh]r?s?|[Hh]r?s)\b" replace="$1h" />
- se o formato for hh:mm, hh:mm:ss o simbolo "h" fica separado por espaço duro ( ) -> "12:45 h" ou "12:45:15 h" ou "2:25:35,56 h"
<Typo word="h (hora hh:mm)" find="(\d:[0-6]\d)([.,][\d]{1,3})?\s?[Hh]r?s?\b" replace="$1$2 h" />
- --JotaCartas (discussão) 20h50min de 16 de janeiro de 2013 (UTC)
Typo "viagem"
editarEsta regra, que já existia, vai causar FP's (conjuntivo, 3ª pess.plural), mas entre cerca de 11 500 occ. do substantivo "viagem" só encontrei 15 occ. de "viajem" que marquei com {{Não é erro}} e não voltarão a ser apanhadas. Claro que irão aparecer novos FP's, mas o 'racio' (11.500 :: 15) parece-me francamente aceitável. --JotaCartas (discussão) 06h52min de 17 de janeiro de 2013 (UTC)
quiz -> quis
editarComentei a linha por encontrar muitos Falsos Positivos. Corrigi todas as occ. que havia a corrigir e protegi todos os FPs, mas é muito provável que voltem a aparecer quiz=questionáro, nomeadamente nos artigos sobre TV shows e jogos de computador. Também aparecem alguns casos de português arcaico que serão protegidos. --JotaCartas (discussão) 18h40min de 19 de janeiro de 2013 (UTC)
Álbuns
editarLinha originais:
<Typo word="álbum" find="\balb[ùúu](m|ns)\b" replace="álbu$1" />
<Typo word="álbum" find="\bAlb[ùúu](m|ns)\b" replace="Álbu$1" />
<Typo word="álbum" find="\balb[ùúu]ms\b" replace="álbuns" />
<Typo word="álbum" find="\bAlb[ùúu]ms\b" replace="Álbuns" />
Substituidas por:
<Typo word="álbum" find="\b(?:álb[úù]|[aà]lb[uúù])(m|ns)\b" replace="álbu$1" />
corrige todas as formas, inclusivé "album" que pode estar correcta se for en inglês - muitos FPs.<Typo word="Álbum" find="\b(?:Álb[úù]|[AÀ]lb[uúù])(m|ns)\b" replace="Álbu$1" />
iden para maiúsculas.<Typo word="álbuns" find="\b(?:alb[úù]ms|[áà]lb[uúù]ms)\b" replace="álbuns" />
não corrige "albums" desde que não tenha qualquer acento; possivelmente está correcto pois será inglês; não deve produzir FPs.<Typo word="Álbuns" find="\b(?:Alb[úù]ms|[ÁÀ]lb[uúù]ms)\b" replace="Álbuns" />
iden para maiúsculas.
Pseudo-redirects
editarAgora que os pseudo-redirects foram descontinuados, não seria o caso de os incluir aqui? Coloquei a lista já convertida para o formato apropriado nesta página para facilitar a inspeção (e ajustes) dos termos a adicionar. Numa filtragem inicial, dos 423 pseudo-redirects, encontrei 17 duplicados nos AWB typos:
<Typo word="Eletroimã" find="\bEletroimã\b" replace="eletroímã" />
<Typo word="India" find="\bIndia\b" replace="Índia" />
<Typo word="Yoga" find="\bYoga\b" replace="ioga" />
<Typo word="musico" find="\bmusico\b" replace="músico" />
<Typo word="Treslagoense" find="\bTreslagoense\b" replace="três-lagoense" />
<Typo word="Video-game" find="\bVideo-game\b" replace="videogame" />
<Typo word="Orgão" find="\bOrgão\b" replace="Órgão" />
<Typo word="municipio" find="\bmunicipio\b" replace="município" />
<Typo word="Alcool" find="\bAlcool\b" replace="álcool" />
<Typo word="Paraiba" find="\bParaiba\b" replace="Paraíba" />
<Typo word="Piaui" find="\bPiaui\b" replace="Piauí" />
<Typo word="Suiça" find="\bSuiça\b" replace="Suíça" />
<Typo word="Catalizador" find="\bCatalizador\b" replace="catalisador" />
<Typo word="Comercio" find="\bComercio\b" replace="comércio" />
<Typo word="Druída" find="\bDruída\b" replace="druida" />
<Typo word="individuo" find="\bindividuo\b" replace="indivíduo" />
<Typo word="musica" find="\bmusica\b" replace="música" />
...mas possivelmente falharam-me outros (comparei o atributo "word" da lista atual dos typos com tanto o pseudo redirect como com o título destino dos pseudo-redirects). De qualquer forma, a lista acima já dá para ter uma ideia do formato das restantes 406 entradas. O que acham? --Waldir msg 01h35min de 12 de junho de 2014 (UTC)
- Concordo --Stegop (discussão) 03h43min de 12 de junho de 2014 (UTC)
- O que for correção de erros ortográficos, pode ser inserido aqui e também na Wikipédia:Lista de erros comuns (em particular, na versão para máquinas utilizada pelo gadget WP:AVT). Se forem outros tipos de correções (estilo, sintaxe wiki, etc...), seria melhor deixar em outras listas (como a do WP:APC, baseada em WP:Projetos/Check Wikipedia/AWB). Helder.wiki (discussão) 11h11min de 12 de junho de 2014 (UTC)
- PS: Isso me lembra que deveríamos ter alguma categorização dos redirects para poder separar, digamos, aqueles que são erros ortográficos dos demais. Helder.wiki (discussão) 12h30min de 12 de junho de 2014 (UTC)
- Se vai mesmo haver redirs de títulos com erros ortográficos, então concordo com a tal categoria. Mas estou longe de ser o único a achar que tais redirs nunca devem existir. Erro é erro e afinal uma das razões para se acabar com o pseudo-redir é que ele camufla esses erros azulando links. Se vamos azulá-los, então a situação fica ainda pior do que antes e mais vale manter o pseudo-redir. É muito mais fácil detetar esses erros se os links estiverem vermelhos, quer "visualmente", quer recorrendo a ferramentas como o Red Link Recovery Live. --Stegop (discussão) 14h29min de 12 de junho de 2014 (UTC)
- Ugh. Não haverá forma de unificar essas listas todas num único sítio?... caso contrário estamos a duplicar, triplicar trabalho, e a criar oportunidades de dessincronização... --Waldir msg 15h01min de 12 de junho de 2014 (UTC)
- Infelizmente não vejo como isso seria possível. São formatos, funcionalidades e limitações diferentes em cada ferramenta. Mas reconheço a dificuldade em manter as listas sincronizadas (há um problema análogo ao lidar com as listas de palavras ofensivas que são utilizadas pelas diversas ferramentas anti-vandalismo: salebot, filtros, huggle, AVT, etc...). Helder.wiki (discussão) 17h47min de 12 de junho de 2014 (UTC)
- PS: Isso me lembra que deveríamos ter alguma categorização dos redirects para poder separar, digamos, aqueles que são erros ortográficos dos demais. Helder.wiki (discussão) 12h30min de 12 de junho de 2014 (UTC)
Typos em inglês?
editarO AWB está a carregar automaticamente os typos em inglês, pelo menos no meu caso. Alguma dica? Vanthorn® 19h59min de 28 de novembro de 2014 (UTC)
- Vanthorn: Não é só com você. Estou tendo o mesmo problema, tive até que desabilitar essa opção, pelas correções errôneas. Paulo Eduardo Discussão 20h06min de 28 de novembro de 2014 (UTC)
- Obrigado, pelo menos fiquei a saber que não é só comigo. Talvez o grande técnico Helder.wiki possa dar uma ajuda :). Vanthorn® 20h15min de 28 de novembro de 2014 (UTC)
- @Vanthorn, PauloEduardo: aqui funciona normalmente no AWB 5.5.5.0. Têm certeza de que ao abrir o AWB estão escolhendo a pt.wikipedia em vez da en.wikipedia? (o site aparece no canto inferior direito) Helder 13h16min de 29 de novembro de 2014 (UTC)
PS: o nome da minha conta de usuário passou a ser "He7d3r" (por isso a notificação não funcionou)
PS2: Tirem essas tags "font" das assinaturas de vocês... (fica muito feio com um CSS detector de códigos obsoletos)- Helder, estou a usar a versão do AWB 5.5.5.0. Quando carrega o programa aparece o aviso The newest typos will now be downloaded from https://en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/Typos when you press OK.. Depois de pressionar OK entra normalmente na pt.wikipedia (inferior lado direito). Vanthorn® 21h42min de 29 de novembro de 2014 (UTC)
- Parece que foi resolvido, está já a carregar os typos em português. Vanthorn® 20h54min de 1 de dezembro de 2014 (UTC)
- Que bom que voltou a funcionar! Helder 22h30min de 1 de dezembro de 2014 (UTC)
A nova versão 5.5.7.0 resolveu este problema. Quando se inicia o AWB ele carrega automaticamente os typos em português se a opção Regex Typo Fixing está ativada por default. Vanthorn® 00h51min de 22 de maio de 2015 (UTC)
Erro após inclusão de nova ortografia
editarNo dia 3 de maio de 2015 eu inclui a palavra "Reestréia" como erro da palavra "Reestreia". Só que após esta inclusão eu não consigo mais usar o Regex Typos. Quando eu clico em "Regex Typo fixing", aparece uma mensagem de erro a respeito desta inclusão da palavra "Reestreia". O que eu devo fazer para reverter essa situação, pois eu não estou mais podendo fazer correções ortográficas por conta desta situação? Será que eu devo remover esta palavra lá da lista para voltar ao normal e fazer as correções em artigos com palavras "reestréia" de maneira manualmente? WikiFer msg 21h15min de 3 de maio de 2015 (UTC)
- Esse erro afetava todos os utilizadores, não só você. Faltava um "parêntese", já corrigi. Seja mais cauteloso no futuro. Sds, Vanthorn® 21h34min de 3 de maio de 2015 (UTC)
- @Vanthorn: Foi um equívoco da minha parte, e equívocos acontecem, isso é normal. O importante é que eu já estou mais ligado sobre este tipo de situação e prometo que não vou cometer deslizes como esses somente por falta de algum parênteses ou algo do tipo. Eu agradeço muito pela correção. O bom é que eu avisei logo aqui para evitar problemas em relação aos outros editores do AWB, tomando uma ótima atitude. Desculpe! WikiFer msg 21h39min de 3 de maio de 2015 (UTC)
- Não tem nada que pedir desculpa, é com os erros que se aprende e ninguém é livre de os cometer. Boas edições! Vanthorn® 23h35min de 3 de maio de 2015 (UTC)
- Sempre que possível, procure seguir a orientação dada em WP:AutoWikiBrowser/Typos#Como testar as regras de correção dos erro de digitação:
Helder 12h45min de 4 de maio de 2015 (UTC)Com o AWB ou o WikiEd imediatamente depois de adicioná-las. Se não funcionar, primeiro remova-a e então analise-a.
- @Vanthorn: Foi um equívoco da minha parte, e equívocos acontecem, isso é normal. O importante é que eu já estou mais ligado sobre este tipo de situação e prometo que não vou cometer deslizes como esses somente por falta de algum parênteses ou algo do tipo. Eu agradeço muito pela correção. O bom é que eu avisei logo aqui para evitar problemas em relação aos outros editores do AWB, tomando uma ótima atitude. Desculpe! WikiFer msg 21h39min de 3 de maio de 2015 (UTC)
...em => êm
editarNão sei se é em todos os casos, mas notei que um verbo terminado em "em" foi mudado para "êm" (não me lembro qual, mas poderia [mas não era] ser "obtem" => "obtêm") quando o certo naquele caso era "ém" ("obtém"), por ser singular. Acho que nesses casos é preferível não corrigir, para que nos corretores ortográficos apareça o erro. --Stegop (discussão) 04h42min de 16 de julho de 2015 (UTC)
Cujo a/cujo o
editarOlá! Tentei editar a lista para adicionar a correção das ocorrências do termo "cujo o ", "cuja a" e suas formas plurais, mas não deu certo. Se alguém puder checar minha edição para ver onde errei, eu ficarei grato. Boas edições, Victão Lopes Diga! 12h09min de 5 de janeiro de 2016 (UTC)
- @Victor Lopes: O que não deu certo naquela tentativa? Helder 15h26min de 5 de janeiro de 2016 (UTC)
- Depois de salvar essa página, eu fui para o AWB, cliquei em "File ---> Refresh status/typos" e carreguei um artigo, mas ele não detectou as ocorrências nela. Victão Lopes Diga! 16h27min de 5 de janeiro de 2016 (UTC)
- @Victor Lopes: Acredito que assim deverá funcionar. Helder 18h09min de 7 de janeiro de 2016 (UTC)
- Cliquei no refresh, mas ele ainda não reconheceu as ocorrências (eu fiz umas edições recentes, mas ainda usando o mecanismo de identificação e substituição de termos). Essa correção de typos precisa ser ativada como alguma preferência do AWB, ou já é padrão? Victão Lopes Diga! 19h00min de 7 de janeiro de 2016 (UTC)
- @Victor Lopes: Em que página testou?
- É preciso ativar a opção "Enable RegexTypoFix" que aparece na parte inferior desta imagem. Helder 21h40min de 7 de janeiro de 2016 (UTC)
- Opa, agora foi! Eu não tinha notado que tinha de ativar a opção, achei que já era automático. Obrigado pela ajuda! Victão Lopes Diga! 22h50min de 7 de janeiro de 2016 (UTC)
- Cliquei no refresh, mas ele ainda não reconheceu as ocorrências (eu fiz umas edições recentes, mas ainda usando o mecanismo de identificação e substituição de termos). Essa correção de typos precisa ser ativada como alguma preferência do AWB, ou já é padrão? Victão Lopes Diga! 19h00min de 7 de janeiro de 2016 (UTC)
- @Victor Lopes: Acredito que assim deverá funcionar. Helder 18h09min de 7 de janeiro de 2016 (UTC)
- Depois de salvar essa página, eu fui para o AWB, cliquei em "File ---> Refresh status/typos" e carreguei um artigo, mas ele não detectou as ocorrências nela. Victão Lopes Diga! 16h27min de 5 de janeiro de 2016 (UTC)
O código não consegue identificar um espaço? Senão acontece o problema apontado nesta edição. Victão Lopes Diga! 00h17min de 27 de janeiro de 2016 (UTC)
- @Victor Lopes: Pode fazer testes com as expressões regulares na janela que aparece ao acessar Find and replace > Advanced settings > Test.
- Pelo que vi, esta alteração resolve o problema. Helder 12h38min de 27 de janeiro de 2016 (UTC)
- Parece que agora foi! Obrigado! Victão Lopes Diga! 14h19min de 27 de janeiro de 2016 (UTC)
- @Victor Lopes: tenho duas dúvidas sobre esta última inclusão:
- A substituição de "cuj o" por "cujo o" (ou ainda "cuj os" por "cujo os") foi intencional?
- Já havia uma regra para substituir "cuja o" por "cujo". Não estava funcionando ou duplicou sem querer?
- Helder 15h47min de 2 de fevereiro de 2016 (UTC)
- Então, a regra:
<Typo word="cuja2" find="\b([Cc])ujas? o(s?)\b" replace="$1ujo$2" />
- serve para pegar ocorrências como "cujas os" (ou seja, plural nas duas palavras). Já a regra:
<Typo word="cujo3" find="\b([Cc])ujo? a(s?)\b" replace="$1uja$2" />
- foi criada para pegar casos do tipo "cujo as" (primeira palavra singular, segunda palavra plural). É redundante? Reparei agora que tem alguns "s" entre parêntesis e outros sem parêntesis. Será que é por isso que ele não estava pegando certas ocorrências? Eu lembro de ter testado um caso específico e o AWB não passou, mas não vou lembrar qual ocorrência exata foi.
- Na verdade eu tenho pegado um número considerável de erros que o programa deixa passar. Eu já percebi que ele ignora todos os que estão dentro de infoboxes, templates e citações. Mas tem casos nos corpos dos artigos que eles tem deixado passar. Victão Lopes Diga! 20h09min de 2 de fevereiro de 2016 (UTC)
- @Victor Lopes: Nas expressões regulares o ponto de interrogação indica que aquilo que o precede é opcional (isso é bem útil no caso dos plurais). Veja estes exemplos.
- Os parêntesis servem para formar um grupo de caracteres que podem ser capturados para uso na substituição (por meio dos códigos
$1
,$2
, etc... que indicam o primeiro parêntesis, o segundos, e assim por diante). Helder 00h59min de 3 de fevereiro de 2016 (UTC)- Então basta colocar um parêntesis no "s" da regra cuja2 para tornar a regra cuja3 desnecessári, é isso? Victão Lopes Diga! 02h22min de 3 de fevereiro de 2016 (UTC)
- Então, a regra:
"cassar" -> "caçar"
editarAtenção que esta regra gera falsos positivos. Existe o verbo "Cassar" (revogar, anular) --JotaCartas (discussão) 18h13min de 29 de maio de 2016 (UTC)
{#if:|{{ELES|Bibliografia|}}|Bibliografia }
editarAlguém sabe porque as edições de alguns editores via AWB incluem esta obtusidade: {{#if:|{{ELES|Bibliografia|}}|Bibliografia }}
? --Stegop (discussão) 13h58min de 14 de julho de 2017 (UTC)
- Isso aconteceu nalguma das minhas? Há algum exemplo?-- Darwin Ahoy! 14h18min de 14 de julho de 2017 (UTC)
- essa expressão tinha a substituição em mente devia colocar seção da bibliografia. entretanto a pred. bibliografia agora coloca uma citação e não uma seção. Dbastro (discussão) 14h19min de 2 de abril de 2022 (UTC)
brasão
editar@DarwIn: Em relação a esta edição, considere simplificar
<Typo word="brasão" find="\b([b])ra(?:zã|sa)o\b" replace="$1rasão" />
para
<Typo word="brasão" find="\bbra(?:zã|sa)o\b" replace="brasão" />
Helder 14h12min de 2 de abril de 2022 (UTC)
- Feito nesta edição. Helder 12h29min de 9 de abril de 2022 (UTC)