Estudo de tendências dos editores
Estudos | |
---|---|
Temas: Editores Filosofia Wikipédia | |
Teorias e resultados |
Página dedicada aos estudo de tendências do editores da Wikipédia em português. Reunindo materiais e resultados relevantes sobre o tema. Essas tendências ajudarão num melhor entendimento do comportamento e evolução da Wikipédia, em língua portuguesa.
Questões
[editar]Conjunto de questões com alta prioridade para a Wikipédia-pt. Sinta-se livre para fazer perguntas que nosso estudo pode ajudar a responder.
- 1. Which editors are the ones that are leaving -- are they the new editors or the more tenured ones?
- 2. Qualidade dos artigos criados por IPs - discussões recorrentes sobre limitar a edição de IPs.
- Os artigos criados são mantidos ou eliminados? Se eliminados, são vandalismos ou erros de novatos? Se mantidos, há algum usuário novato editando o artigo pouco tempo depois?
A parte inicial, com a série histórica de 2001-7, pode ser vista aqui. Essa não é a final, mas oferece um ideia sobre as edições (criações de artigos) dos IPs, quando comparadas com usuários registrados.
- 3. Distribuição geográfica da Wikimedia
- Qual a quantidade de contas registradas mensalmente por região? - Onde a Wiki tem maior visibilidade?
- 4. Artigos eliminados
- Qual o percentual para cada tipo de justificativa de eliminação?
- 5. Categorização de novos artigos
- Como os novos artigos são categorizados? Em qual nível nas árvores de categorias?
- 6. WikiPausa
- É comum os editores entrarem em WikiPausa? Com que frequência, e por quanto tempo? - A WikiPausa faz parte do ciclo normal dos editores?
- Há relação entre a WikiPausa e a situação em que a comunidade se encontra? - Motivos para a WikiPausa
- 7. Ferramentas de cargos
- Frequência de edições eliminadas / que são reversões e participação nas PEs dos Elimiunadores / Reversores / Administradores
- Comparação entre Antes e Depois de receber as ferramentas. - Quando recebe as ferramentas, os editores mudam seu padrão de edições? Eles passam a focar mais nas eliminações das ERs que mandar páginas para ER? Ter a ferramenta incentiva os editores a combater mais o vandalismo, ou dificulta pelo medo de ser acusado de mal uso da ferramenta?
- Comparação com outros editores que não tem os cargos - O que leva os editores a se tornarem eliminadores / reversores? O padrão de edições (reversão / eliminação) é suficiente ou há outros motivos para a decisão (situação da Wiki / modo de ver os cargos / etc)? Se possível, identificar candidatos com padrões de edição que podem ser indicados para esses cargos.
Ferramentas
[editar]Algumas ferramentas foram herdadas do estudo Editor Trends, e outras foram adicionadas atendendo necessidades próprias.
Python > 2.6: Linguagem de programação orientada à objetos, interpretada e ágil. MongoDB: Banco de dados orientado à documentos e de alta performance, faz uso de documentos com no estilo JSON. Editor trends: Ferramenta desenvolvida por um grupo da Wikimedia Foundation, responsável pela descompactação do arquivo DUMP, disponível gratuitamente. MySQL: Gerenciador de banco de dados, de código aberto.
O processo inicial é baixar um arquivo dump, formado por um arquivo xml compactado. Uma vez com o arquivo, é feita a extração, um processo que vai transformar um único arquivo (grande) xml em arquivos menores .csv. Depois dessa conversão os arquivos .CSVs podem usados por qualquer ferramenta de análise: R, Excel, Python, C++.
Tarefas
[editar]No estudo sobre a qualidade do usuários anônimos, tipo IP, existem algumas diferenças do estudo do Editor Trends. O conjunto de dados é o mesmo, o que muda é a forma de processar o arquivo dump, liberado pela WMF, dessa vez as edições do tipo IP contam.
- Extração dos dados do arquivo dump (Jonas): concluída
- Processamento dos dados, criando lista de artigos e seus criadores (IP ou registrados) (Jonas): concluído
Referências
[editar]- Trabalho de mineração de dados feito com dados da Wikipédia
- Editor Trends Study
- Estudo sobre tópicos da Wikipédia com maior crescimento, pdf
- Wikilytics
- Is Wikipedia Inefficient? Modelling Effort and Participation in Wikipedia
- Circadian Patterns of Wikipedia Editorial Activity: A Demographic Analysis
- WikiWarMonitor
Interessados em ajudar
[editar]- Jonas AGX 05h37min de 21 de março de 2011 (UTC)
- Néviomande-me uma mensagem 15h26min de 21 de março de 2011 (UTC)
- Pietro Roveri 22h51min de 23 de março de 2011 (UTC)
- Everton137 09h13min de 14 de agosto de 2011 (UTC)
- Rjclaudio 15h36min de 21 de agosto de 2011 (UTC) - interesse em fazer perguntas / conclusões serve?