Ir para o conteúdo

Acervos digitais: desafios e perspectivas/Notas/RJ

Grupo de Usuários Wiki Movimento Brasil


As notas integrais do evento estão disponíveis no pad <https://etherpad.mozilla.org/pTEu9zP0HA>. Constam abaixo apenas as transcrições referentes ao cenário da Wikimedia.

Sistematização dos pontos levantados no debate

[editar]
Tecnologia Direito Políticas institucionais Financiamento Padrões, documentação e metadados
Desafios
  • Utilização de grandes volumes de dados em sites e plataformas que não os comportam.
  • Acervos audiovisuais: quantidade de informação gigantesca, e dificuldade do suporte. Consequente deslocamento do debate.
  • Interoperabilidade entre acervos de bibliotecas, museus e arquivos (podem ser extremamente distintos).
  • Utilização de equipamentos de digitalização externos à instituição: por vezes não calibrados, ou só trabalhando com formatos proprietários.
  • Tecnologias que permitam a acessibilidade dos acervos para inclusão de pessoas com deficiência.

Preservação digital

  • Preservação digital: não estamos preparados. Pode custar 9 vezes mais que a preservação analógica. É preciso conhecer os dados.
  • Falta de pessoas com conhecimento técnico na área (necessidade de formação).
  • Material digital tem fragilidades de suporte (que é temporário), obsolescência de tecnologia, integridade dos arquivos.
  • A preservação analógica do material deve continuar a ser pensada, em conjunto com a preservação digital.
  • Direito de imagem. Problema permanente (muitas fotografias feitas há muito tempo sem autorização de direito de imagem).

Licenciamento

  • Licenças obtidas em momentos diferentes, e para finalidades diferentes.
  • Ausência de organização das informações sobre autoria e licenciamento no passado.
  • Materiais produzidos por pessoas jurídicas que não existem mais, ou que não têm informações sobre os direitos que supostamente administram.
  • Obras órfãs, cujos detentores de direitos são desconhecidos.
  • Licenciamento do conteúdo criado por funcionários da própria instituição: necessidade de contratos específicos.
  • Nunca existirá segurança jurídica total. Carência normativa.

Acesso aberto

  • Como manter, com o detentor de direitos, o interesse em disponibilização, e resguardar seus direitos?
  • Agências de fomento muito tímidas quanto ao acesso aberto
  • Instituições, por razões diversas, impõem restrições ao uso de materiais em domínio público.
  • Restringir o debate de acesso ao debate jurídico é perder o foco (mas o legalismo pode servir ao acesso).
  • Falta de arquivistas e especialistas em bases de dados nas equipes.
  • Fluxo grande de funcionários não permanentes, que participam de projetos de digitalização.
  • Na comunicação imediata (jornalismo): preocupação com produção, não com preservação.
  • Decisão por fazer a digitalização fora da instituição pode comprometer a integridade do acervo.
  • Descontinuidade.

Plataformas

  • Dificuldade de lidar, numa mesma plataforma, com públicos diversos (usuários comuns, historiadores, pesquisadores), que buscam informações diferentes sobre um mesmo material.
  • Pensar se a disponibilização dos conteúdos deve ser feita na plataforma da instituição, em uma externa já existente ou em uma nova.
  • Como estimular interação na plataforma, como a cultura do remix. Criar interesse nos materiais: simplesmente colocar online pode ser insignificante.
  • Problema de governança que afeta o desenvolvimento de políticas públicas de continuidade. Buscar a interoperabilidade entre três os campos: arquivos, bibliotecas e museus (edital “Preservação e acesso aos bens do patrimônio afro-brasileiro”, MinC, 2013).
  • Dificuldade de financiamento via editais de digitalização para instituições grandes.
  • Não priorização das atividades de digitalização quando da captação para atividades gerais da instituicão.
  • Acervos audiovisuais: custo elevado, não acessível.

Mecenato

  • Mecenato não prioriza “atividades invisíveis”, como a digitalização dos acervos.
  • Dentro de um projeto de digitalização, marketing cultural prioriza os hits, dentro dos próprios acervos. Quem vai financiar a digitalização de algo mais obscuro, como filmes de pornosoft de Nilo Machado nos anos 40? Ou algo sem charme, como a memória estatística do país?
  • Como exercer o papel de acompanhamento da integridade das informações?
  • Falta de sistematização de padrões, na área do audiovisual. O futuro torna-se nebuloso.
  • Na área de padrões, falta de diálogo faz com que sempre se reinvente a roda.
  • Acervos audiovisuais: Por que buscar a padronização se a força motriz da indústria é a inovação? Arquivistas sempre atrasados. Pensar em estratégias múltiplas.
  • Falta de visão e planejamento sobre o pós-digitalização: grandes desafios na inserção de metadados, atualização das bases de dados, padronização da nomenclatura dos arquivos.
Soluções e Oportunidades
  • Ações de formação de conhecimento técnico e aproximação de profissionais da engenharia.
  • Parceria com uma instituição como o Internet Archive pode oferecer garantia de segurança, (duplicam acervos, mantêm cópias de segurança), continuidade e atualização.
  • Espelhamento das informações pode garantir segurança.
  • Utilização de formatos não patenteados (ex.: .ogg, em vez de .mp3).
  • Colaboração entre instituições a partir do uso de software livre (ex: Plataforma Corisco, a partir do DSpace).
  • Utilização de equipamentos públicos, como scanneres, calibrados para materiais memoriais.
  • Resolver licenciamento no momento da entrada do material nos acervos.
  • Focar no presente para futuro, e trabalhar com uma política de licenças (não exclusivas) e para fins não comerciais.
  • Começar o trabalho a partir dos acervos com menos problemas de direitos autorais.
  • Inserir informações sobre licenciamento nos metadados.
  • Criar grupos de trabalho sobre direitos autorais nas redes institucionais.

Acesso aberto

  • Estabelecer políticas institucionais consensuadas de acesso aberto, quanto aos materiais produzidos no âmbito de uma instituição.
  • Usuários devem poder interagir, consultar e submeter pedidos de licenciamento.
  • Criar de incentivos para autoarquivamento em acesso aberto.
  • Fomentar as discussões por meio de pesquisas, como, por exemplo, se os professores de cursos de pós-graduação priorizam a recomendação de materiais em acesso aberto.
  • Pensar a instituição como um todo, que pretende ter uma política de presença digital.
  • Desenvolvimento de materiais de boas práticas, também para memória institucional (em mudanças de direção).
  • Desenvolvimento de políticas permanentes, em vez de projetos.
    • Conhecimento do acervo, para estabelecimento de políticas de longo prazo.
  • Trabalhar com níveis de digitalização: baixa resolução, para conhecimento dos acervos e mapeamento das necessidades, para depois alta resolução, a partir delas.
  • Utilização do Creative Commons para estimular interação, a cultura do remix e a interoperabilidade entre plataformas.
  • Investir em plataformas externas à instituição, como a Wikipedia, para difusão das informações e melhoria de conteúdos já existentes.
  • Produção de ferramentas de buscas integradas entre acervos físicos e digitais (nato ou digitalizados).
  • Articular em torno de redes que garantam as boas práticas, como a Rede Memorial. Esse tipo de iniciativa em rede dá suporte para a criação da política pública nacional.
  • Incentivar utilização dos acervos abertos pela comunidade de REA.
  • Vivências/estágios de alunos de graduação nas equipes de digitalização das instituições.
  • Plano nacional de digitalização de acervos.
  • Buscar apoio de organizações que dão suporte, treinamento e equipamentos, como o IBICT, para bibliotecas.
  • Buscar editais de redes, como o da Rede Memorial para kits de digitalização (equipamento, treinamento).
  • Estabelecimento de parcerias que aproveitem do trabalho de voluntários interessados e organizados, como é o caso da Wikimedia Foundation, e que podem trabalhar em traduções, correções e melhorias de metadados. Projeto “Wikipedians in Residence”.
  • Instituições como o BID são mais propensas a financiar iniciativas em rede que individuais.
  • À política de licenciamento pode ser agregado o acompanhamento da utilizacão dos metadados.
  • Criação de metadados administrativos (informações sobre quem fez a digitalização).
  • Integrar as buscas analógica e digital (ferramentas como Discovery).

Asaf Bartov

[editar]

Notas tomadas por Vini 175

[editar]
Institutos de memória x Projetos Wikimedia

  • fechado, curadoria especializada
  • equipe remunerado
  • informação definitiva/categórica
  • forte foco em coisas físicas
  • pesquisa original

  • abertos, curadoria amadora
  • trabalho voluntário
  • informação provisória
  • totalmente online
  • baseado em outras fontes

O que poderia ser mais semelhante
  • Institutos de memória e projetos Wikimedia:
    • ... obter, preservar, tornar acessível e compartilhar conhecimento e objetos culturais
    • ... preocupar-se com qualidade, correção e precisão
    • Atingem sua missão quando suas obras e conteúdos são efetivamente usados
Em outras palavras...
  • Nós fazemos as mesmas coisas pelas mesmas razões para servir ao mesmo público de formas distintas e com modelos diferentes
Por que eu deveria me preocupar com a Wikipedia?
  • É o site de informações referenciadas mais acessado em todo o mundo, atingindo mais de 500 milhões de pessoas todo mês
  • Está disponível em mais de 40 línguas (projetos "sérios", com artigos referenciados)
  • É sem fins lucrativos, licenciada livremente e comprometida com preservação de conteúdo para sempre
  • Wikimedia Commons tem 22 milhões de arquivos de mídia que podem ser reutilizados livremente
  • É a maneira mais rápida e eficiente de atingir o público
A Wikimedia tem voluntários! Vocês têm voluntários em sua instituição?
E e-voluntários?
  • Sim, você pode! Voluntários da Wikimedia SÃO seus e-voluntários! Você apenas não tem um relacionamento com eles ainda!
Então como isso funciona?
  • Instituições colaboram com voluntários da Wikimedia em meios de beneficio mútuo sem comprometer os princípios de ambos, para:
    • Integrar o material da instituição para a Wikipedia, Commons e Wikisource
    • Melhorar a abrangência de conteúdos cobertos na Wikipedia de objetos da instituição ou assuntos de interesse (artigo sobre sua instituição, o diretor/pessoa de prestígio, ou o conteúdo)
  • Retroalimentar a coleção das instituições o trabalho voluntário (por exemplo revisão, categorização)
  • Experiência do museu/arquivo + Alcance da Wikipedia = máxima utilidade ao público
Benefícios para a instituição
  • Atrair novos públicos, físicos e online
  • Melhorar abrangências e qualidade do conteúdo relevante da sua instituição na Wikipedia
    • E ter alguns traduzidos para outras línguas gratuitamente (ver também QRpedia)
  • Rever correções e melhorias de seus próprios metadados (pergunte ao w:Bundesarchiv! - Você tem erros nos seus metadados? E por que você não os conserta? Você precisa encontrá-los! Alguém pode encontrá-los por você!)
  • Crowdsourcing
Alguns exemplos em resumo
  • German Federal Archive - upload de grande quantidade de arquivos, melhorias nos metadados - 300% de aumento no tráfego do site deles após o upload.
  • British Museum (Wikipedians in Residence, concurso, visitas, matchmaking/conexões (entre curadores e o British Museum), traduções, editathons)
  • US National Archive - upload de grande quantidade de arquivos, "documento do dia" (informavam os wikipedistas com 2 semanas de antecedência para poderem melhorar o conteúdo sobre o tema na Wikipedia), editathons - vão fazer upload de 'tudo' no Commons.
  • Bibliotheque Nationale de France (crowdsourcing e revisão de texto de OCR - a acurácia era de 97%, os wikipedistas levaram para uma acurácia de quase 100%)
  • Museo Picasso, Barcelona (links para artigos da Wikipedia no site do museu (os funcionários do Museu melhoravam o conteúdo dos artigos na Wikipedia), editathons, "uma noite no museu")
  • Biblioteca Nacional da Austrália - acervos de jornais (Trove) gera citações automáticas da Wikipedia - aumentou o uso dessa fonte de referência em 500%; página "Ask a Librarian" na Wikipedia
Coisas que você pode fazer amanhã
  • Contatar e convidar wikimedistas locais para atividades conjuntas
  • Informar sobre exibições e projetor por vir
  • Mapear e monitorar a abrangência e a qualidade do conteúdo da Wikimedia relevante para a sua instituição
    • identificar lacunas e comunicar à comunidade para solucionar
    • motivar o foco dos voluntário por meio de concursos por exemplo ou outras atividades/desafios
  • Disponibilizar textos de curadoria sob uma licença livre
  • Disponibilizar seus metadados sob licença CC0

Notas originais do pad

[editar]
  • Wikipedia é apenas um dos projetos da Wikimedia Foundation. Temos também a Wikimedia Commons, o Wikisource, Wikitionary, Wikidata e outros. Juntos, são chamados Wikimedia.
  • O que poderia ser mais diferente do que instituições de memória e os projetos Wikimedia? As instituições são fechadas, com curadoria especializada, equipe remunerada, informação definitiva/categórica, foco em coisas físicas, pesquisa original.
  • Projetos Wikimedia são abertos, com curadoria amadora, trabalho voluntário, informação provisória, totalmente online, baseados em outras fontes.
  • Instituições de memória
    • Fechado, curadoria especializada
    • Equipe remunerada
    • Informação definitiva / categórica
    • Forte foco em coisas físicas
    • Pesquisa original
  • Wikimedia
    • Abertos, curadoria amadora
    • Trabalho voluntário
    • Informação provisória
    • Totalmente online
    • Baseados em outras fontes


O que poderia ser mais semelhante?

  • Ambas
    • Obtêm, preservam, tonam acessivel, compartilham conhecimento e objetos culturais
    • Preocupam-se com qualidade, correção e precisão
    • Atingem sua missão quando suas obras e conteúdos são efetivamente usados

Fazemos as mesmas coisas, pelas mesmas razões, para servir aos mesmos públicos de formas distintas e com ferramentas distintas

Por que eu deveria me preocupar com a Wikipedia:

  • O site de informações referenciadas mais acessado em todo o mundo, mais de 500 milhões de pessoas todo mês
  • Disponível em mais de 40 línguas
  • Sem fins lucrativos, licenciada livremente, comprometida com preservação de conteúdo para sempre
  • Wikimedia Commons tem 22 milhões de arquivos de multimídia que podem ser reutilizados livremente: https://commons.wikimedia.org/wiki/Main_Page
  • É a maneira mais rápida e eficiente de atingir o público
  • (Não significa que deva ser o único jeito de atingir o público)

Diferença entre voluntários e e-voluntários:

  • Voluntários da Wikimedia são seus e-voluntários, e estão querendo fazer mais

Funcionamento das parcerias:

  • instituições colaboram com voluntários da wikimedia em meios de benefício mútuo sem comprometer os princípios de ambos, para integrar o material da instituição para a wikipedia, commons, e wikisource, e melhorar a abrangência de conteúdos cobertos na wikipedia de objetos da instituição ou assuntos de interesse. Disponibilização pode inclusive fazer com que pessoas conheçam o que existe num determinado acervo e ir pessoalmente pesquisar.

Wikimedia respeita direitos autorais provavelmente mais do que a instituição de memória média. É difícil não violar direitos autorais.

Wikimedia tem outros princípios, como a neutralidade. Parcerias têm que respeitar os princípios de ambos os lados

Retroalimentar a coleção das instituições o trabalho voluntário (por exemplo, revisão, categorização)

Experiência do museu / arquivo + alcance da wikipedia = máxima utilidade ao público

Exemplo: British Museum (nota: "o poder das licenças livres")

Benefícios para a instituição: atrair novos públicos, físicos e online. Melhorar abrangência e qualidade do conteúdo relevante da sua instituição na wikipedia, e ter alguns traduzidos para outras línguas, gratuitamente, em outras línguas (ver também QRpedia - http://qrpedia.org/). Receber correções e melhorias de seus próprios metadados (ex: Bundesarchiv).

Crowdsourcing.

Bundesarchiv: liberou 90.000 imagens historicas, com licença livre, e queriam dar visibilidade. O tráfego em seu site aumentou 300%. O benefício inesperado foi que os wikipedistas começaram a utilizar as imagens e encontraram defeitos nos metadados, e wikipedistas importam-se com isso - começaram a escrever para o Bundesarchiv, que teve que contratar alguém para lidar com as correções de voluntários. (https://www.bild.bundesarchiv.de/)

British Museum: "Wikipedians in Residence", que passavam tempo no museu, criando relações com a wikipedia, para produzir conexões entre curadores e wikipedians muito interessados naqueles assuntos específicos. O wikipedian também promoveu "edidatonas", e criou um concurso para encorajar wikipedistas para melhorar um artigo sobre uma exposição e traduzi-lo para outras línguas.

US National Archive: resolveram digitalizar tudo que têm e subir na wikipedia, e criaram o projeto "documento do dia", contando com antecedência a wikipedistas, que trabalhariam naquele tema (em verbete?) (http://techcrunch.com/2014/06/30/us-national-archives-to-upload-all-holdings-to-wikimedia-commons/)

Outros exemplos: Biblioteca nacional da França (revisão do OCR - de 97% - ou até mesmo pior em textos antigos - para quase perfeito acurácia). Wikipedistas são voluntários, então você não pode estabelecer um prazo para eles, e não tem como saber quando estará pronto. Mas fazem diariamente.

Museu do Picasso - equipe colaborou com Wikipedistas para tornar os verbetes de picasso e outros relacionados estivessem realmente muito bons - e em vez de ter seu próprio texto, passaram a referir pessoas para os verbetes da Wikipédia "editatonas", "uma noite no museu"

Biblioteca Nacional da Austrália criou o Trove (Digitised newspapers and more), que gera citação automática da Wikipedia, ajudando wikipedistas a citar o material. E levou meia hora para entrar online, e aumentou o uso dos materiais para citação em 500% Mais pessoas interessadas nas referências chegaram no material original por meio de um verbete. http://trove.nla.gov.au/newspaper/search?adv=y

Página "Ask a Librarian" na Wikipedia.(https://en.wikipedia.org/wiki/Wikipedia:Wikipedia_Signpost/2014-05-14/News_and_notes)

Ações que podem ser tomadas imediatamente:

  • convidar wikipedistas para visitar suas instituições (e os materiais na wikipedia serão melhorados como consequência). Informar sobre exibições e projetos por vir; mapear e monitorar a abrangência e a qualidade do conteúdo da Wikimedia relevante para a sua instituição, identificando lacunas e comunicando à comunidade, ou motivando o foco dos voluntários por meio, por exemplo, de concursos, ou outras atividades e desafios.
  • Disponibilizar textos de curadoria sob uma licença livre, e seus metadados sob uma licença CC0. A Library of Congress disponibilizou todo seu conteúdo em CC0. Assim, ele se torna, por exemplo, utilizável na wikidata, e tornar-se interoperável com outras coleções, como é o caso na Europeana.
  • Pergunta do Gilberto Paschoal, Sesc - qual é a política em relação a direitos?
Wikipedistas costumam checar se o trabalho não viola os direitos autorais, e poderão exigir comprovação de que você tem os direitos para liberar aquela imagem.
  • Pergunta da Bianca Amaro - a Wikimedia tem um padrão de metadados?
Resposta: sim e não. Wikis são wikis, então os metadados não são como os de museus. Navega pelo Commons para mostrar quais são os metadados gerados.
Metadados são inseridos e processados por código wiki.
Em breve, provavaelmente no começo do próximo ano, os metadados estarão bem mais estruturados, com a substituição desses metadados no Commons por dados do novo projeto Wikidata, que oferece dados estruturados lincados em todos os projetos.
"Dados lincados são o futuro"

More examples of applications built over Wikidata:

  • Pergunta Bianca Amaro: Wikipedia pode se tornar um OAI provider? Asaf não tem certeza, acha que alguém deve estar olhando para isso.

Contact: asafATwikimedia.org

Oona Castro

[editar]

Pesquisa mapeamento de REA.

Mapeamento e análise do campo: identificar posições (valores e discursos), de agentes e instituições sobre a produção e circulação de REA. 1. organizações da sociedade civil 2. academia, 3. Poder Público e 4. produtores.

Análise dos repositórios e recursos. 1. mapear as produções existentes de modo a complementar a visão de campo. 2. orientar

Tentamos ver como eles viam REA. Muitas visões distintas. Objetos de aprendizagem (mais comum ouvir falar em objetos do que REA): não necessariamente são abertos

UNESCO, Declaração de Paris, tem uma definição de REA (a parte do "poucas restrições" é tão vaga quanto "pequenos trechos" e não me surpreenderá se for refinada num futuro próximo)

REA pressupõe necessariamente uso, obras derivadas, adaptações, direitos de redistribuição.

A pesquisa identificou que só 3,4% dos recursos chamados REA cumpriam com os critérios da comunidade wikimedia de "livre".

Brasiliana: colocou restrições de uso comercial em obras de domínio público. Necessidade de repensar isso, para que os materiais possam ser incorporados no Commons.

Bianca: como o povo da área científica é colocado no mesmo saco de outras comunidades, parece que REA é maior que repositório da produção científica.

Oona: sim, tudo que está no campo de pesquisa é REA. A tradução e o conceito da UNESCO têm problemas (e está em construção).

Bianca: Tipo de tratamento de um material versus outro. Direitos autorais tratam obras científicas e culturais da mesma maneira, e há diferenças quanto ao uso de uma classe e outra de bens.

Puntoni: questão geral para todos nós pensarmos. Na Brasiliana, colocamos orientações para o uso, não licenciamento. Depois, assessoria de advogado para política de gestão que desse orientação mais confortável para o grupo de pesquisa, mas não tínhamos segurança jurídica nenhuma. A questão é quem tem o poder da gestão sobre aquele material. A Biblioteca Mindlin mudou de gestão, hoje não há mais Brasiliana USP como nome, e não se sabe quem tem o mandato sobre aquele conteúdo. As instituições são complexas, não há proposta concreta sobre isso. Foi uma discussão nos últimos quatro anos: como normalizar isso.

Open Access: conseguiram uma portaria, do reitor, obrigando o professor da USP a depositar no repositório, mas com ou sem limitações. Pedimos para cada professor assinar uma carta de compromisso pelo Open Access.

Oona: em se saindo de um ambiente de confiança, contratos são muito mais necessários (por isso que wikipedistas são muito rígidos, podendo ser bombardeados de todos os lados). BNDigital tem o problema de não indicar, material por material, a situação de direitos.

Puntoni: quando pensamos aquela solução, entramos numa zona cinza, que é não entrar na discussão sobre licenciamento. Nosso compromisso é com acesso gratuito. Se você começa a discutir licenciamento, você não faz nada. Por isso que foi criado o "orientação para o uso", uma enrolação.

Oona: Às vezes ficamos atrelados a uma discussão legalista, e esquecemos a discussão sobre o acesso, mas a precisão jurídica serve a facilitar e garantir o acesso - e não o contrário. O cenário em que você não sabe se ṕode ou não usar uma obra dá insegurança jurídica e impede, por exemplo, a importação para os projetos Wikimedia e circulação muito maior.