![]() |
Nota: para visualizar todas as mensagens deste tópico na mesma página utilize o modo expandido
| Mensagens neste tópico | Autor | |
| mensageiro | 30-04-2010, 00:41 | |
| LF2S | 30-04-2010, 11:43 | |
| mensageiro | 30-04-2010, 12:34 | |
| hmrb | 30-04-2010, 12:36 | |
| joaoggralves2 | 30-04-2010, 13:04 | |
| LF2S | 30-04-2010, 18:07 | |
RE: Voluntariado » |
mensageiro | 30-04-2010, 19:17 |
| LF2S | 30-04-2010, 21:16 | |
| mensageiro | 01-05-2010, 01:41 | |
| APINHEIRO | 30-04-2010, 19:13 | |
| mensageiro | 30-04-2010, 19:20 |
| RE: Voluntariado | 30-04-2010, 19:17 |
| Autor: mensageiro [responder para o fórum]
Eu sou historiador (estou actualmente a trabalhar na minha tese de doutoramento), e apenas considerei esta hipótese a nível particular. Mas existe a possibilidade de um tal trabalho ser financiado pela Fundação para a Ciência e Tecnologia, desde que devidamente enquadrado em termos institucionais e conceptuais. A meu ver, e salvo melhor opinião, os acervos deviam ser tornados públicos via internet, mas não apenas como imagens. Um projecto destes, para ter uma lógica científica, tem que obedecer a diversos princípios: primeiro, o formato das digitalizações tem que ser uniforme, e não sei se todos os microfilmes existentes têm o mesmo formato; depois, têm que ser digitalizações de alta resolução, preferencialmente a cores, para servirem o propósito da conservação para gerações futuras (não vá acontecer algo aos originais!); por fim, têm que ser correctamente transcritos em ficheiros de texto / XML, para facilitar a pesquisa histórica e genealógica. Uma vez que, até ao momento (nem se espera que aconteça em breve), não existe nenhuma aplicação informática com capacidade de Reconhecimento Óptico de Caracteres para escrita cursiva (a utilizada na maioria dos textos dos registos) com um nível de acerto aceitável (ou seja, próxima do ROC para texto manuscrito não-cursivo, >= 98%), esta tarefa teria que ser realizada por meios humanos. Além disso, seriam necessários voluntários para digitalizar 1) o que ainda não está digitalizado, 2) as cópias de má qualidade e 3) os registos em formatos inaceitáveis para este projecto. A parte da digitalização seria, creio, o menor dos problemas, bastando para isso delinear um processo de transferência e optimização dos recursos existentes (microfilmes) para formato digital, restando pouco que digitalizar ou redigitalizar, imagino. A grande questão surge na transcrição manual dos registos para formato de texto. Isto implicaria: 1) formação de recursos humanos em paleografia e normas de transcrição paleográfica, por forma a serem capazes de transcrever correctamente os registos (principalmente no caso dos registos mais antigos); e 2) a existência de um sistema de verificação das transcrições (ou seja, pelo menos mais 2 pessoas, além do transcritor, a verificar a existência de erros em cada registo). Ora isto, em termos de mão-de-obra, já seria considerável. Daí eu estar a analisar a viabilidade de um tal projecto. As principais questões que me coloco: qual a quantidade (número de páginas) de registos que existem, ao todo? Tomando como exemplo o A.D. Beja (que conheço um pouco melhor), existem mais de 10.100 livros de registos em arquivo. E este será, certamente, um dos menores arquivos. Que quantidade de pessoas seria necessária para transcrever todos os registos, e em quanto tempo? Eu insisto na transcrição dos registos porque, creio, a simples disponibilização das imagens via internet, pouco acrescentaria ao que já existe ou está planeado existir. E imagine as possibilidades: atribuição de categorias a termos (ou seja, atribuir a algumas palavras do registo uma categoria, como "parentesco", "nome próprio masculino", "nome próprio feminino", "sobrenome" ou "apelido", "topónimo", "data", etc). Isto implicaria que fosse possível realizar todo o tipo de análises às bases de dados em poucos segundos, com uma possibilidade próxima de 100% de encontrar o que se pretendia. Permitia também aos historiadores fazer todo o tipo de análises estatísticas sobre a globalidade dos registos existentes no país, algo inédito até agora. Enfim, as ideias são muitas, mas antes há que ultrapassar os problemas que se colocam, para pensar sequer em propôr um tal projecto! Se existisse uma possibilidade de utilizar o ROC para escrita cursiva, teríamos a possibilidade de reduzir os recursos necessários consideravelmente. Mas não creio que a tecnologia vá evoluir muito nesse ponto, nos próximos tempos. Como tal, há que ser criativo, e tentar encontrar soluções alternativas. Talvez prescindir do sistema de verificação e, aquando da disponibilização dos registos na internet, disponibilizar a possibilidade de os utilizadores poderem apontar erros em cada registo. Esses seriam então sujeitos a verificação e, confirmando-se o erro, à sua correcção. Ainda assim, os recursos humanos necessários seriam consideráveis, mesmo que apontássemos para um prazo de execução algo prolongado (5 anos, imaginemos). Enfim, todas as ideias são bem-vindas! :) Cumprimentos T.Penedo |
|
| © 2000 - 2013 BGL / Guarda-Mor / Geneall |
|
