Tcap-cap2-menuthumb.png

La investigación de fuentes secundarias tiene una función importante en la generación de documentación en general. Dentro de un esfuerzo de Mapeo de Soluciones, las fuentes secundarias nos ayudan a crear una base de conocimiento bibliográfico a partir de esfuerzos previos. Además, en muchos casos, la investigación de fuentes secundarias nos ayudará a identificar dónde podemos ir a mapear soluciones y quiénes son los actores que deberíamos considerar en la búsqueda.

Elaborar un inventario de fuentes[edit | edit source]

Antes de iniciar a recolectar la información, es útil elaborar un listado de posibles fuentes a consultar, las cuales pueden ser institucionales o externas. Este registro puede contener el nombre de la fuente, el formato (documento, recurso audiovisual, etc.), la fecha y la forma de acceso (físico o digital). Algunos de los formatos de estas fuentes pueden consistir en:

  • Reportes y publicaciones institucionales: A menudo es posible encontrar material en repositorios institucionales que contiene información sobre soluciones.
  • Materiales instructivos: Estos se refieren específicamente a guías y otros materiales con el objetivo de enseñar a reproducir las soluciones.
  • Investigaciones: Documentos sobre revisiones bibliográficas, bases de datos de soluciones o análisis comparativos.
  • Material audiovisual documental: Este incluye material para uso interno como los recursos mantenidos por los equipos de campo, material externo de prensa y material utilizado para publicaciones, por ejemplo, el de las redes sociales.

En muchos casos, existe mucha información documental de utilidad en formatos físicos, como por ejemplo fotografías o manuales impresos que contienen información sobre soluciones valiosas. Una manera de generar un registro de estas es digitalizándolas.

Consejos para la digitalización de materiales impresos[edit | edit source]

Existen algunas acciones para mejorar la calidad del material obtenido después de la digitalización, aunque muchas veces se requiere contar con habilidades técnicas, sin embargo, con la lectura y asesoría correspondiente todos podemos lograrlo. Así entonces, se recomienda lo siguiente:

Utilizar un escáner de ser posible[edit | edit source]

A pesar de que la calidad de las cámaras en los teléfonos inteligentes es cada vez mejor, la digitalización de documentos impresos realizada sin el equipo adecuado puede ser difícil de leer, comparada con la que se hace con un escáner comercial o incluso con una cámara con la iluminación correcta y un pedestal. Esta última siendo una alternativa de bajo costo.

Utilizar un software de reconocimiento de textos[edit | edit source]

Los OCR (en inglés, reconocimiento óptico de caracteres) son un tipo de software que reconocen el texto a partir de imágenes digitalizadas con un escáner o una cámara fotográfica. El uso de un OCR facilita la posterior búsqueda de texto de estos contenidos y su conversión en otros formatos.

Existen también aplicaciones de escáners (usualmente de pago) que ofrecen esta opción integrada, lo cual facilita el proceso. No obstante, también existen algunas herramientas de licencia abierta que pueden utilizarse sin ningún costo con resultados similares.

Cabe destacar que no todo el texto obtenido por un OCR es perfecto, por lo que deberá ser limpiado en algunos casos para facilitar su uso posterior.

Convertir a formatos amigables[edit | edit source]

Dado que los OCR pueden cometer errores según la calidad del material fuente y la calidad de la digitalización obtenida. El material resultante será de mejor calidad. Una vez este proceso ha finalizado, en el caso de aquellos materiales que serán utilizados por muchas personas se recomienda transferir el material a formatos que faciliten la revisión del contenido. Algunos ejemplos son:

  • .txt: texto plano, puede abrirse en una gran cantidad de computadoras y otros dispositivos de diversos tipos.
  • .epub: un formato para la publicación de textos para la lectura. Este formato puede ser utilizado para añadir imágenes y compartirlas con los lectores de libros digitales.
  • .html: el formato de hipertexto utilizado para páginas web, el cual puede abrirse en cualquier computadora con un navegador web.

Extraer imágenes y datos[edit | edit source]

Muchos materiales impresos poseen recursos como imágenes o tablas que pueden servir para consulta o incluso para ser editados y reutilizados. Una práctica útil durante el proceso de digitalización es la de extraer este contenido por separado. Una tarea que requiere habilidades básicas de edición de imágenes y paciencia para extraer el material, organizarlo y hacerlo disponible para otras personas a través de repositorios abiertos. Sin embargo, los beneficios colectivos de contar con este tipo de materiales en buena calidad son muchos.

Ejemplo de digitalización
Screengrab of Scammell's Cyclopedia of Valuable Receipts (1897).png

Un par de buenos ejemplos de este proceso de digitalización y organización del contenido es el trabajo realizado por Wikimedia Commons e Internet Archive. Su sitio contiene una gran cantidad de material documental de organizaciones que han digitalizado y preparado para su preservación.

A continuación mostramos una enciclopedia digitalizada y liberada como recurso abierto (en el dominio público) en ambos sitios:

Recursos[edit | edit source]

  • Tabula es una herramienta para extraer tablas de datos a partir de un documento en PDF.
  • Tesseract es un software de licencia abierta para OCR.
  • Kadmos que puede ser integrado como plugin OCR para el software de manejo de imágenes IrfanView

Referencias[edit | edit source]


Cookies help us deliver our services. By using our services, you agree to our use of cookies.