lunes, 29 de agosto de 2016

Web Superficial y Web Profunda

Para buscar bien, es imprescindible tener en cuenta, que además de los buscadores convencionales, hay disponibles otras fuentes específicas de información.
Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web superficial o visible. Lo que resta, la Web profunda o invisible, es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito) y otros tipos de contenidos que no aparecen entre los resultados de una búsqueda convencional.

La Web Profunda o invisible

Web invisible es el término utilizado para describir toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos. Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP, etc.) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta.
Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca (the opaque Web), la Web privada (the private Web), la Web propietaria (the proprietary Web) y la Web realmente invisible (the truly invisible Web).

La Web opaca 

Está compuesta por archivos que, si bien podrían estar incluidos en los índices de los buscadores, no lo están por alguno de los siguientes motivos:
  •  Extensión de la indización: a veces, por economía, no todas las páginas de un sitio son indizadas en los buscadores.
  •  Frecuencia de la indización: los buscadores no poseen la capacidad de indizar todas las páginas existentes; a diario se agregan y modifican muchas y la indización no se realiza al ritmo que permita incluirlas a todas.
  •  Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados, generalmente limitan el número de documentos que se muestran (entre 200 y 1000).
  •  URL desconectadas: las generaciones más recientes de buscadores, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados en otros. Si un documento no tiene un link a él, desde otro documento, será imposible que la página sea encontrada, pues no se encuentra indizada.

La Web privada 

Consiste en las páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos:
  •  Las páginas están protegidas por contraseñas.
  •  Contienen un archivo “robots.txt” para evitar ser indizadas.
  •  Contienen un campo “noindex” para evitar que el buscador pueda indizar la parte correspondiente al cuerpo de la página.
Este segmento de la Web contiene, en general, documentos excluidos deliberadamente por su falta de utilidad. Ya que son los dueños de la información que contienen, los que deciden que no se encuentre disponible, por lo que difícilmente se podrán encontrar mecanismos legítimos para franquear esa barrera.

- La Web propietaria incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o arancelada.
- La Web realmente invisible se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.

Veamos algunos de los recursos de búsqueda en la Web Profunda, que si bien los sitios están desarrollados en idioma inglés, las búsquedas pueden realizarse en español, utilizando los cuadros de texto.
  •  The WWW Virtual Library (http://vlib.org/) se considera el catálogo más antiguo en la web y fue iniciado por Tim Berners-Lee, el creador de la web.
  •  Academia.edu (https://www.academia.edu) es una red social 2.0 para investigadores que cuenta con un directorio de más de 12.000 publicaciones científicas de todo el mundo, facilitando la tarea de los que buscan artículos para sus trabajos. Lanzado en septiembre de 2008, se convirtió en uno de los mayores sitios de redes sociales para universitarios en el año 2010. Actualmente tiene 830.000 visitantes mensuales y cuenta con más de 191.000 académicos de todo el mundo.
  •  Reefseek.com (http://www.refseek.com/) es un motor de búsqueda en Internet para estudiantes e investigadores que tiene como objetivo hacer que la información académica sea de fácil acceso para todos. Busca en más de un billón de documentos, incluyendo páginas web, libros, enciclopedias, revistas y periódicos, intentando eliminar cualquier resultado no relativo a ciencia e investigación.
  •  Jurn (http://www.jurn.org) es otro motor de búsqueda que permite buscar en millones de artículos libres académicos, capítulos y tesis de múltiples disciplinas (Artes, Historia, Humanidades, Negocios, Economía, Ecología, Ciencia y más).
  •  Microsoft Academic Search (http://academic.research.microsoft.com/) el buscador académico de Microsoft.
  •  TechXtra (http://techxtra.tradepub.com/) centra su información, en ingeniería, matemáticas e informática. Es posible navegar a través de una extensa lista de revistas gratuitas especializadas de ingeniería, documentos técnicos, descargas y podcasts.
  •  Ciencia (http://ciencia.science.gov/) es la versión en español del portal Science.gov (http://www.science.gov/ ) para la búsqueda de información científica e investigación del gobierno de los Estados Unidos de América. Puede indexar más de 60 bases de datos y 200 millones de páginas con información científica para mostrar los resultados por subtemas, autores o fechas. También ofrece la posibilidad de búsqueda avanzada y búsqueda de imágenes.


martes, 16 de agosto de 2016

La Búsqueda Avanzada


La búsqueda avanzada es un tipo de búsqueda que posee características adicionales soportadas por un motor de búsqueda o buscador. Suele ser una opción de elección libre en los buscadores, programas, herramientas y servicios online.

Una búsqueda simple generalmente consta de un cuadro de texto en el que se ingresa una cadena de caracteres, en cambio, las búsquedas avanzadas suelen contar con múltiples cuadros de texto, casillas de verificación y otros elementos incluidos habitualmente en los formularios. Por lo general, estos elementos permiten aplicar filtros a la búsqueda básica, para obtener resultados más exactos.

La Búsqueda avanzada de Google, ofrece numerosas opciones para realizar búsquedas con mayor precisión y obtener resultados más útiles.
Además de la introducción de términos en el campo de búsqueda, Google ofrece otras opciones, que nos permiten encontrar páginas que contengan:
  • - Todas las palabras que se mencionan
  • - Una frase exacta
  • - Cualquiera de una serie de palabras
  • - Ninguna de las palabras que se mencionan
  • - Valores comprendidos en un determinado intervalo


Por ejemplo, si realizáramos una búsqueda referida a la búsqueda de una cámara digital para su compra, la queremos con batería recargable, que sea réflex o HD, que no sea color rojo y que tenga una resolución entre 16 y 24 megapíxeles; deberíamos rellenar seis campos de la búsqueda avanzada.

Para realizar la misma búsqueda de la forma habitual, es decir mediante el cuadro de búsqueda y por palabras claves, deberíamos escribir:

cámara digital reflex OR HD "batería recargable" -rojo 16mp..24mp

 Sin embargo, en la búsqueda avanzada además podemos restringir los resultados por: idioma, región, fecha de la actualización del artículo, podemos ingresar la URL de un sitio específico, dónde deben aparecer los términos que ingresamos (en el título, descripción o en cualquier parte de la página), los resultados más relevantes, el tipo de archivo (esto es muy útil ya que por ejemplo podemos seleccionar, documentos de texto, PDF, presentaciones multimedia, planillas de cálculo, entre otros) y finalmente por los derechos de uso del material.


Más información en la ayuda de Google de Búsqueda Avanzada

La búsqueda avanzada de imágenes

Una de las opciones de las que dispone Google es la búsqueda de imágenes, tan solo tenemos que hacer clic sobre el vínculo Imágenes y automáticamente Google cambia la interfaz. Escribiremos en el cuadro de búsqueda la palabra clave asociada a la imagen y pulsaremos sobre “Buscar imágenes”.

La búsqueda de imágenes de Google permite además de agregar términos en el cuadro de búsqueda, buscar por imagen, es decir, ingresar la URL de una imagen o subir un archivo de imagen desde nuestro ordenador

La Búsqueda avanzada de imágenes de Google, también nos ofrece numerosas opciones para filtrar información y realizar búsquedas con mayor precisión: entre otras posibilidades seleccionar el tamaño, proporción, color, tipo de imagen, tipo de archivo entre otras posibilidades.

http://www.google.es/advanced_image_es

Valoración de lo aprendido

Para terminar, indicar que, gracias a este curso y al hecho de conocer todos los entresijos de las búsquedas en Internet, habrá un antes y un después en mi forma de usar la red a patir de ahora, con una indudable mejora en mis resultados y, sobre todo, en mi rendimiento.
Por otra parte, la experiencia de crear una presentación compartida desarrollando en profundidad todo lo relacionado con las palabras clave, ha significado un grato aprendizaje sobre una herramienta nueva para mí y de múltiples posibilidades  para el futuro.

miércoles, 10 de agosto de 2016

Las mejores herramientas de búsqueda

Hay multitud de recursos en Internet que proveen diferentes resultados de búsqueda. En cada caso se realiza de un modo diferente y, en fución de sus propias características y metodología, se podría hacer una clasificación con los siguientes tipos:
  • buscadores
  • metabuscadores
  • directorios
  • guías
  • y software especializado

A continuación se describe detalladamente en un mural, la clasificación de las diferentes herramientas de búsqueda de información en Internet, su funcionamiento y alcance:


lunes, 1 de agosto de 2016

“La infoxicación”


¿Cómo surge el término y qué significa?
Surge en 1996 y se refiere al estado de contar con demasiada información para tomar una decisión o permanecer informado sobre un determinado tema.


¿Quién introdujo el término y a qué concepto se refiere?
El término infoxicación fue introducido por Alfons Cornella y se refiere a la idea de la sobrecarga de información que recibe un usuario, en especial de Internet en todas sus formas.


¿Cómo puede la sobreabundancia de información afectar nuestro rendimiento?
Afecta a nuestro rendimiento personal  y profesional, porque dificulta la desconexión de nuestra mente y la obliga a realizar un sobreesfuerzo.


¿Cómo podríamos conseguir una mejora en nuestra productividad personal?
El profesor de la Universidad de Neva York, Clay Shirky, aseguró en la Expo Web 2.0 de 2010, que "El problema no es la sobrecarga de información, es que el filtro no funciona".

En el universo de la información, hay que tener muy claro cuál es nuestra información crítica, es decir, aquello de lo que no podemos dejar de estar informados y luego saber preguntar con las preguntas correctas y las fuentes adecuadas. Debemos preguntarnos:


Para conseguir la mejora de nuestra productividad, necesitamos recibir la información adecuada y conocer cuáles son los los cinco temas fundamentales, los cinco secundarios y la lista de información crítica y focalizarnos en cada uno de los temas fundamentales vinculados a nuestro trabajo, estudio o vida social.



Lista de información crítica para cada tema:

 En definitiva según Cornella,