Periodismo Digital: 2. El Ciberespacio como fuente de informació

La información en el ciberespacio descansa en bases de datos de bibliotecas virtuales, información jurídica y parlamentaria, agencias de noticias, instituciones públicas y privadas. El hecho de que las carreteras de la información signifiquen fuentes para los periodistas digitales, implica la búsqueda de información en la Red para encontrar el sitio adecuado en el momento preciso.

La información que se difunde por internet tiene el problema de la falta de credibilidad, por lo tanto el periodista digital de contar con suficientes criterios para valorar la veracidad de las informaciones que obtenga; pues muchos de los datos que viajan por la Red no son fuentes confiables para el usuario ni para el periodista, por lo mismo éste último deberá cotejar y verificar sus fuentes.

En Internet, una de las desventajas es constar la credibilidad de las fuentes o la rigurosidad de los datos que se ofrecen. El anonimato frecuente detrás de las informaciones es un motivo para dudar de la veracidad de los mensajes. Por lo mismo, los poseedores de un título o de una marca que haya obtenido ya que el reconocimiento del mercado tradicional serán más consultados en los ciberespacios: los buscadores.

2.1 Buscadores

Un motor de búsqueda, también conocido como buscador o browser , es un sistema informático que busca archivos almacenado en servidores web gracias a su spider (o Web crawler). Un ejemplo son los buscadores de Internet (algunos buscan sólo en la Web pero otros buscan además en noticias, servicios como Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones Web en los que se mencionan temas relacionados con las palabras clave buscadas.

Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en día Internet se ha convertido en una herramienta, para la búsqueda de información, rápida, para ello han surgido los buscadores que son un motor de búsqueda que nos facilita encontrar información rápida de cualquier tema de interés, en cualquier área de las ciencias, y de cualquier parte del mundo.

Se clasifican en dos tipos:

§ Índices temáticos: Son sistemas de búsqueda por temas o categorías jerarquizados, aunque también suelen incluir sistemas de búsqueda por palabras clave. Se trata de bases de datos de direcciones Web elaboradas "manualmente", es decir, hay personas que se encargan de asignar cada página web a una categoría o tema determinado. Por ejemplo existen buscadores de fauna, flora, también existe un buscador educativo, de música y de diferentes áreas.

§ Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases de datos que incorporan automáticamente páginas web mediante "robots" de búsqueda en la red.

Buscadores jerárquicos (Arañas o Spiders)

§ Recorren las páginas recopilando información sobre los contenidos de las páginas. Cuando se busca una información en los motores, ellos consultan su base de datos y presentan resultados clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la página de entrada, a todas las páginas que residan en el servidor.

§ Si se busca una palabra, por ejemplo, “ordenadores”. En los resultados que ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta palabra en alguna parte de su texto.

§ Si consideran que un sitio web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, sólo almacenan una o más páginas.

§ Cada cierto tiempo, los motores revisan los sitios, para actualizar los contenidos de su base de datos, por tanto puede que los resultados de la búsqueda estén desactualizados.

§ Los buscadores jerárquicos tienen una colección de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -arañas (spiders)-, los que construyen la base de datos y los que utiliza el usuario, el programa que explota la base de datos.

§ Si se paga, se puede aparecer en las primeras páginas de resultados, aunque los principales buscadores delimitan estos resultados e indican al usuario que se trata de resultados patrocinados. Hasta el momento, aparentemente, esta forma de publicidad es indicada explícitamente. Los buscadores jerárquicos se han visto obligados a comercializar este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.

§ Ejemplos de arañas: Google, Bing, Hotbot.

Directorios

Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se requieren muchos recursos de informática. En cambio, se requiere más soporte humano y mantenimiento.

§ Los algoritmos son mucho más sencillos, presentando la información sobre los sitios registrados como una colección de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página, como el título y la descripción que se introduzcan al momento de registrar el sitio en el directorio.

§ Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra el sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es más fácil encontrar páginas del tema de nuestro interés.

§ Más que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática del sitio.

§ Su tecnología es muy barata y sencilla.

Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo!, Terra (antiguo Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son directorios.

Lista de Motores de Búsqueda:

· Google es un motor de búsqueda de muy fácil manejo, recomendado cuando se quiere hacer una primera búsqueda sobre un tema sobre el que no se conoce demasiado. Se distingue por su sistema de ordenar las respuestas, basado en las veces que las páginas web encontradas son enlazadas por páginas de calidad contrastada, junto con factores como la proximidad en el documento de las palabras clave o de las frases introducidas como palabras clave. Es uno de los motores de segunda generación que persiguen mejorar y hacer más pertinente el modo de presentar los resultados al usuario. Para muchos es hoy día el mejor motor existente, además de ser el más grande. Otras características que lo hacen recomendable es su 'búsquedas difusas' que permiten buscar sinónimos, definiciones, páginas similares y relacionadas, etc. Además posee motores específicos como el académico Google Académico, o el motor de búsqueda de libros Googl e. Búsqueda de libros.

· Yahoo! Search es otra opción. Tiene una base de datos bastante grande y muestra las páginas utilizando un orden de relevancia basado en la situación y la proximidad de las palabras que le hemos suministrado. Tiene muchas posibilidades de buscar datos a través de atajos. Permite búsqueda booleana completa

· Ask.com, en un motor de búsqueda más pequeño que otros en cuanto a número de páginas. Su sencillez y su capacidad de priorizar los resultados, en función de la especificidad de los buscado y la popularidad dentro de la misma materia, hacen de este motor de búsqueda una opción interesante.

· Altavista es otra buena opción de inicio. Fue en otro tiempo el motor más usado y todavía es una opción a considerar

· Alltheweb es hoy en día uno de los motores de búsqueda generalista más grande que existen, con centenares de millones de páginas web en su base de datos. También es de los más rápidos. Es además fácil de usar aunque ofrece capacidades de búsqueda sofisticada limitadas. Es por ello adecuado cuando se quiere buscar sobre un tema sobre el que no se conoce demasiado.

· Existen, por supuesto, motores nacionales y versiones en castellano de los motores internacionales. La tendencia es hacia la unión entre varias empresas por lo que las fronteras entre lo nacional y lo internacional también tienden a borrarse. Un motor con fuerte presencia en su base de datos de páginas europeas es Euroseek. Se puede conectar con los motores nacionales existentes a través del Buscopio.

2.1.1 Como funcionan

El motor de búsqueda más popular, Google, contiene más de 3.000.000.000 sitios web. Cuando introduces una frase o palabra, el motor buscará en su base de datos y devolverá resultados en un orden que estará determinado por su propio algoritmo.

Así pues, ¿cómo consiguen al principio toda esa información?

Arañas (spiders)

Los motores de búsqueda emplean el uso de arañas para recopilar la información de los sitios web. Las arañas rastrean los sitios web recopilando datos y siguen los enlaces que hay en las páginas. Las arañas rastrean Internet casi continuamente, recolectando las páginas nuevas y actualizadas de la Web para mantener sus resultados al día.

Tratamiento de Datos

Los datos que las arañas extraen son tratados de forma diferente por los diversos motores de búsqueda. Los motores de búsqueda ponen el 'peso' en diferentes componentes de un sitio web y en cómo se integra en la Web. De esta manera determinan el orden en el que los sitios web deben aparecer en los resultados de una búsqueda (las páginas que contienen los resultados de la búsqueda son llamadas comúnmente SERPS- search engine result pages).

Entrando

La mayoría de los motores de búsqueda ponen al día sus bases de datos al menos una vez al mes con la información recopilada por sus arañas. Esto es importante saberlo cuando se tiene un sitio web relativamente nuevo - si pones tu sitio web por primera vez en la red al final de un 'rastreo' y las arañas no lo encuentran, tendrás que esperar hasta la actualización siguiente para entrar a formar parte de la base de datos. Una vez el sitio web entra la base de datos todavía llevará una o dos actualizaciones más antes de que el nuevo sitio web se estabilice en los resultados de las búsquedas.

Por pasos:

· Una araña visita tu página Web.

· La araña lee el contenido de tu página Web.

· La araña lleva toda la información a una central, donde un sistema la procesa y la almacena.

· El sistema crea un índice con las palabras que utilizas en tu Web y las ordena por relevancia.

· El sistema intenta descubrir si eres una buena página o no (en realidad comprueba cuanta gente recomienda tu Web y cuán importante es la gente que recomienda tu Web).

· Cuando alguien realiza una búsqueda, y el sistema muestra todas las webs que contienen la palabra o frase buscada.

2.1.1 Estrategias de búsqueda

Ben Internet es una tarea difícil por la gran cantidad de información, la ausencia de clasificaciones consistentes, las diferentes herramientas de búsqueda, los diversos modos de buscar, las presiones comerciales.

Para conseguir llevar a cabo una buena búsqueda son necesarios tres aspectos fundamentales:

· Diseñar un perfil de búsqueda adecuado; es decir hay que tener la habilidad de emparejar con exactitud los términos que se eligen para construir el perfil de búsqueda con los que se encuentran en los documentos cuya información se quiere encontrar

· Conocer el tamaño y contenido de la herramienta de búsqueda que se elige.

· Conocer las posibilidades que ofrecen las diferentes herramientas de búsqueda para recuperar los contenidos de su base de datos

El sistema más usual para la búsqueda son los motores de búsqueda trabajados en base a una estrategia sobre su manejo adecuado.

Pasos para una buena búsqueda:

- Antes de describir las diferentes herramientas de búsqueda que están disponibles es necesario analizar el tema antes de comenzar. Hay que formular correctamente lo que queremos saber y traducir esta pregunta a un perfil de búsqueda, utilizando los términos más adecuados. En Internet no hay vocabulario controlado, por lo que habrá que buscar palabras clave y cuantos sinónimos sean posibles para poder llevar a cabo la búsqueda correctamente. Además habrá que establecer relaciones entre las palabras, por si es posible llevar a cabo una búsqueda con operadores booleanos.

- Si se pretende hacer una navegación para ver lo que hay sobre un tema sobre el que se conoce algún sitio específico o términos específicos lo mejor es usar alguno de los motores sencillos de utilizar como Google o Ask. Son herramientas muy útiles que permiten obtener rápidamente una información que suele dar una primera respuesta a nuestra necesidad informativa, con frecuencia la que necesitamos. Estos buscadores también son un buen sitio donde empezar si no se conoce muy bien el tema sobre el que se busca información. El problema es que se pueden recuperar demasiados enlaces.

- Si se conoce bien lo que se quiere buscar lo mejor es utilizar los motores específicos, recurrir a la parte profunda de internet y/o las opciones avanzadas de los principales motores de búsqueda. Si hemos empezado por uno de los motores anteriores y hemos obtenido demasiados enlaces y no podemos explorarlos todos y conocemos bien el tema sobre el que estamos buscando información lo mejor es hacer una búsqueda lo más específica posible con buscadores específicos. En el caso de necesidades específicas siempre puede resultar necesario recurrir a bases de de datos específicas que solo son accesibles utilizando las herramientas que permiten acceder a esta parte de Internet. En todo caso todas las potencialidades de búsqueda avanzada de alguno de los grandes buscadores como los citados en el párrafo anterior, Altavista o Yahoo u otros deben utilizarse también en este caso.

- Utilizar los directorios de materias. Si en los pasos anteriores se han obtenido demasiados enlaces como para buscar la información que responda a la pregunta de partida los directorios por materias permiten un acercamiento a recursos seleccionados desde lo más amplio a lo más específico por grandes áreas temáticas. Ahora bien sus bases de datos no tienen demasiados recursos y si no tienen motor para buscar en su propia base de datos desplazarse por sus clasificaciones temáticas no siempre es una tarea fácil.

- Si ninguno de los métodos anteriores nos conduce al éxito, otra opción consiste en buscar la ayuda de un experto participando en lista de interés o buscando la información en grupos de noticias. Para saber si hay alguna lista que discuta el tema de nuestra incumbencia -en ellas con frecuencia participan verdaderos expertos en la materia- lo mejor es recurrir a directorios que nos pueden ayudar a localizarla como los que están accesibles a través de recursos como Topica o Tile.net. Para buscar aquello que se discute en los grupos de noticias -habitualmente de tono menos académico- se puede recurrir a una de las opciones del motor de búsqueda más recomendado Google Groups.

2.1.4 Otros sistemas de acceso a la información periodística

2.1.4.1 Correo electrónico

Ésta, es quizás, la aplicación más conocida y extendida de la red de Internet. Los científicos que trabajaban en el desarrollo de las redes que formarían la Internet actual encontraron una segunda utilidad que pronto se convertiría en la estrella de las nuevas posibilidades abiertas por la interconexión de ordenadores: la de intercambiar mensajes más o menos personales, de contenido no siempre relacionado con la investigación y el desarrollo, que circulaban por la Red desde el ordenador del remitente o emisor del mensaje hasta el ordenador del destinatario.

¿Qué pasaba? Se estaba emulando la forma tradicional de correo para construir una nueva: el correo electrónico, en el que los mensajes formados inicialmente sólo por textos más o menos largos encerrados dentro de un sobre intangible con la dirección del remitente y destinatario, se transportaba por la Red pasando de unos ordenadores a otros.

La dirección de correo electrónico está formada por una dirección personal única e inequívoca. Ejemplo: ciberperiodismo@xxxxxxx.com . En donde ciberperiodismo es el nombre del remitente el signo “@” es como decir “at” que significa “en” y el .com quiere decir “compañía” pero bien puede ser cualquier otro dominio: .org (organización) .es (España) .mx (México) .fr (Francia) .ar (Argentina) etc.

Además de facilitar la comunicación interpersonal, el correo electrónico también permite la comunicación de un grupo de investigadores disperso geográficamente, ya sea para construir una conferencia electrónica, sin presencia física, ya sea para recibir de forma periódica una revista electrónica. Para pasar información a sus colegas.

En un principio sólo se podía enviar texto. Había limitaciones en el contenido del mensaje. Estas limitaciones fueron eliminadas con el desarrollo del correo multimedia. De manera que ahora, al texto se le puede añadir (adjuntar) cualquier tipo de información: pdf, documentos de Word (.doc), Power Point (.ppt), Excel. Imagen en cualquier formato (png, jpeg, mapa de bits), video. Etc.

2.1.4.2 Wikis

Wiki-wiki significa "rápido" en hawaiano, aunque se redujo únicamente a Wiki para. Es el nombre que el programador de Oregón, Ward Cunningham, escogió para su invento, en 1994: un sistema de creación, intercambio y revisión de información en la web, de forma fácil y automática. Desde entonces, Wiki se ha ganado las simpatías de los internautas, que lo usan para comunicación en grupos de trabajo, creación de enciclopedias o escritura colectiva de novelas.

La finalidad de un Wiki es permitir que varios usuarios puedan crear páginas web sobre un mismo tema, de esta forma cada usuario aporta un poco de su conocimiento para que la página web sea más completa, creando de esta forma una comunidad de usuarios que comparten contenidos acerca de un mismo tema o categoría.

Wiki sólo se entiende usándolo, dicen los iniciados, y es terriblemente sencillo cuando se intenta: "Escribes algo en la página, le das al botón de salvar y a continuación ya está allí para todo el mundo. No se necesita ser un experto en HTML (lenguaje de programación para webs), ni tener un espacio en algún sitio. Basta un teclado y un navegador.. Y tener algo que decir", explica Gonis, colaborador de la Enciclopedia Libre Universal, un esfuerzo colectivo basado en esta tecnología. "Es muy divertido y adictivo", añade su compañero Atlante.

¿Qué es Wiki? "Un gigantesco tablón de anuncios donde cualquiera puede poner sus notas, borrar o modificar las de otros o crear enlaces", dice Javier de la Cueva, también promotor de la Enciclopedia. Y Juan Antonio Ruiz: "Son sitios web escritos en colaboración por un grupo de usuarios, que tratan sobre un mismo tema. Cualquiera que llega a un Wiki puede participar de inmediato y sus aportaciones son comentadas, ampliadas o corregidas por el resto. Para mí, es la primera herramienta verdaderamente útil en la gestión del conocimiento en red".

Su gran flexibilidad nace de la propia estructura de la tecnología que, al estilo Gnutella, permite la creación de programas "clones", llamados "Wikiengines". Los hay a decenas, escritos en diversos lenguajes de programación, como UseModWiki o Twiki, que usan Perl, o JikiJikiJava, o PhpWiki, muchos de código abierto. Aunque pueden alojarse en cualquier servidor, existen las llamadas "Wikifarms" (granjas de Wikis), servidores que albergan a buen número de ellos.

Todos los Wikis comparten unas normas, que permiten su funcionamiento correcto a pesar de la anarquía aparente. Las páginas tienen al final un enlace: "Editar esta página", que permite al visitante añadir comentarios en el mismo momento, al estilo de un foro, pero también editar los demás o borrarlos. Otro enlace común es "Cambios recientes", donde se listan las modificaciones hechas en el Wiki. Los participantes más activos monitorizan regularmente esta página, para detectar y revisar los últimos movimientos. Suelen ser todos voluntarios. Y está bien visto firmar con el nombre real, aunque también se prevé la figura del anónimo.

La esencia del invento, que aprovechan especialmente las diversas Wiki-enciclopedias, es la "revisión por iguales", definida como: "Método usado para mejorar la calidad de los trabajos escritos, deja abierto el trabajo al escrutinio y, frecuentemente, la anotación o edición por un número de autores iguales en rango al autor. El principio empleado es que distintas personas verán distintos errores, incrementando de esta forma la oportunidad de encontrarlos y enmendarlos. Esta tradición es conocida desde hace tiempo, en la comunidad académica, y permite incrementar la calidad del trabajo".

El archivo y recuperación de la información se organiza con enlaces, muy fáciles de crear, y también categorías jerárquicas, que permiten subir directorios hasta la raíz. Una de las pocas críticas que se hacen a Wiki es su inseguridad, al permitir que cualquiera pueda borrar los textos. A eso replican los expertos que siempre se guardan copias, que es posible proteger con contraseña el acceso a un Wiki y, además, dice el "Wiki Philosophy Faq": "La gente es más gentil de lo que imaginas".

En los últimos meses, se ha vivido una pequeña explosión de Wikis en castellano, como el de Andalucía Wireless, GnuEsWiki, WikiMemética y la conocidísima Wikipedia.

2.1.4.3 IRC

El IRC, acrónimo de Internet Relay Chat, es un sistema de conversación en tiempo real para usuarios de Internet. Para poder participar solo es necesario disponer de un programa cliente de IRC (consulte la sección Clientes de IRC) y una conexión a Internet.

El IRC permite que múltiples usuarios se reúnan simultáneamente en tertulias o debates, en los cuales cada uno va expresando sus opiniones de forma escrita y en tiempo real. Esta es la diferencia fundamental entre IRC y las USENET (las llamadas news o foros de debate) - estas últimas se asemejan más a una publicación en la que cada usuario lee lo que han escrito los demás, pudiendo insertar su artículo en espera de que sea leído más tarde, cuando le llegue al resto de subscriptores.

Para participar en IRC solo es necesario conectarse a Internet en la forma habitual, ejecutar el programa cliente de IRC, y acceder a alguno de los muchos servidores de repartidos por todo el mundo. Gran cantidad de estos servidores se encuentran conectados entre sí, formando lo que son conocidas como redes de IRC, que permiten que usuarios conectados a un servidor europeo hablen con usuarios conectados a un servidor australiano, por ejemplo.

Las tertulias de IRC se reúnen en canales (conocidos en otros entornos como grupos, rooms) donde coinciden varios usuarios conversando simultáneamente sobre los más diversos temas. Existen canales muy específicos en los que se intenta debatir sobre un tema concreto, canales creados para agrupar simplemente a usuarios de un mismo idioma o cultura y charlando sobre cualquier tema, o simples reuniones de amigos.

Cualquier usuario puede abrir un canal a su gusto, llamarlo como desee si en esa red no existe ya otro con ese mismo nombre, y simplemente esperar a que lleguen otras personas.

El interés para crear un canal puede ser variado, incluso es posible hacer que el canal sea secreto y no aparezca en la lista de canales disponibles, siendo solo accesible a aquellas personas que ya conocen previamente de su existencia; también se puede hacer que un canal sea solo para invitados; se limite a un máximo de participantes; esté moderado y solo tengan la palabra las personas autorizadas a ello.

Además, siempre que estemos hablando en un canal podemos vernos interesados en hablar con alguno de los usuarios que están en él de forma privada. El IRC nos permite hablar con alguna persona de forma privada sin que otras personas sepan.

El IRC es un sistema de comunicaciones multiplataforma, es decir, puede poner en contacto ordenadores que funcionen bajo las más diversas arquitecturas y sistemas operativos (Unix, OS2, Windows), sólo es necesario que cada uno disponga del programa cliente apropiado a sus características, y conexión a un servidor.

Los programas clientes más habituales y extendidos por su sencillez son los que están diseñados para el entorno del sistema operativo Windows, tanto en 16 como en 32 bits; los más potentes son los construidos para los distintos entornos Unix, si bien estos son mucho menos populares debido a la mayor profesionalidad y conocimientos que su manejo exige.

Cuando un usuario ejecuta su programa cliente de IRC, y antes de conectarse, debe de especificar algunos de los datos que lo identificarán dentro de la red de chats. El más característico es su "nick" o pseudónimo, el nombre bajo el cual será conocido en todos los canales en los que intervenga, o esté de simple oyente (vidente). Debido a que sólo puede haber una persona por nick en un mismo momento, y debido a que en las redes de IRC con mayores características se puede "registrar" o reservar, encontraremos que los primeros nicks que nos vengan a la cabeza pueden ya estar empleados por otras personas, sobre todo en redes internacionales donde se pueden reunir más de cincuenta mil usuarios simultáneamente.

2.1.4.4 P2P

Los programas de transferencia de archivos han ido creciendo y proliferando en Internet. El eMule ha sido uno de los más demandados y conocidos por los internautas, que estaban realizando Peer to Peer y posiblemente ni lo sabían.

Además del eMule, cabe destacar otros como el Kazza o el eDonkey, que también se hicieron fuertes hace unos años.

Peer to Peer es la voz inglesa del P2P, que significa de igual a igual. Se trata de un método de intercambio de archivos, ya sean aplicaciones, programas, fotos o vídeos. Estos intercambios se dan entre dos o más usuarios. Es decir, el P2P conecta los ordenadores directamente, por lo que un usuario puede conectarse al ordenador de otro, siempre y cuando ambos tengan el P2P. Para poder realizar la conexión entre dos usuarios, hace falta que ambos estén conectados a Internet y no necesitan ningún tipo de intermediario.

El origen del intercambio de archivos fue Arpanet, en 1969. En la actualidad, el término Peer to Peer se ha especializado un poco, y se refiere principalmente al intercambio de archivos del disco duro utilizando Internet.

La principal ventaja que presenta Peer to Peer es la creación de grandes bases de datos de manera gratuita, ya que todos los ordenadores conectados en línea pueden descargarse archivos de otros ordenadores también conectados. Con el aumento de la velocidad de conexión de Internet, propiciada por la instalación del ADSL, los programas de intercambio de archivos y la frecuencia de este tipo de operaciones aumenta de forma considerable. La calidad del ADSL es fundamental.

2.1.4.5 Sindicación

La Sindicación de Contenidos ha ganado el conocimiento del gran público gracias al explosivo fenómeno de los weblogs (universalmente conocidos como blogs), al punto que muchos creen que es una tecnología nativa de la "blogosfera". Muy por el contrario, la sindicación es bastante anterior a estos tiempos de fama.

Tal como entonces, hoy en día se denomina Sindicación a la distribución masiva de contenidos en la web a través de un tipo especial de archivo XML denominado feed , accesible mediante programas Agregadores de feeds.

La Sindicación de Contenidos

Originalmente desarrollada por Netscape, participó del fallido intento de popularizar la distribución de contenidos (generalmente noticias) a través de canales temáticos. Este método de distribución se denominó "tecnología push" ya que la información no era pedida sino enviada (empujada) al usuario receptor.

El caso es que el mercado todavía no estaba maduro para éste concepto realmente innovador, por lo que se dejó a la sindicación de lado hasta mejor oportunidad.

Tal como entonces, hoy en día se denomina Sindicación a la distribución masiva de contenidos en la web. En rigor, a partir de la inclusión de algún nuevo contenido en un sitio, lo que se distribuye es una lista de enlaces junto con cierta cantidad de información adicional o metadata.

Los enlaces apuntarán a esos nuevos contenidos y la información adicional permitirá a los receptores evaluar si los contenidos son de su interés, en cuyo caso accederá a la versión completa simplemente siguiendo el enlace.

Los primeros sindicadores de contenido en línea fueron mega sitios de la magnitud de Yahoo y Excite. Su propuesta era muy clara: que sus visitantes pudieran acceder a información de orígenes muy diversos desde un lugar único.

Durante un tiempo, la sindicación resultó demasiado cara y trabajosa ya que se realizaba en base a la recuperación del título de cada página y la revisión de todo el HTML (que está concebido para mostrar contenidos pero no para organizarlos) para detectar los encabezados y enlaces para luego categorizarlos. Semejante tarea no estaba al alcance de cualquiera.

La gran novedad para la sindicación surgió de la utilización de archivos XML.

Los archivos RSS

Un archivo RSS es la descripción estructural de un sitio web en formato XML.
RSS es un lenguaje surgido de la aplicación del metalenguaje XML. Por lo tanto, un archivo RSS no será más que un documento de texto compuesto por etiquetas acotadas entre los símbolos de mayor y menor, similares a las utilizadas en el XHTML. El término RSS corresponde a Rich Site Summary o Really Simple Syndication.

Es interesante destacar que se trata de un formato que no está concebido para su visualización (como el HTML) sino para la interacción entre computadoras, ofreciendo la información en un formato estandarizado.
Para que este proceso resulte posible, un sitio web debe generar un feed o canal (el archivo RSS) que permanecerá alojado en el servidor tal como los demás archivos que lo componen.

Una vez que el feed está disponible, otros sistemas podrán accederlo y así enterarse de los nuevos contenidos que el sitio ofrece.
Hoy en día los sitios que permiten la creación y mantenimiento de blogs personales como Blogger y las aplicaciones que lo facilitan en cualquier dominio como WordPress han automatizado la generación de feeds, por lo que los usuarios solo deben manejar sus contenidos.

Sin demasiado misterio, los contenidos estarán entonces sindicados.

Para leer los feeds o canales RSS es necesario utilizar un tipo de programa denominado genéricamente agregador.

Los Lectores o Agregadores de feeds

Los archivos RSS, a diferencia de los XHTML, no son interpretados por los navegadores web y al abrirlos lo que hacen es mostrar en código XML que los compone.

Para visualizar directamente un feed es necesario utilizar un programa lector o agregador de feeds. Hay distintos tipos de agregadores.
Los basados en web (usualmente denominados Portales) permiten la visualización en una página web. Un ejemplo típico de este tipo de agregador es el ya mencionado Yahoo con su agregador MiYahoo! o el agregador de Bloglines. Otros agregadores están integrados a clientes de correo o son clientes RSS exclusivamente.

Los agregadores ofrecen variedad de prestaciones especiales, tales como la inclusión de varios feeds relacionados en una única vista, el ocultamiento de entradas que ya han sido leídas y la categorización de feeds en áreas temáticas.

¿Para qué sindicar?

En primera instancia, los visitantes agradecerán poder ver un sitio sin la necesidad de visitarlo. Esto, que en principio aparece como conspirando contra la "visibilidad" del sitio, es en realidad una estrategia muy interesante para incrementar y fidelizar visitantes.

Aquellos interesados en un tema en particular estarán siempre al tanto, a través de sus agregadores, de la aparición de nuevos contenidos y tendrán esos contenidos a un click de distancia. Este mecanismo reemplaza la tediosa visita a sitios de nuestro interés a la espera de encontrar alguna novedad.

Probablemente, el punto más importante a destacar es que la Sindicación en modo alguno es un fenómeno propio de los Blogs, así como tampoco es privativa de los sitios de noticias.

Periodismo Digital

Temas

lunes, 25 de julio de 2011

2. El Ciberespacio como fuente de informació

No hay comentarios:

Publicar un comentario