Is Counter-Strike Source a good game?

Guía de Fuentes de Contenido en SharePoint

02/11/2012

Valoración: 4.31 (1242 votos)

En el vasto universo de SharePoint, la capacidad de encontrar información de manera rápida y precisa es el pilar fundamental de una plataforma exitosa. Imagina que el sistema de búsqueda es un equipo de exploradores de élite; para que su misión sea un éxito, necesitan un mapa claro, órdenes precisas y un calendario de operaciones. Aquí es donde entra en juego la fuente de contenido (Content Source). No es simplemente una opción en un menú; es el cerebro estratégico detrás del rastreo, el conjunto de reglas que le dice a SharePoint qué contenido indexar, cuándo hacerlo y cómo debe proceder. Dominar la configuración de las fuentes de contenido es esencial para cualquier administrador que busque optimizar la experiencia de búsqueda y garantizar que la información valiosa nunca se pierda en el abismo digital.

What is a content source?
A content source is a set of options that you use to specify what, when, and how to crawl. When a Search service application is created, a content source named "Local SharePoint sites" is automatically created and configured for crawling all SharePoint Server sites in the local server farm.
Índice de Contenido

¿Qué es Exactamente una Fuente de Contenido?

Una fuente de contenido es un conjunto de opciones de configuración que define un repositorio de contenido que debe ser rastreado e incluido en el índice de búsqueda. Piénsalo como un plan de misión para el rastreador de búsqueda de SharePoint. Este plan responde a tres preguntas cruciales:

  • ¿Qué rastrear? Se especifica a través de las "Direcciones de Inicio" (Start Addresses). Estas son las URLs o rutas que actúan como punto de partida para el rastreador. Puede ser un sitio de SharePoint, un recurso compartido de archivos, un sitio web externo, etc.
  • ¿Cuándo rastrear? Se define mediante los "Programas de Rastreo" (Crawl Schedules). Puedes establecer diferentes horarios para rastreos completos, que revisan todo el contenido, y rastreos incrementales, que solo buscan cambios desde la última vez.
  • ¿Cómo rastrear? Incluye configuraciones adicionales como el tipo de contenido, las reglas de rastreo para incluir o excluir ciertos patrones de URL y la prioridad de la fuente.

Cuando se crea una nueva aplicación de servicio de búsqueda, SharePoint es proactivo y genera automáticamente una fuente de contenido inicial llamada "Sitios locales de SharePoint". Esta fuente está preconfigurada para rastrear todos los sitios de SharePoint dentro de la granja de servidores local, asegurando que el contenido interno sea localizable desde el primer día. Sin embargo, el verdadero poder se desata cuando creas fuentes de contenido personalizadas para abarcar todos los repositorios de información de tu organización.

Creando tu Propia Fuente de Contenido: Guía Paso a Paso

Crear una nueva fuente de contenido es un proceso metódico que te otorga un control granular sobre el índice de búsqueda. Antes de empezar, asegúrate de que la cuenta de usuario que estás utilizando tiene permisos de administrador para la aplicación de servicio de búsqueda correspondiente.

Paso 1: Navegar al Panel de Administración

  1. Accede a la página de Administración Central de SharePoint.
  2. Dirígete a Administración de Aplicaciones y haz clic en Administrar aplicaciones de servicio.
  3. Localiza y selecciona tu aplicación de servicio de búsqueda en la lista.
  4. En la página de Administración de Búsqueda, bajo la sección Rastreo, haz clic en Orígenes de contenido.

Paso 2: Iniciar la Creación

En la página "Administrar orígenes de contenido", verás la fuente por defecto. Para crear una nueva, haz clic en "Nuevo origen de contenido".

Paso 3: Configuración Esencial

Ahora te encontrarás en la página "Agregar origen de contenido", donde definirás los parámetros clave:

  • Nombre: Asigna un nombre descriptivo y único. Por ejemplo, "Intranet de Marketing" o "Recursos Compartidos de Finanzas".
  • Tipo de Origen de Contenido: Selecciona el tipo de contenido que vas a rastrear. Las opciones comunes incluyen Sitios de SharePoint, Sitios web, Recursos compartidos de archivos, etc.
  • Direcciones de Inicio: Este es uno de los campos más importantes. Introduce las URLs o rutas de inicio, una por línea. El rastreador comenzará su trabajo desde estos puntos. Por ejemplo: https://marketing.empresa.com o file://servidor/documentos.
  • Configuración de Rastreo: Elige el comportamiento de rastreo deseado. Por ejemplo, puedes decidir si rastrear subdominios o limitar la profundidad de las páginas.

Paso 4: Programar la Misión (Rastreos)

La programación es vital para mantener el índice actualizado sin sobrecargar los servidores.

  • Rastreo Completo: Un rastreo completo indexa todo el contenido especificado en las direcciones de inicio, sin importar si ha cambiado o no. Es intensivo en recursos y generalmente se programa con menos frecuencia (semanal o mensualmente). Puedes seleccionar una programación predefinida o crear una nueva.
  • Rastreo Incremental: Un rastreo incremental es mucho más eficiente. Solo rastrea el contenido que ha cambiado desde el último rastreo (completo o incremental). Se recomienda programarlo con mucha más frecuencia (diaria o incluso cada pocas horas).
  • Rastreo Continuo: Para las fuentes de tipo "Sitios de SharePoint", tienes la opción de habilitar rastreos continuos. Este modo busca cambios en intervalos muy cortos (por defecto, cada 15 minutos), manteniendo el índice casi en tiempo real.

Paso 5: Establecer la Prioridad

Finalmente, en "Prioridad del Origen de Contenido", puedes elegir entre "Normal" o "Alta". Si varias fuentes de contenido están programadas para ejecutarse al mismo tiempo, el sistema dará preferencia a las que tengan prioridad alta. Esto es útil para asegurar que el contenido más crítico se indexe primero.

Una vez completados todos los campos, haz clic en "Aceptar" para guardar tu nueva fuente de contenido. ¡Un detalle crucial a recordar es que cualquier cambio posterior en una fuente de contenido existente requerirá un nuevo rastreo completo para que las modificaciones surtan efecto!

Modificar y Eliminar: Manteniendo el Control del Rastreo

La administración de las fuentes de contenido no termina con su creación. Con el tiempo, las necesidades de la organización cambian, y tus configuraciones de rastreo deben adaptarse.

Editar una Fuente de Contenido

Puedes modificar una fuente existente para ajustar su programación, cambiar las direcciones de inicio, actualizar su nombre o ajustar su prioridad. Para hacerlo, simplemente ve a la página "Administrar orígenes de contenido", haz clic en la flecha junto al nombre de la fuente que deseas cambiar y selecciona "Editar".

Importante: Hay dos elementos que no puedes cambiar una vez que la fuente ha sido creada: el "Tipo de Origen de Contenido" y la "Configuración de Rastreo". Si necesitas modificar estos aspectos, deberás eliminar la fuente y crear una nueva.

Eliminar una Fuente de Contenido

Si un repositorio de contenido ya no es relevante o va a ser retirado, puedes eliminar su fuente de contenido para evitar que el rastreador siga intentando acceder a él. El proceso es similar: en la página de administración, haz clic en la flecha junto a la fuente y selecciona "Eliminar". El sistema te pedirá una confirmación antes de borrarla permanentemente.

Tabla Comparativa: Tipos de Rastreo

Para entender mejor las diferencias y cuándo usar cada tipo de rastreo, aquí tienes una tabla comparativa:

Tipo de Rastreo¿Qué Hace?¿Cuándo Usarlo?Intensidad de Recursos
Rastreo CompletoRastrea todo el contenido de la fuente, independientemente de los cambios.Después de crear o modificar una fuente; para mantenimiento periódico (ej. semanal).Alta
Rastreo IncrementalRastrea solo el contenido nuevo o modificado desde el último rastreo.Para actualizaciones regulares y frecuentes (ej. diario o cada pocas horas).Baja / Media
Rastreo ContinuoDetecta y rastrea cambios en intervalos muy cortos (solo para sitios de SharePoint).Cuando se necesita una actualización del índice casi en tiempo real para contenido crítico.Media (Constante)

Novedad para Expertos: Configuración del Protocolo HTTP

Con la llegada de la actualización de características 23H2 para SharePoint Server Subscription Edition, los administradores más avanzados ahora tienen una nueva herramienta en su arsenal. Es posible configurar la versión del protocolo HTTP que el rastreador de búsqueda utilizará para acceder a las fuentes de contenido.

Por defecto, el rastreador utiliza HTTP 1.1, pero ahora puedes forzarlo a usar HTTP 1.0. ¿Por qué querrías hacer esto? Principalmente por motivos de compatibilidad con servidores web más antiguos o sistemas específicos que puedan no funcionar correctamente con las características más modernas de HTTP 1.1.

Esta configuración no se encuentra en la interfaz de usuario. Debe realizarse a través de PowerShell, utilizando los cmdlets New-SPEnterpriseSearchCrawlContentSource o Set-SPEnterpriseSearchCrawlContentSource con el parámetro -HttpProtocol.

Preguntas Frecuentes (FAQ)

¿Por qué necesitaría crear una fuente de contenido adicional si ya existe una por defecto?

La fuente por defecto es excelente para el contenido interno de SharePoint, pero las organizaciones suelen tener información en muchos otros lugares. Deberías crear fuentes adicionales para indexar recursos compartidos de archivos, sitios web públicos de la empresa, bases de datos de Line-of-Business (LOB) o cualquier otro repositorio de contenido al que los usuarios necesiten acceder a través de la búsqueda.

¿Qué sucede si cometo un error al configurar las direcciones de inicio?

Si una dirección de inicio es incorrecta o inaccesible, el rastreador registrará errores en los registros de rastreo y ese contenido no será indexado. Si la dirección es demasiado amplia, podrías terminar indexando contenido irrelevante. Es crucial verificar las URLs y permisos antes de iniciar un rastreo completo.

¿Cambiar solo el nombre de una fuente de contenido requiere un rastreo completo?

Sí. La documentación indica que cualquier cambio ("Changing a content source") en una fuente de contenido existente activa la necesidad de un rastreo completo para que el sistema de búsqueda procese y aplique correctamente la nueva configuración en su totalidad.

¿Es obligatorio configurar un rastreo incremental?

No es técnicamente obligatorio, pero es altamente recomendable por eficiencia. Ejecutar solo rastreos completos es muy ineficiente y consume muchos recursos. La combinación de rastreos completos periódicos con rastreos incrementales frecuentes es la práctica recomendada para un índice de búsqueda saludable y actualizado.

Si quieres conocer otros artículos parecidos a Guía de Fuentes de Contenido en SharePoint puedes visitar la categoría Guías.

Subir