¿Qué es la determinación de contenido?

La determinación del contenido ocurre cuando una persona, grupo o programa decide qué información debe incluirse o excluirse dentro de un documento o texto. Está relacionado con los conceptos que rodean la estructuración de documentos. También está relacionado con la generación del lenguaje natural y la lingüística computacional. Cada área de estudio utiliza la determinación de contenido para examinar cómo se elige la información.

Al considerar qué incluir en un documento o texto, el compilador habrá realizado su investigación o se le habrán dado todos los datos disponibles. La determinación de contenido cubre las formas en que esta información se reduce al documento final. Esto se hace determinando cuál es el ángulo u objetivo del texto y qué información dentro del texto es relevante para esto.

La segunda consideración de la determinación del contenido es su estilo. Esto tiende a depender de la naturaleza de la audiencia destinataria. El intelecto y la familiaridad de la audiencia con el tema alterarán la densidad léxica y la complejidad de la información que se imparte. Los académicos tenderán a producir textos más densos que las revistas de chismes, por ejemplo. Otras consideraciones incluyen el tamaño del formato, ya sea un libro, un artículo o un mensaje de texto.

Cada estado de determinación de contenido lo realiza un ser humano. Está el investigador y el escritor, que a menudo, pero no siempre, son la misma persona, y luego el editor o los editores. Cada nivel tiene una opinión sobre qué contenido es relevante para el objetivo del texto. Los lingüistas informáticos y los ingenieros informáticos han estado buscando formas de reproducir este sistema utilizando programas informáticos en lugar de depender de los humanos.

Hay tres técnicas computacionales empleadas por las computadoras con respecto a la determinación del contenido. La ‘técnica del esquema’ se basa en el examen de textos escritos. Utiliza los textos examinados previamente como base para determinar qué información incluir en el texto que se está produciendo. El método «estadístico» determina automáticamente el contenido basándose en una gran cantidad de estadísticas generales. El ‘razonamiento explícito’ utiliza inteligencia artificial (IA) para examinar y filtrar la información.

El objetivo general de la determinación de contenido es comprender cómo se producen los documentos para que puedan reproducirse mediante computadoras. El resultado de tal éxito será una computadora capaz de recibir datos, filtrarlos y producir resúmenes de la información más importante. La computadora basará dichos documentos no solo en la información, sino también en los objetivos del texto que se está produciendo. En la línea de la teoría de la sala de China, esto puede significar que la computadora es capaz de comprender los datos en lugar de poder replicarlos y calcularlos.