Resumo As instituições federais de ensino do Brasil geram e publicam uma grande quantidade de documentos eletrônicos para as mais diversas atividades realizadas. Existem vários tipos de documentos, cada um com uma finalidade e, dentre eles, as portarias são utilizadas para, entre outras coisas, oficializar atos administrativos que definem competências e estabelecem normas e procedimentos. Para exemplificar, apenas no ano de 2019 o Instituto Federal Fluminense publicou cerca de 2500 portarias e essas, assim como os outros tipos de documentos oficiais, são publicadas em formato de documento de texto simples, sem qualquer tipo de estruturação do conteúdo, o que impossibilita a realização de consultas refinadas baseadas no conteúdo descrito. Para permitir a estruturação do conteúdo, a Web Semântica fornece um conjunto de tecnologias e padrões para representação formal de informações relacionadas a determinado domínio de conhecimento. Essa representação formal é baseada em um modelo chamado ontologia, que permite descrever objetos e propriedades do domínio de conhecimento, além de possibilitar a inferência de novos conhecimentos com base em axiomas pré-estabelecidos. Este artigo apresenta o desenvolvimento e a validação de uma ontologia para descrever as portarias publicadas por instituições federais de ensino, a fim de possibilitar a estruturação do conhecimento contido dentro desses documentos e, consequentemente, permitir o uso dessas informações estruturadas para a realização de pesquisas precisas mais rebuscadas. É esperado que este trabalho forneça uma base para o desenvolvimento de novas ontologias que possibilitem a descrição dos demais tipos de documentos publicados por instituições públicas de ensino.
Abstract Federal educational institutions in Brazil generate and publish a large number of electronic documents for most of the activities performed. There are several kinds of documents, each one with a purpose, and, among these kinds, ordinances are used to formalize administrative acts that define competencies and establish rules and procedures, among other finalities. To exemplify, in 2019, the Fluminense Federal Institute published around 2500 ordinances and these, as well as the other kinds of official documents, are published in plain text format, without any type of content structuring, which makes it impossible to perform refined queries based on the described content. To allow content structuring, the Semantic Web provides a set of technologies and standards necessary for representing information related to a given domain of knowledge. This formal representation is defined as ontology and it allows to describe objects and properties of a domain of knowledge, in addition to enabling inference of new knowledge based on pre-established axioms. This paper presents the development and validation of an ontology to describe ordinances published by federal educational institutions, in order to enable the structuring of the knowledge contained within these documents and, thus, to allow the use of this structured information to perform refined searches. It is also expected that this work provides a basis for the development of new ontologies, enabling descriptions of the other kinds of documents published by public educational institutions.